Đăng ký Đăng nhập
Trang chủ Xây dựng công cụ dự đoán chứng khoán ứng dụng datamining...

Tài liệu Xây dựng công cụ dự đoán chứng khoán ứng dụng datamining

.PDF
45
515
135

Mô tả:

1 LỜI MỞ ĐẦU LÝ DO CHỌN ĐỀ TÀI Xu thế hội nhập kinh tế quốc tế và khu vực với sự ra đời của tổ chức thƣơng mại thế giới (WTO), liên minh Châu Âu, các khối thị trƣờng chung; đòi hỏi các quốc gia phải thúc đẩy phát triển kinh tế với tốc độ và hiệu quả cao. Thực tế phát triển kinh tế ở các quốc gia trên thế giới đã khẳng định vai trò quan trọng của thị trƣờng chứng khoán (TTCK) phát triển kinh tế và Việt Nam một nƣớc đang trên đà nƣớc đang phát triển cũng và đang hoạt động thị trƣờng chứng với vai trò quan trọng trong việc phát triển kinh tế. Ở Việt Nam, kể từ khi hoạt động chính thức vào năm 28/7/2000, TTCK đã mang lại cơ hội cũng nhƣ rủi ro lớn cho nhà đầu tƣ. Trong những ngày đầu các nhà đầu tƣ hầu hết không hiểu cách thức chứng khoán hoạt động và hƣớng phát triển, hầu hết đều đầu tƣ theo tâm lí đám đông, hoặc bị ảnh hƣởng bởi những tin đồn, dẫn đến vô số trƣờng hợp đáng tiếc, nhiều cá nhân công ty lâm vào cảnh trắng tay vì thiếu kiến thức đầu tƣ. Những năm sau này chứng khoán phát triển,nhà đầu tƣ cũng am hiểu hơn và dần chuyên nghiệp hơn trong quá trình đầu tƣ, kéo theo đó sự phát triển của bộ môn dự đoán chứng khoán ra đời giúp cho nhà đầu tƣ có quyết định sáng suốt hơn trong đầu tƣ, tiêu biểu là ngành phân tích kĩ thuật là một nhánh trong bộ môn dự đoán chứng khoán. Trong xã hội thông tin nói chung và chứng khoán nói riêng ai nắm đƣợc nhiều thông tin đều có lợi, vì vậy ngoài những cách thức phân tích truyền thống nhƣ định giá công ty,... thì hình thức nữa là dựa vào dữ kiện lịch sử để dự đoán bƣớc giá tiếp theo của cổ phiếu[11], hình thức này tốn ít chi phí và nhanh chóng giúp nhà đầu tƣ có quyết định nhanh nhất. Điển hình là những phần mềm nhƣ Metastock, Amibroker, VietStock…, các phần mềm này phân tích dữ liệu bằng các thuật toán của bộ môn phân tích kĩ thuật và đƣợc thiết kế một cách chuyên nghiệp bởi các công ty lớn và có thu phí. Tuy nhiên, các phần mềm nhƣ MetaStock lại khó làm quen và sử dụng đòi hỏi kiến thức lớn về phân tích kĩ thuật, hơn nữa các chƣơng trình này đòi hỏi phí sử dụng rất cao. Vì vậy nhóm thực hiện nhận thấy việc thiết kế và xây dựng phần mềm với tiêu chí đơn giản dễ sử dụng những tính năng hiệu quả là cần thiết 2 MỤC TIÊU NGHIÊN CỨU Xây dựng công cụ hỗ trợ dự đoán và phân tích chứng khoán áp dụng cho TTCK tại Việt Nam. Đáp ứng các nhu cầu cho các nhà đầu tƣ những cơ sở phân tích dữ liệu chứng khoán: Dò tìm và khai phá các quy luật tiềm ẩn về sự biến động giá chứng khoán. Đƣa ra các biểu đồ dự báo giá cổ phiếu cho các nhà đầu tƣ nhà đầu tƣ. Tìm ra những tƣơng tác giữa các thành phần trong dữ liệu chứng khoán lịch sử để đƣa ra quyết định. PHƢƠNG PHÁP NGHIÊN CỨU Bƣớc 1: Khảo sát thực tế hiện trạng TTCK tại Việt Nam tìm ra các nhu cầu mà các nhà đầu tƣ chứng khoán cần. Bƣớc 2: Khảo sát, tìm hiểu và thu thập đầy đủ thông tin về các vấn đề cần giải quyết bao gồm các phƣơng pháp và các phần mềm liên quan. Bƣớc 3: Tận dụng các dữ liệu đã có sẵn từ nguồn cơ sở dữ liệu (CSDL) chứng khoán để xây dựng CSDL sử dụng cho chƣơng trình. Bƣớc 4: Lựa chọn và kế thừa các phƣơng pháp phù hợp với nội dung cần giải quyết. Bƣớc 5: Lập trình xử lý tạo ra ứng dụng. Công cụ sử dụng :  Ngôn ngữ lập trình: C#  Thiết kế, phát triển phần mềm: Ms Visual Studio 2005  Thiết kế CSDL, chạy thuật toán khai phá dữ liệu (KPDL): Ms SQL Server 2005 PHẠM VI NGHIÊN CỨU Nội dung nghiên cứu của đề tài tập trung giải quyết các vấn đề chính sau:  Tổng quan về các phƣơng pháp phân tích, dự báo chứng khoán hiện nay  Cơ sở lý thuyết tổng quan về KPDL – Data Mining.  Xây dựng phần mềm hỗ trợ phân tích, dự báo chứng khoán với ứng dụng KPDL, sử dụng ba phƣơng pháp chính:  Khai phá luật kết hợp (Association Rule Discovery) 3  Chuỗi thời gian (Time serial)  Cây quyết định (Decision Tree) Nhóm thực hiện đề tài giới hạn chƣơng trình gồm 2 phần:  Phần xử lý dữ liệu bằng thuật toán trên server  Lọc kết quả trên client cho ngƣời dùng. TÍNH MỚI CỦA ĐỀ TÀI Xây dựng một công cụ hỗ trợ dự đoán chứng khoán bằng cách áp dụng các phƣơng pháp KPDL (Data Mining) để tìm ra qui luật biến động giá, dự báo giá cổ phiếu tƣơng lai. KẾT CẤU CỦA ĐỀ TÀI Luận văn này đƣợc trình bày thành ba phần chính: phần mở đầu, phần nội dung và phần kết luận LỜI MỞ ĐẦU Giới thiệu sơ lƣợc về lý do chọn đề tài, lịch sử nghiên cứu, mục tiêu nghiên cứu, đối tƣợng và phạm vi nghiên cứu, phƣơng pháp nghiên cứu, những đóng góp và những vấn đề tồn tại của đề tài để từ đó đem lại cho mọi ngƣời một cái nhìn tổng quan nhất về đề tài. CHƢƠNG 1: THỰC TRẠNG Nêu những thực trạng các phần mềm hiện có trên thị trƣờng, ứng dụng vào các vấn đề còn tồn tại. từ đó đƣa ra các giải pháp cần thực hiện. CHƢƠNG 2: CƠ SỞ LÝ LUẬN Trình bày về các khái niệm chứng khoán, cách thức qui trình tham gia giao dịch chứng khoán, các phƣơng pháp phân tích TTCK đáp ứng nhu cầu cho nhà đầu tƣ đánh giá và quyết định tham gia giao dịch. Trình bày các khái niệm KPDL, các ứng dụng, qui trình xử lý khai thác dữ liệu, các lợi thế và thách thức đối với KPDL. Từ các phƣơng pháp khai thác dữ liệu khác nhau và chọn các phƣơng pháp phù hợp với dự liệu chứng khoán mà chúng ta cần tìm ra qui luật gì. Từ đó phân tích bài toán chứng khoán dựa vào phƣơng pháp KPDL để xây dựng công cụ hỗ trợ dự đoán chứng khoán. CHƢƠNG 3: GIẢI PHÁP HOÀN THIỆN 4 Trình bày các cách thức thu thập dữ liệu chứng khoán, thành phần và ý nghĩa của dữ liệu, xử lý dữ liệu thu thập đƣợc và lƣu trữ CSDL. Trình bày thành phần dữ liệu, các sơ đồ chức năng chƣơng trình, các mô hình thành phần dữ liệu chính. Giới thiệu các chức năng của chƣơng trình và đánh giá nhận xét một vài thử nghiệm KẾT LUẬN Đƣa ra các nhận xét đánh giá, hƣớng phát triển và kết luận chung của đề tài. KẾT QUẢ ĐẠT ĐƢỢC Đã xây dựng đƣợc đƣợc một chƣơng trình ứng dụng KPDL hỗ trợ dự đoán chứng khoán đáp ứng một số yêu cầu: Giao diện đơn giản dễ sử dụng, ngƣời dùng có thể dễ dàng thấy đƣợc kết quả của chƣơng trình bằng vài thao tác đơn giản. Tạo ra các luật tƣơng tác giữa các cổ phiếu đƣa ra sự ảnh hƣởng biến động đối với các cổ phiếu cùng tham gia giao dịch , bằng biểu đồ dự đoán giá cổ phiếu ngƣời dùng có thể thấy đƣợc lịch sử cũng nhƣ dự đoán tƣơng lai bƣớc giá của các cổ phiếu. 5 CHƢƠNG 1 : THỰC TRẠNG 1.1 TÌNH HÌNH CHUNG Kể từ TTCK Việt Nam bắt đầu hoạt động và cho tới nay sự phát triển TTCK khá mạnh. Nhiều cá nhân tổ chức có xu hƣớng tham gia đầu tƣ chứng khoán. 1.2. THỰC TRẠNG PHẦN MỀM ĐÃ CÓ 1.2.1, Các phần mềm trong nƣớc VietstockTrader VietstockTrader là chƣơng trình do công ty cổ phần Tài Việt xây dựng và phát triển, chƣơng trình cung cấp cho ngƣời dùng nhiều tính năng nhƣ:  Trader : nó bao gồm các thông tin liên quan để hỗ trợ quá trình giao dịch  Fundamental: gồm các thông tin liên quan đến doanh nghiệp niêm yết và thị trƣờng  News: gồm tin tức TTCK trong và ngoài nƣớc.  Research: các bài báo cáo phân tích, nhận định thị trƣờng của Vietstock Hình 1.1: Giao diện phần mềm VietstockTrader 6 1.2.2, Các phần mềm nƣớc ngoài 1.2.2.1, Amibroker Là một chƣơng trình dự đoán phân tích chứng khoán tích hợp các tính năng trên một giao diện duy nhất nên sử dụng tiện lợi và nhanh chóng, hỗ trợ giao diện tab nên có thể thực hiện nhiều kiểu phân tích cho nhiều cổ phiếu một cách dễ dàng Hình 1.2: Giao diện phần mềm AmiBroker 1.2.2.2, Metastock Metastock là phần mềm hiện đang rất phổ biến cho các nhà đầu tƣ, chƣơng trình có nhiều tính năng khá phong phú, nguồn dữ liệu đƣợc cập nhật online dễ dàng từ các website. Một số chức năng của Metastock:  Vẽ biểu đồ và các chỉ số  Chức năng Explorer: tìm những cổ phiếu có tín hiệu mua hay bán  Chức năng Test System: kiểm tra tính hợp lí của hệ thống, công thức, tín hiệu mua và bán của cổ phiếu  Chức năng Inditor: tạo công thức phân tích của mỗi ngƣời  Chức năng Expert: đƣa ra lời khuyên mua hay bán cổ phiếu.... 7 Hình 1.3: Giao diện phần mềm MetaStock 1.2.3, Ƣu, nhƣợc điểm các chƣơng trình trên Các phần trên đa số đều có rất nhiều tính năng đa dạng về hỗ trợ dự báo chứng khoán, dữ liệu chứng khoán hằng ngày đƣợc cập nhật tự động và đã đƣợc xử lý để sử dụng. Do có nhiều tính năng phức tạp nên ngƣời dùng phải bỏ một khoảng thời gian để tìm hiểu sử dụng, ngoài ra các phần mềm này để đƣợc sử dụng hết các tính năng nhà đầu tƣ phải trả chi phí khá cao. 1.3 KẾT LUẬN CHƢƠNG 1 Từ thực trạng trên cho thấy những phần mềm hiện nay có nhiều tính năng rất tốt trong việc dự đoán phân tích chứng khoán, tuy nhiên việc sử dụng những phần mềm này đối với những nhà đầu tƣ mới gặp nhiều khó khăn. Việc nghiên cứu đề tài này nhằm xây dựng một công cụ hỗ trợ dự báo chứng khoán đơn giản thân thiện phía ngƣời dùng. 8 CHƢƠNG 2: CƠ SỞ LÝ LUẬN 2.1. TỔNG QUAN THỊ TRƢỜNG CHỨNG KHOÁN VÀ CÁC PHƢƠNG PHÁP PHÂN TÍCH 2.1.1, Khái niệm chứng khoán[1] Là thuật ngữ về chứng chỉ hoặc bút toán ghi sổ, xác nhận quyền lợi ích hợp pháp của ngƣời sở hữu chứng khoán đối với vốn hoặc tài sản của tổ chức phát hành. Các loại chứng khoán:  Cổ phiếu: Là một loại chứng khoán đƣợc phát hành dƣới dạng chứng chỉ hoặc bút toán ghi sổ, xác nhận số vốn , quyền và lợi ích hợp pháp.  Đặc điểm: o Có mệnh giá o Không quy định lãi suất o Là chứng khoán vĩnh viễn o Cổ phiếu gồm : Cổ phiếu ƣu đãi và cổ phiếu thông thƣờng  Trái phiếu: Là một loại chứng khoán, đƣợc phát hành dƣới hình thức chứng chỉ hoặc bút toán ghi sổ, xác nhận nghĩa vụ hoàn trả nợ đúng hạn cả vốn và lãi của chủ thể phát hành đối với ngƣời sở hữu chứng khoán.  Đặc điểm : o Có ấn định mệnh giá o Có thời hạn o Có quy định lãi suất và thời hạn trả lãi So sánh cổ phiếu, trái phiếu: So sánh Cổ phiếu Trái phiếu Tính chất Chứng khoán vốn vĩnh Chứng khoán nợ có thời Thời hạn viễn hạn hoàn vốn Quyền lợi Không hoàn vốn Ấn định lãi suất chỉ là Chủ thể phát hành Không ấn định lãi chủ nợ nhà nƣớc, doanh Quyền làm chủ nghiệp Huy động vốn tạm thời Bảng 2.1: So sánh cổ phiếu, trái phiếu 9 2.1.2, Tham gia thị trƣờng chứng khoán Hình 2.1: Các bước tham gia giao dịch TTCK  Bản cáo bạch : Khi phát hành chứng khoán ra công chúng, công ty phát hành phải công bố cho ngƣời mua chứng khoán những thông tin về bản thân công ty, nêu rõ những cam kết của công ty và những quyền lợi cơ bản của ngƣời mua chứng khoán... để trên cơ sở đó ngƣời đầu tƣ có thể ra quyết định đầu tƣ hay không. Tài liệu phục vụ cho mục đích đó gọi là bản cáo bạch hay bản công bố thông tin.  Chỉ số chứng khoán : Gồm có 2 chỉ số chính  Chỉ số Nasdaq 100: Nasdaq 100 (AMEX: QQQ)  Chỉ số trung bình DOW JONES (DJIA)  Giao dịch chứng khoán  Mua trực tiếp tại tổ chức phát hành (công ty): nhà đầu tƣ phải đăng ký mua và nộp tiền trực tiếp tại tổ chức phát hành chứng khoán. Hình thức này rất bất cập, nhất là về mặt địa lý  Mua thông qua trung gian: tức là mua thông qua các nhà đại lý hoặc bảo lãnh phát hành, thông thƣờng là các công ty chứng khoán 10 và các ngân hàng thƣơng mại. Nếu bạn mua chứng khoán của tổ chức phát hành chƣa niêm yết trên trung tâm giao dịch chứng khoán thì việc chuyển nhƣợng hoặc bán lại chứng khoán đó cho ngƣời khác hiện nay gặp nhiều khó khăn vì không dễ tìm đƣợc ngƣời mua và bạn cũng phải trực tiếp đến tổ chức phát hành (hoặc uỷ quyền) để thực hiện chuyển nhƣợng cho ngƣời mua. Hình 2.2: Quy trình giao dịch chứng khoán niêm yết tại trung tâm giao dịch  Thuật ngữ HOSE , HNX , VN Index , HASTC Index  HOSE (Ho Chi Minh Stock Exchange): là một đơn vị trực thuộc ủy ban chứng khoán nhà nƣớc và quản lý hệ thống giao dịch chứng khoán niêm yết của Việt Nam.  Vn-index là chỉ số giá cổ phiếu trong một thời gian nhất định (phiên giao dịch, ngày giao dịch) của các công ty niêm yết tại trung tâm này.  HNX (Hanoi Stock Exchange): đƣợc tổ chức nhằm mục đích đấu giá cổ phần cho các doanh nghiệp, đấu thầu trái phiếu chính phủ, tổ chức giao dịch chứng khoán theo cơ chế đăng ký giao dịch.  HASTC Index là chỉ số giá cổ phiếu trong một thời gian nhất định (phiên giao dịch, ngày giao dịch) của các công ty niêm yết tại trung tâm này. 11 2.1.3, Các phƣơng pháp phân tích chứng khoán 2.1.3.1, Phƣơng pháp phân tích cơ bản [10] Là phƣơng pháp phân tích cổ phiếu dựa vào các nhân tố mang tính chất nền tảng có tác động hoặc dẫn tới sự thay đổi giá cả của cổ phiếu nhằm chỉ ra giá trị nội tại (Intrinsic value) của cổ phiếu trên thị trƣờng. Các nhân tố cơ bản cần nghiên cứu bao gồm: phân tích thông tin cơ bản về công ty, phân tích báo cáo tài chính của công ty; phân tích hoạt động kinh doanh của công ty, phân tích ngành mà công ty đang hoạt động, và phân tích các điều kiện kinh tế vĩ mô ảnh hƣởng chung đến giá cả cổ phiếu. Sau khi nghiên cứu, nhà phân tích có nhiệm vụ phải chỉ ra đƣợc những dự đoán cho những chỉ tiêu quan trọng nhƣ thu nhập kỳ vọng, giá trị sổ sách trên mỗi cổ phiếu, giá trị hợp lý của cổ phiếu, các đánh giá quan trọng cũng nhƣ khuyến nghị mua hay bán cổ phiếu trên thị trƣờng. Cụ thể, các nhân tố cần chú trọng trong phân tích cơ bản về cổ phiếu là:  Hoạt động kinh doanh của công ty  Mục tiêu và nhiệm vụ của công ty  Khả năng lợi nhuận (hiện tại và ƣớc đoán)  Nhu cầu đối với sản phẩm và dịch vụ của công ty  Sức ép cạnh tranh và chính sách giá cả  Kết quả sản xuất kinh doanh theo thời gian  Kết quả sản xuất kinh doanh so sánh với công ty tƣơng tự và với thị trƣờng  Vị thế trong ngành  Chất lƣợng quản lý Ở góc độ tổng quát, phân tích cơ bản có thể đƣợc sử dụng theo phƣơng pháp phân tích từ nhân tố vĩ mô đến nhân tố vi mô có ảnh hƣởng đến cổ phiếu (thƣờng gọi là phƣơng pháp top-down) gồm 5 cấp độ nhƣ sau: 12  Phân tích các điều kiện kinh tế vĩ mô  Phân tích thị trƣờng tài chính - chứng khoán  Phân tích ngành mà công ty đang hoạt động  Phân tích công ty  Phân tích cổ phiếu Trong thực tế, tùy vào mục tiêu và khả năng phân tích mà nhà phân tích có thể sử dụng một trong năm mức độ phân tích nêu trên. Ví dụ, trong phân tích về công ty, ta có thể sử dụng phƣơng pháp phân tích phi tài chính, đó là đánh giá về bộ máy quản lý doanh nghiệp, về nguồn nhân lực, khả năng phát triển sản phẩm mới, thị trƣờng và thị phần, khả năng cạnh tranh... Cũng trong phân tích công ty, nhà phân tích có thể sử dụng cách tiếp cận thƣờng đƣợc gọi là phƣơng pháp SWOT, với việc xác định và đánh giá tập trung vào 4 khía cạnh sau của công ty:  Điểm mạnh (Strengths)  Điểm yếu (Weaknesses)  Cơ hội (Opportunities)  Thách thức (Threats) Một cách phân tích nhanh về cổ phiếu, nhà đầu tƣ có thể phân loại cổ phiếu thành 6 loại cơ bản dựa trên tính chất thu nhập mà nó mang lại là: cổ phiếu hàng đầu (blue-chips), cổ phiếu tăng trƣởng (ổn định và bùng nổ), cổ phiếu phòng vệ, cổ phiếu chu kỳ, cổ phiếu thời vụ. Riêng trong mức độ cốt lõi nhất và cũng khó khăn nhất là phân tích cổ phiếu, bản chất của phƣơng pháp phân tích cơ bản ở đây là việc định giá cổ phiếu nhằm dự đoán giá trị nội tại của cổ phiếu đó. Với mục tiêu này, thông thƣờng có 5 phƣơng pháp định giá cổ phiếu là:  Phƣơng pháp định giá dựa trên luồng cổ tức  Phƣơng pháp định giá dựa trên luồng tiền  Phƣơng pháp định giá dựa trên hệ số P/E  Phƣơng pháp dựa trên các hệ số tài chính  Phƣơng pháp định giá dựa trên tài sản ròng. 13 2.1.3.2, Phƣơng pháp phân tích kĩ thuật  Những khái niệm ban đầu về phân tích kĩ thuật Phân tích kỹ thuật là sự nghiên cứu biến động của thị trƣờng, chủ yếu thông qua việc sử dụng các đồ thị nhằm mục đích dự đoán các xu thế biến động của giá trong tƣơng lai.  Bốn điểm cơ bản về phân tích kỹ thuật:  Giá trị thị trƣờng của một chứng khoán đƣợc xác định duy nhất thông qua tác động qua lại giữa cung và cầu.  Cung và cầu chịu ảnh hƣởng, ở bất kì thời điểm nào, bởi hàng trăm những yếu tố, một số là ảnh hƣởng hợp lý, một số hầu nhƣ phi lý. Thông tin, ý kiến, tâm lý, dự đoán,…(có thể đúng, có thể sai,…) về tƣơng lai kết hợp và trộn lẫn với nhau và với những yếu tố cần thiết khác để tạo thành sự cân bằng chung của toàn thị trƣờng. Không một cá nhân nào có thể nắm lấy và định lƣợng những điều này mà thị trƣờng sẽ tự thực hiện.  Bỏ qua những dao động nhỏ thì giá nhìn chung sẽ vận động theo những xu thế giá chung của thị trƣờng, những xu thế này là ổn định trong một khoảng thời gian tƣơng đối dài.  Những thay đổi trong xu thế thị trƣờng thể hiện qua sự dịch chuyển của điểm cân bằng cung cầu dù là vì bất kì nguyên nhân nào đều có thể xác định sớm hơn hoặc muộn hơn thời điểm thị trƣờng biến động. Có 3 giả định làm cơ sở cho việc tiếp cận phân tích kỹ thuật:  Biến động thị trƣờng phản ánh tất cả  Giá dịch chuyển theo xu thế chung  Lịch sử sẽ tự lặp lại Biến động thị trƣờng phản ánh tất cả. Đây có thể coi là nền tảng của Phân tích kỹ thuật. Mọi lý thuyết, phân tích khác muốn đƣợc chấp nhận thì trƣớc tiên phải hiểu và chấp nhận giả định này. Các nhà Phân tích kỹ thuật cho rằng bất cứ yếu tố nào có khả năng ảnh hƣởng đến giá nhƣ tâm lý, chính trị hay các yếu tố tài 14 chính của doanh nghiệp, tổ chức. . . đều đƣợc phản ánh rõ trong giá thị trƣờng. Do đó có ngƣời cho rằng việc nghiên cứu biến động của giá là tất cả những gì ta cần và thực sự không thể phản đối lại ý kiến này. Trên cơ sở nhận thức chung về việc giá phản ánh những biến động trong cung, cầu. Các nhà Phân tích kỹ thuật chỉ ra rằng khi giá tăng dù vì bất kì lý do gì thì cầu phải vƣợt cung và thị trƣờng tăng giá. Chúng ta cũng đều biết và đồng ý rằng động lực chính của cung và cầu là những yếu tố kinh tế căn bản, còn đồ thị thì không tự nó làm cho thị trƣờng dịch chuyển lên hay xuống. Đồ thị chỉ có thể phản ánh tình hình thị trƣờng mà thôi. Giá vận động theo xu thế Khái niệm về xu thế là khái niệm vô cùng quan trọng trong phân tích kỹ thuật do đó cần hiểu kĩ về giả định này trƣớc khi muốn tìm hiểu sâu thêm về nó. Mục đích của việc xác lập đồ thị mô tả những biến động giá trên thị trƣờng là nhằm xác định đƣợc sớm những xu thế giá, từ đó sẽ tham gia giao dịch trên cơ sở những xu thế này. Trên thực tế những kĩ thuật ở đây đều mang tính lặp lại những xu thế giá có từ trƣớc tức là mục đích của phân tích kỹ thuật là nhằm xác định sự lặplại của những dạng biến động của giá đã xuất hiện trong quá khứ để có thể tận dụng kinh nghiệm và đƣa ra những quyết định phù hợp. Từ giả định này chúng ta còn có một hệ quả là “một xu thế giá đang vận động sẽ tiếp tục theo xu thế của nó và ít khi có đảo chiều”. Hệ quả này rút ra từ định luật 1 về sự vận động của Newton, do đó nó cách phát biểu khác nhƣ sau: "một xu thế đang vận động sẽ tiếp tục theo xu thế của nó cho đến khi nó đảo chiều”. Nhìn chung tất cả những nghiên cứu nhằm tiếp cận theo các xu thế đều nhằm để đi theo những xu thế giá hiện tại cho đến khi có dấu hiệu đảo chiều. Lịch sử sẽ tự lặp lại Phần lớn nội dung của phân tích kỹ thuật và việc nghiên cứu biến động thị trƣờng đều phải nhằm vào nghiên cứu tâm lý con ngƣời. Chẳng hạn nhƣ những mô hình giá, những mô hình này đã đƣợc xác định và chứng minh từ hơn 100 năm nay, chúng giống nhƣ những bức 15 tranh về đồ thị biến động giá. Những bức tranh này chỉ ra tâm lý của thị trƣờng đang là lên giá hay xuống giá. Việc áp dụng những mô hình này đã phát huy hiệu quả trong quá khứ và đƣợc giả định rằng sẽ vẫn tiếp tục có hiệu quả trong tƣơng lai bởi chúng dựa trên phân tích nghiên cứu tâm lý con ngƣời mà tâm lý con ngƣời thì thƣờng không thay đổi. Nhƣ thế giả định này có thể đƣợc phát biểu là : “Chìa khóa để nắm bắt tƣơng lai nằm trong việc nghiên cứu quá khứ” hay “tƣơng lai chỉ là sự lặp lại của quá khứ”  Các khái niệm và công cụ cơ bản sử dụng trong quá trình phân tích kỹ thuật Biểu đồ là công cụ đƣợc các nhà đầu tƣ chứng khoán lựa chọn để phân tích kỹ thuật. Có 3 loại biểu đồ đƣợc dùng phổ biến nhất là:  Biểu đồ dạng đƣờng (Line chart).  Biểu đồ dạng then chắn (Bar chart).  Biểu đồ dạng ống (Candlestick chart).  Biểu đồ dạng đƣờng (Line chart). Dạng biểu đồ này từ trƣớc tới nay thƣờng đƣợc sử dụng trên TTCK, và cũng là loại biểu đồ đƣợc dùng một cách phổ biến nhất trong các ngành khoa học khác dùng để mô phỏng các hiện tƣợng kinh tế và xã hội…và nó cũng là loại biểu đồ đƣợc con ngƣời dùng trong thời gian lâu dài nhất. Nhƣng hiện nay trên thị trƣờng chứng khoán do khoa học kỹ thuật phát triển, diễn biến của thị trƣờng chứng khoán ngày càng phức tạp cho nên loại biểu đồ này ngày càng ít đƣợc sử dụng nhất là trên các TTCK hiện đại. Hiện nay nó chủ yếu đƣợc sử dụng trên các thị trƣờng chứng khoán mới đi vào hoạt động trong thời gian ngắn, khớp lệnh theo phƣơng pháp khớp lệnh định kỳ theo từng phiên hoặc nhiều lần trong một phiên nhƣng mức độ giao dịch chƣa thể đạt đƣợc nhƣ TTCK dùng phƣơng pháp khớp lệnh liên tục.Ƣu điểm của loại biểu đồ này là dễ sử dụng, lý do chính là vì nó đƣợc sử dụng trên tất cả các thị trƣờng chứng khoán trên khắp thế giới từ trƣớc tới nay. Hiện nay loại biểu đồ này ít đƣợc sử dụng để phân tích 16 trên các TTCK hiện đại vì các TTCK hiện đại ngày nay thƣờng diễn biến khá phức tạp, mức độ dao động trong thời gian ngắn với độ lệch khá cao, nếu dùng loại biểu đồ này để phân tích thì thƣờng mang lại hiệu quả thấp trong phân tích.  Biểu đồ dạng then chắn (Bar chart) Trên các TTCK hiện đại trên thế giới hiện nay các chuyên viên phân tích thƣờng dùng loại biểu đồ này trong phân tích là chủ yếu lý do chính vì tính ƣu việt của nó đó là sự phản ánh rõ nét sự biến động của giá chứng khoán. Hai kí tự mà dạng biểu đồ này sử dụng đó là: Hình 2.3: Biến động giá chứng khoán kiểu biểu đồ then chắn Loại biểu đồ này thƣờng đƣợc áp dụng để phân tích trên các thị trƣờng chứng khoán hiện đại khớp lệnh theo hình thức khớp lệnh liên tục, độ dao động của giá chứng khoán trong một phiên giao dịch là tƣơng đối lớn.  Biểu đồ dạng ống (Candlestick chart) Đây là dạng biểu đồ cải tiến của biểu đồ dạng then chắn (Bar chart), nó đƣợc ngƣời Nhật Bản khám phá và áp dụng trên TTCK của họ đầu tiên. Giờ đây nó đang dần đƣợc phổ biến hầu hết trên các TTCK hiện đại trên toàn thế giới. Dạng biểu đồ này phản ánh rõ nét nhất về sự biến động của giá chứng khoán trên thị trƣờng chứng khoán khớp lệnh theo hình thức khớp lệnh định kỳ. Hai kí tự mà loại biểu đồ này sử dụng là: 17 Hình 2.4: Giá khớp lệnh biến động cùa biểu đồ ống Một trong những hiệu quả cơ bản của dạng biểu đồ này khiến cho ngƣời sử dụng ƣa thích là khả năng biểu đạt nhiều thông số bằng chính hình vẽ. Chẳng hạn, thông qua màu ta có thể biết tình hình chung thị trƣờng, thông qua độ dài thân, độ dài các bấc, ta có thể biết tình hình giá giao dịch. Ngoài ra dạng biểu đồ này cũng có thể áp dụng cho mọi loại biểu đồ: liên tục và định kỳ, theo phút, hàng ngày hoặc hàng tháng. Những biến dạng khác nhau của mỗi cây nến phản ánh những đặc trƣng khác nhau của tình hình thị trƣờng. Chẳng hạn biểu đồ dạng Doji (phiên âm từ do-gee) có dạng nhƣ ô tròn mình khoanh thêm.Với dạng biểu đồ này, giá đóng cửa trùng với giá mở cửa, do đó mà ta sẽ hầu nhƣ không thấy thân nến mà chỉ thấy bấc nến. ở đây cũng sẽ có trƣờng hợp giá mở cửa bằng giá đóng cửa và bằng giá thấp nhất hoặc cao nhất trong ngày. 2.2. TỒNG QUAN VỀ KHAI PHÁ DỮ LIỆU 2.2.1, Khái niệm về khai phá dữ liệu Khai phá dữ liệu là một khái niệm ra đời vào những năm cuối của thập kỷ 80 [7]. Nó bao hàm một loạt các kỹ thuật nhằm phát hiện ra các thông tin có giá trị tiềm ẩn trong các tập dữ liệu lớn (các kho dữ liệu). Về bản chất, KPDL liên quan đến việc phân tích các dữ liệu và sử dụng các kỹ thuật để tìm ra các mẫu hình có tính chính quy (regularities) trong tập dữ liệu. Năm 1989, Fayyad, Piatestsky-Shapiro và Smyth đã dùng khái niệm Phát hiện tri thức trong CSDL (Knowledge Discovery and Data Mining-KDD) để chỉ toàn bộ quá trình phát hiện các tri thức có ích từ các tập dữ liệu lớn. 18 Trong đó, KPDL là một bƣớc đặc biệt trong toàn bộ quá trình, sử dụng các giải thuật đặc biệt để chiết xuất ra các mẫu (pattern) (hay các mô hình) từ dữ liệu. 2.2.2, Các ứng dụng của khai phá dữ liệu Khai phá dữ liệu đƣợc ứng dụng rất thành công trong “CSDL thị trƣờng” (database marketing), đây là một phƣơng pháp phân tích CSDL khách hàng, tìm kiếm các mẫu trong số các khách hàng và sử dụng các mẫu này để lựa chọn các khách hàng trong tƣơng lai. Tạp chí Business Week của Mỹ đã đánh giá hơn 50% các nhà bán lẻ đang và có ý định sử dụng “CSDL thị trƣờng” cho hoạt động kinh doanh của họ (Berry 1994). Kết quả ứng dụng cho thấy số lƣợng thẻ tín dụng American Express bán ra đã tăng 15% - 20% (Berry 1994). Các ứng dụng khác của KPDL trong kinh doanh nhƣ phân tích chứng khoán và các văn kiện tài chính; phân tích và báo cáo những thay đổi trong dữ liệu, bao gồm Coverstory của IRI (Schmitz, Armstrong, & Little 1990), Spotlight của A.C Nielsen (nand & Kahn 1992) đối với các dữ liệu bán hàng trong siêu thị, KEFIR của GTE cho CSDL y tế (Matheus, Piatetsky-Shapiro, & McNeil); phát hiện và phòng chống gian lận cũng thƣờng là bài toán của KPDL và phát hiện tri thức. Ví dụ nhƣ hệ thống phát hiện gian lận trong dịch vụ y tế đã đƣợc Major và Riedinger phát triển tại Travelers insurance năm 1992. Internal Revenue Service đã phát triển một hệ thống chọn thuế thu để kiểm toán. Nestor FDS (Blanchard 1994) đƣợc phát triển dựa trên mạng neuron để phát hiện ra gian lận trong thẻ tín dụng.  Thiên văn học: Hệ thống SKICAT do JPL/Caltech phát triển đƣợc sử dụng cho các nhà thiên văn để tự động xác định các vì sao và các dải thiên hà trong một bản khảo sát lớn để có thể phân tích và phân loại (Fayyad, Djorgovski, & Weir).  Phân tử sinh học: Hệ thống tìm kiếm các mẫu trong cấu trúc phân tử (Conklin, Fortier, và Glasgow 1993) và trong các dữ liệu gen (Holder, Cook, và Djoko 1994).  Mô hình hóa những thay đổi thời tiết: các mẫu không thời gian nhƣ lốc, gió xoáy đƣợc tự động tìm thấy trong các tập lớn dữ liệu mô phỏng và quan sát đƣợc (Stolorz et al. 1994). Các ứng dụng của khai phá dữ liệu trong khoa học cũng đƣợc phát triển: 19  Phân tích dữ liệu và hỗ trợ ra quyết định (data analysis & decision support)  Điều trị y học (medical treatment)  Text mining & Web mining  Tài chính và TTCK (finance & stock market)  Bảo hiểm (insurance)  Nhận dạng (pattern recognition)  Vv… 2.2.3, Tiến trình thực hiện của khai phá dữ liệu Hình 2.5: Quá trình xử lý khai phá dữ liệu Quá trình xử lý KPDL bắt đầu bằng cách xác định chính xác vấn đề cần giải quyết. Sau đó sẽ xác định các dữ liệu liên quan dùng để xây dựng giải pháp. Bƣớc tiếp theo là thu thập các dữ liệu có liên quan và xử lý chúng thành dạng sao cho giải thuật KPDL có thể hiểu đƣợc. Về lý thuyết thì có vẻ rất đơn giản nhƣng khi thực hiện thì đây thực sự là một quá trình rất khó khăn, gặp phải rất nhiều vƣớng mắc nhƣ: các dữ liệu phải đƣợc sao ra nhiều bản (nếu đƣợc chiết xuất vào các tệp), quản lý tập các tệp dữ liệu, phải lặp đi lặp lại nhiều lần toàn bộ quá trình (nếu mô hình dữ liệu thay đổi), v.v… Có thể tóm tắt các bƣơc thực hiện nhƣ sau:  Làm sạch dữ liệu (Data Cleaning): Loại bỏ dữ liệu nhiễu và dữ liệu không nhất quán.  Tích hợp dữ liệu (Data Intergation): Dữ liệu của nhiều nguồn có thể đƣợc tổ hợp lại. 20  Lựa chọn dữ liệu (Data Selection): Lựa chọn những dữ liệu phù hợp với nhiệm vụ phân tích trích rút từ CSDL.  Chuyển đổi dữ liệu (Data Transformation): Dữ liệu đƣợc chuyển đổi hay đƣợc hợp nhất về dạng thích hợp cho việc khai phá.  Khai phá dữ liệu (Data Mining): Đây là một tiến trình cốt yếu trong đó các phƣơng pháp thông minh đƣợc áp dụng nhằm trích rút ra mẫu dữ liệu.  Đánh giá mẫu (Pattern Evaluation): Dựa trên một độ đo nào đó xác định lợi ích thực sự, độ quan trọng của các mẫu biểu diễn tri thức.  Biểu diễn tri thức (Knowledge Presentation): Ở giai đoạn này các kỹ thuật biểu diễn và hiển thị đƣợc sử dụng để đƣa tri thức lấy ra cho ngƣời dùng. Hình 2.6: Quá trình phát hiện tri thức 2.2.4, Các phƣơng pháp khai phá dữ liệu 2.2.4.1, Một số phƣơng pháp khai thác dữ liệu phổ biến  Phƣơng pháp quy nạp (Induction)
- Xem thêm -

Tài liệu liên quan