Tài liệu Nghiên cứu khai phá dữ liệu và ứng dụng phân tích xu thế thị trường chứng khoán

.PDF

319

133

loveydove Báo vi phạm

Tải xuống 133

Mô tả:

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TR N T NG N P NT U UT P T NGỌ ỆU V TRƢỜNG NG NG LUẬN VĂN T Ạ SĨ HỆ THỐNG THÔNG TIN HÀ NỘI – 2015 NG O N ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ TR N T NG N P NT U UT P T NGỌ ỆU V TRƢỜNG NG NG NG O N Ngành: H thống th ng tin Chuyên ngành: H thống thông tin Mã số: 60 48 01 04 LUẬN VĂN T Ạ SĨ HỆ THỐNG THÔNG TIN NGƢỜ ƢỚNG DẪN KHOA HỌC: PGS.TS. NGUYỄN HÀ NAM HÀ NỘI – 2015 1 Ờ M ĐO N T i xin cam đoan luận văn “Nghiên cứu khai phá dữ li u và ứng dụng phân tích xu thế thị trường chứng khoán" là c ng trình nghiên cứu của riêng t i. Các số li u, kết quả được trình bày trong luận văn là hoàn toàn trung thực và chưa được c ng bố trên bất cứ c ng trình nào khác. T i đã trích dẫn đầy đủ các tài li u tham khảo, c ng trình nghiên cứu liên quan. Ngoại trừ các tài li u tham khảo này, luận văn hoàn toàn là nghiên cứu của riêng t i. Luận văn được hoàn thành trong thời gian t i là học viên tại Khoa C ng ngh th ng tin, Trường Đại học C ng ngh , Đại học Quốc gia Hà Nội. Hà Nội, ngày 18 tháng 10 năm 2015 ọc viên Tr n T c N ọc 2 Ờ ẢM ƠN Lời đầu tiên, t i xin gửi lời cảm ơn và lòng biết ơn sâu sắc nhất tới PGS.TS. Nguyễn Hà Nam đã tận tình hướng dẫn t i trong suốt quá trình thực hi n luận văn tốt nghi p. T i xin trân trọng cảm ơn các Thầy, C giáo đã tận tình chỉ dạy, cung cấp cho t i những kiến thức quý báu và lu n nhi t tình giúp đỡ, tạo điều ki n thuận lợi nhất trong suốt quá trình t i học tập tại Trường Đại học C ng ngh . T i xin gửi lời cảm ơn tới các bạn trong nhóm do thầy Nguyễn Hà Nam hướng dẫn đã lu n sát cánh và hỗ trợ cho t i trong suốt quá trình học tập cũng như quá trình làm luận văn. Cuối cùng, t i muốn được gửi lời cảm ơn tới gia đình, đồng nghi p và bạn bè, những người lu n bên cạnh, động viên và tạo điều ki n tốt nhất cho t i trong suốt quá trình học tập và thực hi n luận văn tốt nghi p. T i xin chân thành cảm ơn! 3 M LỜI CAM ĐOAN ....................................................................................................................... 1 LỜI CẢM ƠN............................................................................................................................. 2 MỤC LỤC .................................................................................................................................. 3 AN MỤC AN MỤC ẢN MỞ Đ N ............................................................................................................ 5 I ........................................................................................................ 6 .................................................................................................................................... 7 1. Đ tv n 2. M c tiêu n 3. Đối tƣợng nghiên c u. ............................................................................................................7 4. P ƣơn p áp n ...............................................................................................................................7 iên c u ..............................................................................................................7 iên c u. ......................................................................................................7 u tr c uận văn ..................................................................................................................8 5. Ch g N Q AN R ỜN C N O N C C Ỹ THUẬT TRUY N THỐNG ..................................................................................................................... 9 1.1. T trƣờn c n oán .......................................................................................................9 1.2. Một số kỹ thuật cơ bản dùng trong th trƣờng ch ng khoán. ..........................................10 1.2.1. Phân tích kỹ thuật (Technical Analysis). ..................................................................................... 10 1.2.1.1. Biểu đồ dạng đường (Line chart). ........................................................................................... 11 1.2.1.2. Biểu đồ dạng then chắn (Bar chart). ....................................................................................... 11 1.2.1.3. Biểu đồ cây nến (Candlestick chart). ...................................................................................... 11 1.2.2. Một số chỉ báo kỹ thuật cơ bản Technical Indicator . ................................................................ 12 1.2.2.1. Tính hội tụ và phân k của đường trung bình động MACD (Moving Average Convergence Divergence). ............................................................................................................................................. 12 1.2.2.2. MACD – Histogram. ............................................................................................................... 12 1.2.2.3. Dải băng Bollinger. ................................................................................................................. 13 1.2.2.4. Chỉ số sức mạnh tương đối RSI (Relative Strength Index). .................................................... 13 1.2.2.5. Aroon. ..................................................................................................................................... 14 1.3. Kỹ thuật dự báo nâng cao....................................................................................................14 1.3.1. Phân tích hồi quy (Regression Analysis)..................................................................................... 14 1.3.1.1. H số tương quan coefficient correlation . ............................................................................ 14 1.3.1.2. H số xác định coefficient of determination . ........................................................................ 15 1.3.2. Mô hình RIM utoRegressive Integrated Moving verage . .............................................. 15 1.3.2.1. Quá trình AR(p). ..................................................................................................................... 16 1.3.2.2. Quá trình MA(q). .................................................................................................................... 16 1.3.2.3. Mô hình ARMA. ..................................................................................................................... 16 1.3.2.4. Quá trình tích hợp I(d). ........................................................................................................... 17 1.3.2.5. M hình RIM p,d,q t ng quát. ......................................................................................... 17 t uận ................................................................................................................................18 1.4. Ch g 2.1. AI P I C C Ỹ THUẬT PHÂN TÍCH DỰ BÁO. .............. 19 Khai phá tri th c và khai phá dữ liệu. ...............................................................................19 2.1.1. 2.1.2. Khai phá tri thức. ......................................................................................................................... 19 Khai phá dữ li u. ......................................................................................................................... 20 4 2.1.2.1. 2.1.2.2. 2.2. Mạng Neural nhân tạo (Artificial Neural Network). ........................................................22 2.2.1. 2.2.2. 2.2.3. 2.2.4. 2.2.5. 2.3. Phân lớp. ................................................................................................................................. 20 Đánh giá m hình phân lớp. .................................................................................................... 21 Kiến trúc mạng Neural ................................................................................................................ 22 Mạng Perceptron. ........................................................................................................................ 23 Mạng MLP .................................................................................................................................. 24 Huấn luy n mạng Neural............................................................................................................. 25 Thuật toán lan truyền ngược (Back Propagation)........................................................................ 26 P ƣơn p áp ensemb e .......................................................................................................28 2.3.1. 2.3.2. 2.3.3. Giới thi u phương pháp ensemble ............................................................................................... 28 Kỹ thuật Bagging ........................................................................................................................ 29 Kỹ thuật Boosting ....................................................................................................................... 29 t uận .................................................................................................................................31 2.4. Ch g P ƠN P P IẢI Q O N Ự O R ỜN C N 3.1. Xây dựn b i toán dự báo t trƣờn c ỰC N I M Đ N I C O I O N ............................................................. 32 n oán .........................................................32 3.1.1. Mô tả bài toán.............................................................................................................................. 32 3.1.1.1. Tính khả thi của bài toán. ........................................................................................................ 32 3.1.1.2. C ng cụ hỗ trợ giải quyết bài toán. ......................................................................................... 32 3.1.2. Quy trình giải quyết bài toán. ...................................................................................................... 32 3.1.2.1. Thu thập dữ li u. ..................................................................................................................... 33 3.1.2.2. Tiền xử lý dữ li u. ................................................................................................................... 34 3.1.2.3. T chức dữ li u. ...................................................................................................................... 34 3.1.2.4. Huấn luy n m hình. ............................................................................................................... 35 3.1.2.5. Đánh giá m hình và nhận x t kết quả. ................................................................................... 35 3.2. M n 3.3. Thực nghiệm. ........................................................................................................................36 xu t. ...................................................................................................................35 3.3.1. Mô hình ARIMA. ........................................................................................................................ 36 3.3.2. M hình mạng neural truyền thống. ............................................................................................ 37 3.3.2.1. Thực hi n dự đoán theo chu k T+1. ...................................................................................... 37 3.3.2.2. Thực hi n dự đoán theo chu k T+4. ...................................................................................... 39 3.3.3. Cải tiến 1: M hình mạng neural và b sung một số chỉ báo kỹ thuật. ....................................... 42 3.3.3.1. Phân lớp. ................................................................................................................................. 42 3.3.3.2. Hồi quy. .................................................................................................................................. 43 3.3.4. Cải tiến 2: Mạng neural có thêm các chỉ báo và sử dụng phương pháp ensemble. ..................... 47 3.3.4.1. Phân lớp. ................................................................................................................................. 47 3.3.4.2. Hồi quy. .................................................................................................................................. 47 3.4. P ntc 3.5. K t luận. ................................................................................................................................51 ..............................................................................................................................49 K T LUẬN .............................................................................................................................. 52 I I AM ẢO ........................................................................................................ 53 5 N M N V Hình 1.1: Biểu đồ dạng đường. ..............................................................................................................11 Hình 1.2: Biểu đồ dạng then chắn. .........................................................................................................11 Hình 1.3. Biểu đồ dạng cây nến. ............................................................................................................11 Hình 2.1: Phương pháp Holdout trong bài toán phân lớp. .....................................................................22 Hình 2.2: Mạng truyền thẳng. ................................................................................................................22 Hình 2.3: Mạng phản hồi........................................................................................................................23 Hình 2.4: M hình một Perceptron.........................................................................................................23 Hình 2.5: M hình mạng MLP. ..............................................................................................................25 Hình 2.6: M hình quá trình huấn luy n mạng MLP b ng thuật toán lan truyền ngược. ......................26 Hình 2.7: Giải thuật thuật toán lan truyền ngược. ..................................................................................27 Hình 2.8: Phương pháp Ensemble. .........................................................................................................28 Hình 3.1: Quy trình giải quyết bài toán. .................................................................................................32 Hình 3.2: M hình mạng Neural trong giải quyết bài toán dự báo chứng khoán. ..................................33 Hình 3.3: M hình đề xuất: Mạng Neural có b sung thêm các chỉ báo kỹ thuật. .................................35 Hình 3.4: M hình đề xuất: Mạng neural có thêm các chỉ báo và sử dụng phương pháp ensemble. .....36 Hình 3.5: Luồng công vi c thực nghi m. ...............................................................................................36 Hình 3.6: T l lỗi qua các lần Epoch của m hình mạng Neural. .........................................................38 Hình 3.7: T l lỗi MSE. ........................................................................................................................38 Hình 3.8: H số tương quan R. ...............................................................................................................38 Hình 3.9: T l lỗi qua các lần Epoch của m hình mạng Neural..........................................................39 Hình 3.10: Biểu đồ thống kê kết quả dự báo của mô hình mạng neural theo tiếp cận phân lớp. ...........40 Hình 3.11: T l lỗi MSE. ......................................................................................................................40 Hình 3.12: H số tương quan R. .............................................................................................................40 Hình 3.13: Biểu đồ thể hi n giá trị MSE và h số tương quan qua 20 lần kiểm nghi m. ......................41 Hình 3.14: T l lỗi qua các Epoch của m hình mạng Neural..............................................................42 Hình 3.15: Biểu đồ thống kê kết quả dự báo theo hướng tiếp cận phân lớp sau cải tiến 1. ...................43 Hình 3.16: T l lỗi MSE. ......................................................................................................................44 Hình 3.17: H số tương quan R. .............................................................................................................44 Hình 3.18: Biểu đồ thể hi n giá trị MSE và h số tương quan qua 20 lần kiểm nghi m. ......................44 Hình 3.19: H số tương quan R b ng phương pháp Ensemble cho mạng neural. ..................................48 Hình 3.20: Đồ thị giá đóng cửa thực tế và giá dự đoán..........................................................................49 6 N M ẢNG U Bảng 3.1: Dữ li u c phiếu MSFT. ........................................................................................................33 Bảng 3.2: So sánh các kết quả thực nghi m b ng m hình rima. ........................................................37 Bảng 3.3: Kết quả dự đoán b ng m hình rima. ..................................................................................37 Bảng 3.4: Kết quả phân lớp b ng mạng Neural. ....................................................................................39 Bảng 3.5: Kết quả dự đoán khi phân tích hồi quy b ng mạng Neural truyền thống. .............................41 Bảng 3.6: So sánh giá trị MAPE trung bình của nhiều mô hình. ...........................................................42 Bảng 3.7: Kết quả phân lớp b ng mạng Neural. ....................................................................................43 Bảng 3.8: Kết quả dự đoán khi phân tích hồi quy b ng mạng Neural cải tiến 1. ...................................45 Bảng 3.9: Kết quả sử dụng mạng neural để phân lớp dữ li u. ...............................................................46 Bảng 3.10: Kết quả sử dụng mạng neural để phân tích hồi quy dữ li u.................................................46 Bảng 3.11: Kết quả dự đoán của mạng Neural truyền thống và mạng Neural cải tiến 1. ......................46 Bảng 3.12: Kết quả phân lớp b ng phương pháp Ensemble cho mạng neural. ......................................47 Bảng 3.13: T ng hợp các kết quả dự đoán của nhiều mô hình thực nghi m. ........................................48 Bảng 3.14: Lời khuyên cho các nhà đầu tư chứng khoán. .....................................................................51 7 MỞ Đ U 1. Đ tv n Sự phát triển của công ngh thông tin và những ứng dụng công ngh thông tin trong nhiều lĩnh vực của đời sống, kinh tế xã hội đã sản sinh ra một lượng dữ li u kh ng lồ. Các phương pháp quản trị và khai thác dữ li u thủ công, truyền thống tỏ ra kém hi u quả trước nhu cầu khai thác và phát hi n th ng tin có giá trị ẩn chứa trong lượng lớn dữ li u này. Sự ra đời của các kỹ thuật mới như là khai phá tri thức (Knowledge Discovery in Databases) và khai phá dữ li u Data Mining đã đem lại hi u quả cao trong vấn đề khai thác và phát hi n tri thức, áp dụng trên nhiều lĩnh vực khác nhau. Đặc bi t trong m i trường kinh doanh, người ta mong muốn có thật nhiều thông tin hữu ích để hỗ trợ kinh doanh hi u quả. Trong đó, nhu cầu dự báo cho thị trường chứng khoán để hạn chế rủi ro và thua lỗ được các t chức cũng như các nhà đầu tư cá nhân đặt làm mối quan tâm hàng đầu. Dự đoán xu thế của thị trường chứng khoán là một c ng vi c kh ng đơn giản. Sự không tuyến tính của thị trường kèm theo sự tác động của nhiều yếu tố bên ngoài cũng làm ảnh hưởng tới giá cả của thị trường chứng khoán. Do đó, vi c xây dựng một h thống phân tích dự báo với các tiêu chí đầy đủ, khách quan và khoa học cả về định tính và định lượng, cả về góc độ tài chính và phi tài chính là cần thiết. 2. M c tiêu n iên c u Luận văn của tôi tập trung nghiên cứu cả hai phương pháp định tính và định lượng với mong muốn có được một h thống dự đoán xu thế thị trường chứng khoán đủ mạnh hỗ trợ đắc lực cho các nhà đầu tư chứng khoán. 3. Đối tƣợn n iên c u Đối tượng mà luận văn của tôi nghiên cứu chính là xu thế thị trường chứng khoán. Cụ thể, t i sử dụng giá c phiếu MSFT của công ty Microsoft Corporation thu thập từ trang finance.yahoo.com niêm yết trên sàn NASDAQ (National Association of Securities Dealers Automated Quotations) để tiến hành dự đoán. 4. P ƣơn p áp n iên c u Luận văn tập trung vào vi c tìm hiểu m hình khai phá dữ li u và các phân tích kỹ thuật cơ bản dùng trong lĩnh vực chứng khoán theo cả hai phương pháp định tính và định lượng. Luận văn thực hi n vi c kết hợp mô hình khai phá dữ li u: mạng neural và các phân tích kỹ thuật cơ bản, sử dụng phương pháp ensemble giúp gia tăng độ chính xác cho mạng neural để đưa ra đánh giá nh m hỗ trợ các nhà đầu tư trong vi c ra quyết định mua bán c phiếu. 8 5. u tr c uận văn Bố cục của bài luận văn được trình bày trong 3 chương. ƣơn 1: Tổng quan v th trƣờn c n oán v các kỹ thuật truy n thống. Chương này trình bày một số kiến thức nền tảng về thị trường chứng khoán, các phương pháp nghiên cứu cơ bản và những đặc trưng của thị trường chứng khoán thông qua các biểu đồ, các chỉ báo như M CD, dải băng Bollinger, RSI, roon . Và tìm hiểu mô hình hồi quy ARIMA chuyên dụng trong vi c dự đoán giá cả thị trường chứng khoán. ƣơn 2: K ai p á dữ iệu v các ỹ t uật p n t c dự báo T i tìm hiểu các đặc trưng cơ bản của lĩnh vực khai phá tri thức, khai phá dữ li u và các bài toán đặc trưng trong lĩnh vực này. M hình mạng neural là một trong những m hình khai phá dữ li u điển hình, có khả năng áp dụng cao cho bài toán phân tích xu thế thị trường chứng khoán. Ngoài ra để gia tăng độ chính xác cho m hình khai phá dữ li u, phương pháp ensemble được coi là một trong những giải pháp tối ưu. Chương này chủ yếu xây dựng kiến thức nền tảng để t i tiến hành những thực nghi m ở chương sau. ƣơn 3: P ƣơn p áp iải quy t, thực nghiệm v dự báo th trƣờng ch ng khoán. án iá c o b i toán Nội dung chủ yếu của chương 3 là áp dụng các m hình đã tìm hiểu vào vi c dự báo thị trường chứng khoán. Đầu tiên, t i tiến hành thực nghi m bài toán với mô hình truyền thống: RIM và mạng neural. Tiếp đó t i cải tiến độ chính xác cho mạng neural, b ng cách sử dụng bộ dữ li u chứng khoán và b sung thêm một số chỉ báo kỹ thuật cơ bản như M CD, RSI, roon... Nh m gia tăng độ chính xác cho m hình mạng neural tôi tiếp tục cải tiến lần 2 với kỹ thuật ensemble. Cuối cùng, tôi tiến hành đánh giá kết quả dự đoán của từng mô hình để tìm ra lời khuyên tin cậy nhất cho các nhà đầu tư, nhà kinh doanh chứng khoán. 9 ƣơn 1: T NG QU N V T TRƢỜNG NG O NV Ỹ T UẬT TRUY N T ỐNG 1.1. T trƣờn c n oán Trong nền kinh tế hi n đại, thị trường chứng khoán là nơi diễn ra các hoạt động giao dịch mua bán chứng khoán trung và dài hạn. Vi c mua bán này được tiến hành ở thị trường sơ cấp khi người mua mua được chứng khoán lần đầu từ những người phát hành, và ở thị trường thứ cấp khi có sự mua đi bán lại các chứng khoán đã được phát hành ở thị trường sơ cấp. Như vậy, xét về mặt hình thức, thị trường chứng khoán là nơi diễn ra các hoạt động trao đ i, mua bán, chuyển nhượng các loại chứng khoán, qua đó thay đ i các chủ thể nắm giữ chứng khoán [1]. Các hình thức của thị trường chứng khoán bao gồm: thị trường tập trung, thị trường phi tập trung và thị trường chợ đen. Với mỗi một mã chứng khoán trên sàn giao dịch đều bao gồm các chỉ số cơ bản như: - Cột giá tham chiếu: Là giá đóng cửa của ngày giao dịch trước đó và là cơ sở để xác định giá trần, giá sàn của ngày giao dịch hi n tại. - Cột giá trần: Là mức giá cao nhất mà nhà đầu tư có thể đặt l nh mua, l nh bán chứng khoán. - Cột giá mở cửa: Là mức giá thực hi n đầu tiên trong ngày giao dịch. - Cột giá đóng cửa: Là mức giá thực hi n cuối cùng trong ngày giao dịch. - Cột giá khớp l nh: Là mức giá mà tại đó khối lượng chứng khoán được giao dịch nhiều nhất. - Cột khối lượng khớp l nh: Là khối lượng chứng khoán được thực hi n tại giá khớp l nh. - Cột chênh l ch +/- : Là thay đ i của mức giá hi n tại so với giá tham chiếu trong ngày giao dịch = giá hi n tại – giá tham chiếu . - Cột mua: Gồm 6 cột biểu thị cho 3 mức giá đặt mua cao nhất tương ứng với các khối lượng đặt mua tại các mức giá cao nhất đó. Khi kết thúc phiên giao dịch, bảng đi n tử sẽ hiển thị các th ng tin về khối lượng chứng khoán tương ứng với các mức giá chưa được khớp l nh dư mua . - Cột bán: Gồm 6 cột biểu thị cho 3 mức giá đặt bán thấp nhất tương ứng với các khối lượng đặt bán tại các mức giá thấp nhất đó. Trong kinh tế thị trường, không có hoạt động đầu tư kinh doanh nào mà lại không có rủi ro. Lợi nhuận càng cao, rủi ro càng lớn... Đầu tư chứng khoán cũng chịu tác động của quy luật này, nhưng ở mức sâu đậm và đa di n hơn. Do vậy để đạt được t l lợi nhuận cao trong đầu tư chứng khoán, vấn đề đặt ra là phải có kiến thức để chủ động nhận biết các loại rủi ro này [2]. 10 1.2. Một số ỹ t uật cơ bản dùn tron t trƣờn c n oán. Sự bất n của thị trường kèm theo đó là tác động của nhiều yếu tố bên ngoài cũng làm ảnh hưởng tới giá cả của thị trường chứng khoán. Vì vậy, làm thế nào để dự đoán chính xác được sự lên xuống của thị trường là một bài toán mà mọi nhà đầu tư đều quan tâm, nghiên cứu. Các nhà nghiên cứu, chuyên gia thường dựa trên vi c phân tích kỹ thuật và sử dụng những chỉ báo để xác định xu hướng và thời điểm đầu tư thích hợp. Phần này trình bày một số kỹ thuật hay được sử dụng. 1.2.1. P ntc ỹ t uật (Tec nical Analysis). Phân tích kỹ thuật nghiên cứu các hành vi của các bên tham gia thị trường thông qua sự biến động của giá, khối lượng chứng khoán giao dịch nh m xác định được xu thế biến động giá và thời điểm đầu tư. Phân tích kỹ thuật dựa trên giả định r ng lịch sử lặp lại và hướng thị trường trong tương lai có thể được xác định b ng cách kiểm tra giá vừa qua. Công cụ cơ bản của phân tích kỹ thuật là biểu đồ. Biểu đồ thể hi n chuỗi dao động của giá trong một khoảng thời gian. u điểm:  Giúp xác định chiến lược kinh doanh ngắn hạn, trung hạn và dài hạn.  Giúp xác định các đường ti m cận giá để có quyết định mua vào – bán ra c phiếu một cách hợp lý.  Giúp xác định các khoảng dao động của giá để xác định thời điểm nên hay chưa nên tham gia vào thị trường. Khuyết điểm:  Phân tích kỹ thuật hoàn toàn dựa vào dữ li u lịch sử mà lịch sử thì không phải bao giờ cũng lặp lại.  Phân tích kỹ thuật nghiên cứu kết quả của một mô hình chứ không nghiên cứu các nguyên nhân tạo ra m hình đó.  Các chỉ số có thể dẫn tới sự hiểu nhầm hoặc hiểu không chính xác trong các tình huống khác nhau trên thị trường. Tình trạng các nhà đầu cơ áp dụng chiến lược giao dịch tương tự nhau nhưng lại thu được kết quả khác xa nhau rất thường xuyên xảy ra. Lý do là các chỉ số được áp dụng trong các khoảng biên độ thời gian khác nhau, các tín hi u được hiểu khác nhau và chiến lược kiểm soát rủi ro được áp dụng cũng khác nhau.  Quan điểm cá nhân của nhà kinh doanh cũng có ảnh hưởng đến vi c diễn giải các dữ li u lịch sử và dữ li u mới cập nhật. Hi n nay trên thị trường chứng khoán các chuyên viên phân tích dùng rất nhiều các loại biểu đồ khác nhau để phân tích, trong đó có 3 loại biểu đồ được dùng ph biến đó là: biểu đồ dạng đường (Line chart), biểu đồ dạng then chắn (Bar chart), biểu đồ dạng cây nến (Candlestick chart) [1]. 11 1.2.1.1. Biểu đồ dạ g đ ờng (Line chart). Biểu đồ dạng đường ưu điểm dễ sử dụng. Nhưng do diễn biến của thị trường chứng khoán ngày càng phức tạp cho nên loại biểu đồ này ngày càng ít được sử dụng. Hình 1.1: Biểu đồ dạng đường. 1.2.1.2. Biểu đồ dạng then chắn (Bar chart). Biểu đồ dạng then chắn phản ánh rõ nét sự biến động của giá chứng khoán. Các chuyên viên phân tích thường sử dụng loại biểu đồ này để phân tích trên các thị trường chứng khoán hi n đại khớp l nh theo hình thức khớp l nh liên tục và độ dao động của giá chứng khoán trong một phiên giao dịch là tương đối lớn. Giá cao nhất Giá cao nhất Giá mở cửa Giá đóng cửa Giá đóng cửa Giá thấp nhất Giá mở cửa Giá thấp nhất Hình 1.2: Biểu đồ dạng then chắn. 1.2.1.3. Biểu đồ cây nến (Candlestick chart). Dạng biểu đồ này phản ánh rõ nét nhất về sự biến động của giá chứng khoán trên thị trường chứng khoán khớp l nh theo hình thức khớp l nh định k . Ở biểu đồ này nếu giá đóng cửa cao hơn giá mở cửa, nến sẽ màu xanh, và giá đóng cửa thấp hơn giá mở cửa, nến sẽ màu đỏ. Giá mở cửa Giá tăng Giá giảm Giá đóng cửa Hình 1.3. Biểu đồ dạng cây nến. 12 1.2.2. Một số c ỉ báo ỹ t uật cơ bản (Technical Indicator). Các chuyên gia lĩnh vực kinh tế thường dựa trên kinh nghi m sử dụng đường chỉ báo để xác định xu hướng và thời điểm đầu tư thích hợp. Những chỉ báo này có thể sử dụng độc lập hoặc song song để b trợ thêm tính chính xác cho vi c đầu tư. 1.2.2.1. Tính hội tụ v h của đ ờng tru g bì h động MACD (Moving Average Convergence Divergence). M CD được sử dụng để nhận biết xu hướng, tín hi u thị trường đảo chiều [19]. M CD được xác định b ng cách lấy giá trị trung bình động lũy thừa EMA (Exponential Moving Average của giá c phiếu ngắn hạn giả sử 12 ngày trừ đi giá trị EM của giá c phiếu dài hạn giả sử 26 ngày . M CD là một chỉ báo chỉ ra sự hội tụ và phân k của đường trung bình động. Sự hội tụ xảy ra khi đường chỉ báo MACD di chuyển cùng chiều tăng/giảm với đường giá, báo hi u xu hướng tăng giá trong tương lai. Sự phân k xảy ra khi đường MACD di chuyển ngược chiều với đường giá, báo hi u xu hướng giảm giá trong tương lai. Hi n tượng phân k có 2 loại: phân k dương đường chỉ báo tăng còn đường giá giảm), phân k âm đường chỉ báo giảm mà đường giá lại tăng . u điểm: M CD vừa chỉ ra xu thế của thị trường, vừa xác định các tín hi u mua bán trên cùng một đồ thị. Khoảng cách giữa trung bình động ngắn hạn và trung bình động dài hạn thể hi n xu thế tăng hoặc giảm của thị trường. Khuyết điểm: M CD sử dụng nhiều đường trung bình động để đưa ra tín hi u mua bán có thể làm tăng độ trễ cho quyết định của nhà đầu tư. 1.2.2.2. MACD – Histogram. Năm 1986, Thomas spray giới thi u MACD – Histogram như một giải pháp làm giảm thiểu độ trễ của MACD [19]. Giá trị của MACD – Histogram được tính b ng hi u của M CD và EM 9 ngày của chính MACD. Nếu đường M CD đang ở trên đường EMA - 9, giá cả đang lên nhưng M CD – Histogram có sự xuất hi n của phân k âm thì lúc này nhà đầu tư có thể ra quyết định bán ra sớm hơn là chờ đợi sự giao cắt mới ra quyết định bán. Nếu đường M CD đang ở dưới đường EMA - 9, giá cả đang xuống nhưng MACD – Histogram có sự xuất hi n của phân k dương thì lúc này nhà đầu tư có thể ra quyết định mua vào sớm hơn là chờ đợi sự giao cắt mới ra quyết định mua. u điểm: MACD – Histogram dự đoán được sự xuất hi n của điểm báo hi u cho các hành vi mua, bán của nhà đầu tư trước khi nó xảy ra, nhờ đó nhà đầu tư có thể ra quyết định mua, bán kịp thời hơn so với vi c chờ đợi sự giao cắt giữa MACD và đường EMA của chính nó. Khuyết điểm: MACD – Histogram không thật sự hi u quả trong vi c đánh giá mức độ quá mua (overbought) và quá bán (oversold). 13 1.2.2.3. ải b g i ger. Năm 1980, John Bollinger giới thi u dải Bollinger nh m xác định thị trường đang giao dịch s i động hay trầm lắng. Dải Bollinger có biên dao động dựa vào sự biến động giá và độ l ch chuẩn [19]. Dải Bollinger gồm: Dải Bollinger giữa cho thấy xu hướng chu k trung gian. Th ng thường nó là đường trung bình đơn giản SM Simple Moving verage với chu k là 20 ngày. Dải Bollinger phía trên giống dải giữa, nhưng được dịch chuyển lên trên thêm hai lần độ l ch chuẩn. Dải Bollinger phía dưới giống dải giữa, nhưng nó được dịch chuyển xuống dưới thêm hai lần độ l ch chuẩn. Các chiến lược được sử dụng dựa trên nguyên lý r ng giá lu n có xu hướng quay trở lại vùng giữa của dải Bollinger. Đưa ra quyết định mua khi giá chạm vào rìa của dải Bollinger dưới, quyết định bán khi giá chạm vào rìa của dải Bollinger trên. u điểm: Dải băng Bollinger xác định tốt các khoảng thời gian có độ biến động lớn do đó có thể đáp ứng vai trò một c ng cụ cảnh báo động thái của giá c phiếu. Khuyết điểm: Dải băng bollinger xác định chiều của một biến động mạnh chỉ khi được kết hợp cùng các c ng cụ khác. 1.2.2.4. Chỉ số sức mạ h t g đối RSI (Relative Strength Index). Năm 1978, J. elles ilder giới thi u chỉ số RSI với vai trò là chỉ số dùng để đo sức mạnh/yếu của một loại chứng khoán khi nó tự so sánh với chính nó trong một khoảng thời gian nhất định [19]. Th ng thường chu k tính RSI là 14 ngày. RS là t số giá trung bình các phiên tăng và giá trung bình các phiên giảm. Khi đó, chỉ số sức mạnh tương đối: RSI  100  100 1  RS Nếu đường RSI tăng vượt qua đường 50 ở giữa, giá của c phiếu đó có k vọng tăng giá. Ngược lại, nếu đường RSI giảm xuống dưới đường này, giá của c phiếu đó có k vọng giảm giá. Đường 70 được coi là ngưỡng lỗ mua overbought . Nếu đường RSI vượt qua ngưỡng này là lúc nhà đầu tư sẽ bán bớt c phiếu ra để trở về mức cân b ng của thị trường. Đường 30 được coi là ngưỡng lỗ bán oversold . Nếu đường RSI vượt qua ngưỡng này là lúc nhà đầu tư sẽ mua vào để đẩy giá lên về với mức cân b ng của thị trường. u điểm: RSI là một chỉ báo rất tốt để đưa ra tín hi u nhanh. Khuyết điểm: Sử dụng RSI cho cơ hội giao dịch kh ng thường xuyên, thi thoảng vẫn có tín hi u sai. Do đó, cần phải quan sát theo d i tín hi u RSI thường xuyên. Khuyến nghị nên sử dụng RSI kết hợp với các chỉ báo khác. 14 1.2.2.5. Aroon. Năm 1995, Tushar Chande giới thi u roon nh m xác định xu thế giá cả của thị trường chứng khoán [19]. Ý tưởng tính toán Aroon là dựa trên vi c xác định phiên nhỏ nhất (hoặc cao nhất) cách phiên hi n tại bao xa trong số các phiên lấy trong chu k tính Aroon. Th ng thường chu k tính roon là 25 ngày. Aroon Up = 100 x (25- số ngày cách phiên lớn nhất trong chu k 25 ngày /25. Aroon Down=100x(25- số ngày cách phiên thấp nhất trong chu k 25 ngày /25. roon tương quan = roon up – Aroon down. Nếu giá trị roon tương quan lớn hơn 50 thì thị trường đang trong xu hướng tăng mạnh và tại đây có thể sẽ diễn ra sự đảo chiều của xu hướng. Nếu giá trị roon tương quan có giá trị gần 0 tức là roon up và roon down xấp xỉ nhau, đây là lúc thị trường đang chuyển giao hoặc kh ng có xu hướng. Nếu giá trị roon tương quan giảm từ 0 đến -50 thì đường giá có hướng di chuyển giảm. Nếu giá trị roon tương quan nhỏ hơn -50 có nghĩa là thị trường đang trong xu hướng giảm rất thấp, nếu sau đó giá trị roon tương quan bắt đầu tăng trên -50 và hướng về đường 0 thì xu hướng giảm giá đã yếu, sự đảo chiều bắt đầu được hình thành. u điểm: chỉ báo roon xác định hướng đi của đường giá. Chỉ báo này tăng khi đường giá tăng và giảm khi đường giá giảm, giúp cho nhà đầu tư biết thị trường đang trong xu thế tăng hay trong xu thế giảm hoặc đang dao động trong một phạm vi giá nào đó. Khuyết điểm: chỉ báo Aroon hỗ trợ xác định xu hướng mạnh hơn nếu được kết hợp cùng các c ng cụ chỉ báo khác. 1.3. ỹ t uật dự báo n n cao 1.3.1. P ntc ồi quy (Regression Analysis). Phân tích hồi quy nghiên cứu mối quan h của biến được dự đoán vào một hay nhiều biến quan sát, nh m mục đích ước lượng hoặc tiên đoán giá trị k vọng của biến được dự đoán khi biết trước giá trị của biến quan sát [7]. Phân tích hồi quy dựa trên giả định biến quan sát là xác định trong khi biến được dự đoán là ngẫu nhiên. Để đánh giá bài toán hồi quy, chúng ta thường dùng các đại lượng sau. 1.3.1.1. ốt g ua c efficie t c rre ati H số tương quan R đo mức độ liên kết chặt chẽ giữa đại lượng thực tế X và dự đoán Y. n R  (X i 1 n  (X i 1 i  X)(Yi  Y) (1.1) n  X) . (Yi  Y) 2 i 2 i 1 Trong đó: X , Y là giá trị trung bình tương ứng của tập các giá trị Xi, Yi thuộc hai đại lượng X, Y. 15 r có giá trị từ -1 đến 1; r b ng 0 (hay gần 0 có nghĩa là hai đại lượng X và Y không có liên h gì với nhau; ngược lại nếu r b ng -1 hay 1 có nghĩa là hai đại lượng X và Y có mối liên h chặt chẽ. H số này kh ng có đơn vị đo cụ thể. 1.3.1.2. ố c đ h c efficie t f deter i ati H số xác định R2 dùng để đánh giá mức độ phù hợp của m hình hồi quy, thể hi n mối quan h tương quan giữa các đại lượng. H số xác định chính là bình phương của h số tương quan. H số xác định diễn đạt t l của giá trị thực tế X và giá trị dự đoán Y. X là giá trị trung bình của X. • TSS (Total Sum of Squares : T ng bình phương chung đo biến đ i của giá trị thực tế Xi quanh giá trị trung bình X. n TSS   (Xi  X) 2 i 1  (1.2) ESS (Explained Sum of Squares): T ng bình phương được giải thích b ng mô hình hồi quy, đo sự biến đ i giữa các giá trị được dự đoán Yi quanh giá trị trung bình X. n ESS   (Yi  X) 2 (1.3) i 1  RSS (Residual Sum of Squares): T ng bình phương của phần dư, đo sự sai khác giữa giá trị thực tế X và giá trị được dự đoán Y. n RSS   (Xi  Yi ) 2 (1.4) i 1 Do: TSS = ESS + RSS. Nên R 2  ESS  RSS   1   TSS  TSS  (1.5) Miền xác định của R2: 0  R2  1. R21: mô hình hồi quy càng phù hợp. R20: mô hình hồi quy càng ít phù hợp. Ví dụ: Nếu r = 0.922 thì R2 = 0.850, có nghĩa là 85% t ng số biến được dự đoán trong Y được giải thích b ng mối quan h giữa X và Y, còn 15% t ng số biến còn lại thì không giải thích được b ng mối liên h này. 1.3.2. M n R M ( utoRe ressive nte rated Moving Average). Mô hình ARIMA này được đưa ra bởi Box & Jenkins năm 1970 [6]. Đây là mô hình dự báo kinh tế được sử dụng rộng rãi. RIM được kết hợp bởi 3 quá trình chính: utoregression “ R” quá trình tự hồi quy , Integrated “I” quá trình tích hợp) và Moving verage “M ” quá trình trung bình trượt). 16 1.3.2.1. Quá trình AR(p). M hình tự hồi quy R, dự báo các biến tương lai b ng cách xây dựng hàm tuyến tính từ các giá trị quan sát trong quá khứ [13]. yt  c  1 yt 1  2 yt 2    p yt  p  et ; (1.6) Trong đó: yt : quan sát ở hi n tại. c: h ng số. 1,2 ,..., p là h số tương ứng với các giá trị quan sát yt 1, yt 2 ,..., yt  p . et: sai số nhiễu trắng white noise). Tính “nhiễu trắng” xảy ra khi: kì vọng và hi p phương sai b ng 0, còn phương sai là một h ng số kh ng phụ thuộc vào thời gian. K vọng: E (et )  0 Phương sai: Var (et )   2e   2e  const với k . t t k Hi p phương sai: cov et, et-k) = 0 với k ≠0. p là số giá trị quan sát trong quá khứ, khi đó p cũng thể hi n số bậc của mô hình tự hồi quy, được kí hi u là R p . Nếu ta sử dụng hai quan sát trong quá khứ, ta có mô hình tự hồi quy bậc hai AR(2). Tức là, giá trị của y tại thời điểm t phụ thuộc vào giá trị của nó tại hai thời điểm t-1 và t-2 và có phương trình sau: yt  c  1 yt 1  2 yt 2  et . 1.3.2.2. Quá trình MA(q). M hình trung bình trượt di động là một hàm tuyến tính phụ thuộc vào các sai số dự báo ở quá khứ và hi n tại [13]. yt = c + et + 1e t-1 + 2e t-2 + ... + qe t-q ; (1.7) Trong đó : yt : quan sát ở hi n tại. c : h ng số. 1,2 ,..., p là h số tương ứng với giá trị sai số nhiễu trắng et 1, et 2 ,...,et  p . q là số lượng sai số nhiễu trắng sử dụng trong m hình hàm trung bình trượt di động, q cũng thể hi n số bậc của m hình M , kí hi u M q . í dụ, m hình M 2 sử dụng hai sai số nhiễu trắng có dạng: yt = c + et + 1et-1 + 2et-2 ; 1.3.2.3. Mô hình ARMA. M hình kết hợp tự hồi quy bậc p và trung bình trượt bậc q được ký hi u là RM p,q có dạng đơn giản: yt  c  1 yt 1  2 yt 2    p y t  p + 1et-1 + 2et-2 + ... + qet-q  et ; (1.8) 17 Gọi B là toán tử thực hi n dịch chuyển dữ li u ngược lại một bước thời gian (shifting the data back one period) [13]. Đại lượng B hữu ích cho vi c biểu diễn sai phân. Bd y t  y t-d . Nếu dịch chuyển về hai thời điểm trước thời điểm hi n tại ta lấy: B(Byt )  B 2 yt  yt-2 . Như vậy: (1.8)  yt = c +1By t +...+pBp y t + e t + 1Be t +...+ q Bqe t  (1-1B- ...-pBp )y t = c + (1 + 1B +...+ q Bq )e t Kết hợp RM với quá trình tích hợp I d tạo nên m hình phần này được định nghĩa trong tiểu mục 1.3.2.4. (1.9) RIM . Thành 1.3.2.4. Quá trình tích hợp I(d). Ramanathan đã nhận định: Hầu hết các chuỗi thời gian về kinh tế là kh ng dừng vì chúng thường có một xu hướng tuyến tính hoặc mũ theo thời gian [13]. Quá trình tích hợp I có tác dụng chuyển đ i chuỗi thời gian kh ng dừng này thành chuỗi dừng thông qua sai phân. Chuỗi thời gian được coi là dừng khi giá trị trung bình, phương sai, hi p phương sai tại các độ trễ khác nhau đều kh ng đ i ở bất k thời điểm nào. d là bậc sai phân, kí hi u I d . Nếu sai phân bậc 1 làm chuỗi thời gian thành có tính dừng thì kí hi u tương ứng là I 1 : z t  y t  y t 1 Nếu sai phân bậc 2 làm chuỗi thời gian có tính dừng thì kí hi u tương ứng là I(2): h t  z t  z t 1  (yt  yt 1 )  (yt 1  yt 2 )  yt  2yt 1  yt 2 1.3.2.5. M hì h ARIMA d t g u t. Mô hình ARIMA là một mô hình dự báo định lượng theo thời gian, giá trị tương lai sẽ phụ thuộc vào xu thế vận động của đối tượng đó trong quá khứ. Mô hình RIM phân tích tính tương quan giữa các dữ li u quan sát để đưa ra m hình dự báo th ng qua các bước nhận dạng m hình, ước lượng các tham số từ dữ li u quan sát và kiểm tra các tham số ước lượng để tìm ra mô hình thích hợp. Mô hình thích hợp này được chọn để dự báo giá trị tương lai. Kết hợp 3 quá trình R p , I d , M q ta thu được m hình RIM p q    d i 1  i .B  1  B  . yt  c  1  i .Bi  .et  i 1 i 1     p,d,q . (1.10) Bộ tham số (p,d,q) này được kiểm nghi m qua độ tin cậy của các giá trị dự đoán. 18 1.4. t uận. Trong chương 1, luận văn đã giới thi u những kiến thức cơ bản về thị trường chứng khoán và trình bày được một số kỹ thuật truyền thống dùng trong lĩnh vực phân tích, dự báo chứng khoán. Tiếp cận theo phương di n phân tích cơ bản với thế mạnh là dự đoán xu hướng và thời điểm đầu tư thích hợp, các nhà nghiên cứu, chuyên gia chứng khoán thường dựa trên vi c phân tích biểu đồ giá, các chỉ báo như M CD, dải băng Bollinger, RSI, roon .. Với cách tiếp cận theo phương di n kỹ thuật phân tích nâng cao thì mô hình hồi quy và m hình RIM được sử dụng rộng rãi hơn trong vi c dự đoán định lượng giá cả chứng khoán. Cả hai cách tiếp cận này đều có ưu điểm riêng và dự đoán được xu thế của thị trường chứng khoán.

- Xem thêm -

Tài liệu Nghiên cứu khai phá dữ liệu và ứng dụng phân tích xu thế thị trường chứng khoán

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất