Một giải pháp để dự báo sự biến động của hệ thống các dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR

Tóm tắt: Bài viết này nhằm xây dựng một giải pháp để dự báo hệ thống dữ liệu

đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR (FINITE

IMPULSE RESPONSE – Mạng đáp ứng xung hữu hạn). Phần ứng dụng dựa vào dữ

liệu trên trang Web của thị trường tài chính Forex. Kết quả cho thấy, việc sử dụng

giải pháp này đã góp phần nâng cao hiệu quả của dự báo.

pdf 9 trang phuongnguyen 5680
Bạn đang xem tài liệu "Một giải pháp để dự báo sự biến động của hệ thống các dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Một giải pháp để dự báo sự biến động của hệ thống các dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR

Một giải pháp để dự báo sự biến động của hệ thống các dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR
Công nghệ thông tin & Cơ sở toán học cho tin học 
Hà Gia Sơn, “Một giải pháp để dự báo sự biến động bằng mạng nơron FIR.” 132 
MỘT GIẢI PHÁP ĐỂ DỰ BÁO SỰ BIẾN ĐỘNG CỦA HỆ THỐNG 
CÁC DỮ LIỆU ĐA CHIỀU PHỤ THUỘC LẪN NHAU THEO CHUỖI 
THỜI GIAN BẰNG MẠNG NƠRON FIR 
Hà Gia Sơn* 
Tóm tắt: Bài viết này nhằm xây dựng một giải pháp để dự báo hệ thống dữ liệu 
đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR (FINITE 
IMPULSE RESPONSE – Mạng đáp ứng xung hữu hạn). Phần ứng dụng dựa vào dữ 
liệu trên trang Web của thị trường tài chính Forex. Kết quả cho thấy, việc sử dụng 
giải pháp này đã góp phần nâng cao hiệu quả của dự báo. 
Từ khóa: Dự báo; Chuỗi thời gian; Dữ liệu đa chiều; Mạng nơron FIR. 
1. ĐẶT VẤN ĐỀ 
Dự báo đó chính là dự kiến, tiên đoán về những sự kiện, hiện tượng, trạng thái nào đó 
có thể hay nhất định sẽ xảy ra trong tương lai. Theo nghĩa hẹp hơn, đó là sự nghiên cứu 
khoa học về những triển vọng của một hiện tượng nào đó. Ở nước ngoài, có nhiều công 
trình nghiên cứu về vấn đề này, đã có một hệ thống lý thuyết gồm nhiều phương pháp, qui 
trình cũng như nhiều mô hình để dự báo tương lai như tài liệu [11]. Tài liệu này đã phân 
tích và thăm dò các yếu tố của chuỗi thời gian, các mô hình của chuỗi thời gian. Trong 
thời gian gần đây, ở trong nước, chúng ta đã có nhiều đề tài các cấp, với những mục đích 
và cách tiếp cận khác nhau về dự báo như các công trình [1-4], [6-7]. 
Hiện tại, xuất hiện nhiều mô hình dự báo có hiệu quả cao, trên thế giới đã bắt đầu áp 
dụng một công cụ mới vào công tác dự báo đó chính là mạng nơ- ron, trong thời gian qua, 
nhiều tác giả đã tiến hành hàng loạt các nghiên cứu tập trung vào việc ứng dụng chúng 
trong việc dự báo các nhân tố, biến số trong các lĩnh vực kinh tế, kỹ thuật như tài liệu [8], 
[10], [12],[13]... và đã đạt được nhiều kết quả khả quan, và họ đi tới kết luận mô hình dự 
báo bằng mạng nơ ron lai ( kết hợp giữa mạng nơ ron và các mô hình dự báo truyền 
thống) như FIR có sự vượt trội hơn mô hình hồi quy tuyến tính truyền thống. Các công 
trình này tuy đã có một số thành công trong những bài toán cụ thể, nhưng còn tồn tại hạn 
chế là chỉ khảo sát bài toán chuỗi thời gian bằng cách dùng các phương pháp dự báo trong 
mô hình chuỗi thời gian có kết hợp với mạng nơron để khảo sát một cột dữ liệu thông 
thường mà chưa tính đến sự ảnh hưởng lần nhau của những yếu tố phụ thuộc khác, các 
công trình này ít đề cập đến việc dự báo một hệ thống dữ liệu đa chiều phụ thuộc lẫn nhau 
theo chuỗi thời gian. Tuy nhiên, trong bài báo [6] đã đưa ra ý tưởng kết hợp giữa các mô 
hình và bài báo [7] đã chỉ rõ phương pháp xác trình tự hồi quy trong dự báo hệ thống dữ 
liệu đa chiều. 
Trên thế giới cũng như ở Việt nam, việc nghiên cứu các giải pháp dự báo biến động của 
hệ thống các dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian thường chỉ áp dụng 
vào một vài bài toán nhất định, chưa được tổng quát hóa, giải pháp thường bằng những 
công cụ về toán học kết hợp với các phần mềm phân tích, chưa chỉ rõ được mối quan hệ 
giữa biến, các cá thể với nhau, cần đòi hỏi về một vài giả thuyêt thống kê hoặc mô hình 
đặc biệt. Với ý định xây dựng một giải pháp hợp lý để dự báo biến động của hệ thống các 
dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơ ron chính là một ý 
tưởng mới, đáp ứng được sự phát triển của thực tế trong vấn đề dự báo. 
Trong bài viết, phần đầu là cơ sở lý thuyết chung về chuỗi thời gian, khái niệm về 
mạng nơ ron FIR, phương pháp phân tích thành phần chính các giải thuật về ứng dụng 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 49, 06 - 2017 133
mạng nơ ron FIR trong dự báo và phát triển phương pháp phân tích thành phần chính để 
xác định trình tự hồi quy, và sử dụng mô hình hồi quy bội để xác định lại các giá trị dự 
báo. Ứng dụng dựa vào dữ liệu trên trang  của thị trường tài 
chính Forex. Kết quả cho thấy, việc kết hợp giữa mạng nơ ron FIR và mô hình hồi quy 
truyền thống lại có kết quả dự báo tốt hơn khi chỉ sử dụng mạng nơ ron. 
2. NỘI DUNG CẦN GIẢI QUYẾT 
2.1. Xây dựng lý thuyết 
2.1.1. Giả thiết ban đầu 
Trong dự báo, số liệu trong quá khứ và hiện tại quyết định xu hướng vận động của các 
hiện tượng trong tương lai. 
2.1.2. Xây dựng giải pháp dự báo hệ thống dữ liệu đa chiều 
2.1.2.1. Bài toán: Hệ thống dữ liệu đa chiều là một ma trận Xnp gồm n hàng ( cá thể ) và p 
cột (biến ) có dạng: 
pnnnn
p
p
pn
xxxt
xxxt
xxxt
X
,2,1,
,22,21,22
,12,11,11
,
............
...............
..........
..........
 (1) 
Trong đó ti là cột thời gian, xij là các tham số biến động theo chuỗi thời gian, hãy xây 
dựng giải pháp để xác định tại thời điểm tn+1, giá trị các tham số xn+1,1, xn+1,2.xn+1,p.. 
2.1.2.2. Giải pháp chung: việc dự báo này chia làm 02 giai đoạn: 
+ Giai đoạn 1: Trong môi trường dự báo có ba thời đoạn được quan tâm. Đầu tiên, 
người khảo sát sử dụng dữ liệu trong thời đoạn n1 đến n2 để ước lượng một hoặc một vài 
mô hình. Các thời đoạn từ n2+ 1 đến n3 , trong đó, giá trị thực tế của Y đều đã biết; và thời 
đoạn n3+1 trở đi trong đó các giá trị của Xs và Y đều chưa biết. Các giá trị dự báo được tạo 
ra cho thời kỳ từ n2+1 đến n3 được gọi là các giá trị dự báo kiểm định, và các giá trị dự báo 
được tạo ra cho thời kỳ từ n3+1 trở đi được gọi là các giá trị dự báo tiên nghiệm. 
 Hình 1. Các thời đoạn dự báo trong mẫu, kiểm định và tiên nghiệm. 
Đầu tiên, ta phải dự báo từng cột của bảng dự liệu này. Theo [9], người ta thường dùng 
phương pháp dự báo chuỗi thời gian sử dụng các mô hình tự hồi quy. Mô hình chuỗi thời 
gian tự hồi quy hoàn toàn có cấu trúc như sau: 
Yt = α1Yt-1+ α2Yt-2 +  + αpYt-p+ ut (2) 
Trong đó Yt là quan sát thứ t đối với biến phụ thuộc và ut là thành phần sai số. Các mô 
hình thường gặp là mô hình trung bình trượt (MA – Moving Average): 
Yt = νt – β1νt-1– β2 νt-2– – βq νt-q (3) 
Nhưng mô hình thường áp dụng để dự báo trong chuỗi thời gian là mô hình ARMA 
(Autoregressive Moving Average), phối hợp giữa các công thức tự hồi quy và trung bình 
trượt tạo ra mô hình ARMA. Do đó, mô hình ARMA (p, q) có dạng tổng quát: 
Yt = α1Yt-1+ α2Yt-2 +  + αpYt-p+ ut + νt – β1νt-1– β2 νt-2– – βq νt-q ( 4) 
Công nghệ thông tin & Cơ sở toán học cho tin học 
Hà Gia Sơn, “Một giải pháp để dự báo sự biến động bằng mạng nơron FIR.” 134 
- Để đánh giá mô hình người ta sử dụng nhiều tiêu chuẩn nhưng đơn giản và phổ biến 
nhất là tiêu chuẩn ME (sai số tuyệt đối trung bình, nhiều tài liệu, có thể ký hiệu là MAE), 
cụ thể: 

n
i
ii yy
n
MAE
1
1 (5) 
Trong đó, iy và iy

 lần lượt là giá trị thực tế và giá trị dự báo của mô hình hồi quy và 
chọn mô hình nào có giá trị MAE thấp. Tuy nhiên, để tăng thêm độ chính xác, ở giai đoạn 
này, ta sẽ sử dụng mạng nơron FIR kết hợp với mô hình ARMA để dự báo cho từng cột. 
+ Giai đoạn 2: Theo [7], trong hệ thống dữ liệu đa chiều, sự phát triển của cột này sẽ 
ảnh hưởng tích cực hay tiêu cực tới sự phát triển của cột khác, chính vì vậy, khi dự báo 
xong một cột bất kỳ, phải tính tới sự ảnh hưởng của các cột khác tới nó. Chính vì vậy, cần 
phải đưa ra được trình tự để hồi quy, nếu không sẽ dẫn tới việc kết quả dự báo sẽ thiếu 
chính xác. Sau đó, dùng tiếp mô hình hồi quy bội để tìm sự liên quan giữa các biến (các 
cột) trong bảng với nhau để xác định lại các giá trị dự báo, nghĩa là liên hệ biến phụ thuộc 
Y cho trước với nhiều biến độc lập X1, X2, ..., Xn. Công thức tổng quát như sau: 
Y=  X1 X2 + X3+.nXn +n+1Yt (6) 
2.1.2.3. Sử dụng mạng nơron FIR để dự báo từng cột (biến) 
+ Mạng nơ ron: Mạng nơron nhân tạo, gọi tắt là mạng nơron, là một mô hình xử lý 
thông tin phỏng theo cách thức của các hệ nơron sinh học. Nó được tạo nên từ một số 
lượng lớn các nơron kết nối với nhau thông qua các liên kết (gọi là trọng số liên kết) làm 
việc như một thể thống nhất để giải quyết một vấn đề cụ thể nào đó. (hình 2). 
Hình 2. Mạng nơron truyền thẳng. 
Hình trái là một tế bào nơron và bên phải là mạng truyền thẳng. 
Xét một tế bào nơron duy nhất được trích từ lớp l của một mạng L lớp. Đầu vào lix 
tới nơron sẽ được nhân với 1 hệ số lijw gọi là trọng số đại diện cho các kết nối khớp thần 
kinh giữa nơron i trong lớp trước đó và nơron j trong lớp l. Và đầu ra của nơron 1 ljx là 
một hàm sigmoid là tổng trọng số đầu vào của nó: )(1  
i
l
i
l
i
l
j xwfx (7) 
- Mạng nơron FIR: theo [6], trong tế bào nơron cơ bản của mạng này, khớp tĩnh thay 
bằng một bộ lọc tuyến tính FIR. Bộ lọc FIR cơ bản nhất có thể được mô hình hóa với một 
đường trễ phân nhánh như minh họa trong hình 3. Trong bộ lọc này, đầu ra y(k) sẽ tương 
ứng với tổng trọng số giá trị trễ của đầu vào. 

T
n
nkxnwky
0
)()()( (8) 
Điều này tương ứng với các thành phần trung bình trượt của mô hình tự hồi quy 
(ARMA-công thức 4). Bộ lọc FIR, trên thực tế, là một trong số mạng nơron tốt nhất có 
phần tử thích nghi cơ bản để áp dụng vào mô hình ARMA này. 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 49, 06 - 2017 135
Hình 3. Mô hình bộ lọc FIR. 
Đầu ra )(1 kxlj
 của lớp l tại thời điểm k bây giờ được tính bằng hàm sigmoid của tổng 
của tất cả các kết quả đầu ra l của bộ lọc cung cấp cho nơron: 
))(.()( ,
1 kxwfkx li
i
l
ji
l
j  (9) 
Hình 4. Nơron FIR và mạng nơron FIR. 
2.1.2.4. Phương pháp phân tích thành phần chính để xác định sự phụ thuộc và trình tự hồi 
quy giữa các cột biến 
+ Phương pháp chung: mục đích của kỹ thuật này là rút ra thông tin chủ yếu chứa 
trong bảng dữ liệu bằng cách xây dựng một biểu diễn đơn giản hơn, sao cho đám mây số 
liệu thể hiện rõ nhất, mà thông tin không sai lạc. Theo [5], ta có bảng số liệu: 
pnnn
p
p
pn
xxx
xxx
xxx
X
,2,1,
,22,21,2
,12,11,1
,
............
...............
..........
..........
Trong đó, xi,j là giá trị mà biến Xj (với j = p,1 ) nhận trên cá thể i (với i= n,1 ). Để biết 
mối quan hệ giữa các biến, giữa các cá thể cần chuyển chung qua không gian con với số 
chiều ít hơn. Bài báo [7] đã nêu 7 bước tiến hành gồm quy tâm bảng số liệu; Tính ma trận 
phương sai- hiệp phương sai; tìm các giá trị riêng: pq  .........21 ; Tìm trục 
chính hình chiếu của cá thể i trên trục chính j; Tìm thành phần chính; Tái lập các điểm – 
biến. Bài báo [7] cũng đã đưa ra giải thuật xác định trình tự hồi quy trong dự báo dữ liệu 
đa chiều, ý tưởng của giải thuật này là: 
Giả sử ta đã có tất cả các hình chiếu của các biến trên thành phần chính, khi đó, theo 
[5] (tr. 103), nếu coi biến Xi là biến cần giải thích và biến Xk là biến giải thích thì Xk tác 
động vào Xi khi và chỉ khi góc giữa 2 véc tơ Xk, Xi nhỏ hơn hoặc bằng 90
0 và 
iX > kX ( iX , kX - Độ dài của véc tơ Xi và Xk). Lúc này, ta đã biết được tọa độ 
của các véc tơ nên có thể xác định được chúng theo công thức: 
 22 iii yxX (10) 
Công nghệ thông tin & Cơ sở toán học cho tin học 
Hà Gia Sơn, “Một giải pháp để dự báo sự biến động bằng mạng nơron FIR.” 136 
( xi, yi là tọa độ của Xi trên mặt phẳng tạo bởi 2 trục chính). Góc giữa 02 véc tơ Xk, Xi 
được xác định bởi công thức: 
2222 .
),(
kkii
kiki
ki
yxyx
yyxx
XXCos
 (11) 
Vì thế, để xác định trình tự hồi quy là dùng phương pháp phân tích thành phần chính để 
đưa các biến (các cột) về 1 mặt phẳng của 02 thành phần chính, sau đó, sắp xếp theo độ 
lớn của các biến và xem xét các góc giữa 02 biến để phân tích sự liên quan giữa chúng, khi 
đó, giả sử như biến Xi là biến cần giải thích, ta sẽ tìm được các biến Xk1, Xk2Xkn giải 
thích cho biến Xi, sử dụng kết quả dự báo và ứng dụng phương pháp hồi quy bội để tìm 
tiếp các giá trị dự báo mới. Lập lại như vậy cho tới khi hết bảng dữ liệu. 
2.1.2.5. Sử dụng phương pháp hồi quy bội để dự báo lại kết quả của từng cột (biến) 
Gọi Yt là giá trị thực tại thời điểm t của biến phụ thuộc và Xt1, Xt2, ..., Xtk là các giá trị 
dự báo của các cột tương ứng được tạo ra bởi mạng nơron FIR. Phương pháp đương nhiên 
là tạo ra giá trị trung bình có trọng số của các giá trị dự báo này. Do vậy, giá trị dự báo kết 
hợp sẽ là: ft= ikkii XXX ,,33,221
ˆ...ˆˆˆ  (12) 
Trong đó, 1ˆ , 2ˆ , kˆ là các hệ số - trọng số cần xác định. 
Gọi Yi là giá trị thực tế tại thời điểm i, vậy sai số ei của dự báo so với kết quả kỳ vọng 
sẽ tiến tới 0, cụ thể như sau: 
 ei = Yi – fi = Yi - ikkii XXX ,,33,221
ˆ...ˆˆˆ  0 (13) 
Áp dụng công thức 5 cho ei , sử dụng phương pháp bình phương tối thiểu, ta được biểu 
thức sau: 
2n
1i
i,kki,33i,221i
n
1i
2
i X
ˆ...XˆXˆˆYe 
    
 đạt cực tiểu . (14) 
Trong đó, X1,1, X1,2, ..Xi,j là các giá trị dự báo của các mô hình đã biết. Khai triển 
(14) và giải hệ phương trình ta sẽ có được các trọng số 1ˆ , 2ˆ , kˆ cần xác định. 
2.2. Ví dụ ứng dụng 
2.2.1. Dữ liệu ứng dụng 
Trong ví dụ này, tác giả lấy dữ liệu về giá vàng bán ra ở trang web trang 
 của thị trường tài chính Forex (Foreign Exchange ), đây là thị 
trường tài chính lớn nhất thế giới. Bảng dữ liệu bao gồm 3 cột là giá mở cửa, giá cao nhất 
và thấp nhất (vì giá vàng luôn biến động trong ngày). Dữ liệu bắt đầu từ ngày 10/12/2006 
tới ngày 11/11/2016, gồm 2580 trường hợp. Bảng này và kết quả dự báo khi áp dụng mạng 
nơ ron FIR được tác giả đưa lên trang Mediafile theo địa chỉ : 
Dữ liệu ở dạng bảng: 
Bảng 1. Dữ liệu và kết quả dự báo bằng mạng nơron FIR. 
SỐ LIỆU GỐC KẾT QUẢ DỰ BÁO BẰNG FIR 
TT Ngày Lúc mở Cao nhất Thấp nhất Lúc mở Cao nhất Thấp nhất 
1 10/12/2006 575.00 575.00 575.00 1197,865 1204,764 1190,317 
2 10/13/2006 585.50 585.50 585.50 1197,865 1204,764 1190,317 
.        
2580 11/11/2016 1260.55 1264.85 1226.00 1283,848 1304,886 1257,861 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 49, 06 - 2017 137
Ở phần 2.1.2.2 (giải pháp chung), tác giả đã khái quát quá trình dự báo gồm 2 giai 
đoạn, giai đoạn dự báo từng cột (bằng mạng nơ ron FIR) và giai đoạn xem xét các tác 
động lần nhau giữa các cột để hồi quy và xác định chính xác lại giá trị đã dự báo. 
2.2.2. Xây dựng mạng nơron FIR để dự báo 
Dữ liệu huấn luyện là tập các cặp (Xh, Dh), Xh trong đó, là thông số giá vàng lúc mở, 
lúc cao nhất và thấp nhất của ngày h, Dh là thông số giá vàng của ngày h+1. Tức là Dh 
=Xh 1 . Sau khi huấn luyện mạng nơron nhiều lần với L mẫu huấn luyện như thế thì mạng 
nơron có thể đã nắm được quy luật biến đổi của giá vàng. Quá trình huấn luyện thực hiện 
theo thuật toán lan truyền ngược. Các thông số huấn luyện như sau: 
Bảng 2. Các thông số của mạng FIR. 
TT Tên thông số Giá 
trị 
TT Tên thông số Giá trị 
1. Số lượng nơ-ron đầu vào 1 5. Số mẫu trong thời kỳ ước lượng 1-1299 
2. Số lượng nơ-ron đầu ra 1 6. Số mẫu trong thời kỳ kiểm định 1300-1499 
3. Số lượng lớp ẩn 2 7. Số mẫu để kiểm tra tiên nghiệm 1499-2538 
4. Số lượng nơ-ron ẩn 3x4 
Sau đây là hình vẽ dữ liệu ở các thời kỳ của các cột 1 (giá mở cửa), 2 (giá thấp nhất 
trong ngày) và 3 (giá cao nhất trong ngày) từ trên xuống, I- Toàn vùng dữ liệu, II- Thời 
kỳ ước lượng dự báo trong mẫu, III- Dự Báo Kiểm định, IV- Dự báo Tiên nghiệm) 
Hình 4. Biểu đồ các giai đoạn của các cột giá mở, giá cao nhất và giá thấp nhất. 
Sau khi dự báo bằng mạng nơron FIR, MAE của các cột như sau: 
I II III IV 
I II III IV 
I II III IV 
Công nghệ thông tin & Cơ sở toán học cho tin học 
Hà Gia Sơn, “Một giải pháp để dự báo sự biến động bằng mạng nơron FIR.” 138 
Bảng 3: trình tự hồi quy. 
cot dodai cotpt 
3 0,999642021 2 
2 1 
1 1 3 
Bảng 1. Thông số MAE của giá mở, giá cao nhất và thấp nhất. 
TT MAE Giá mở (cột 1) Giá cao nhất (cột 2) Giá thấp nhất (cột 3) 
1. MAE toàn bộ 15,525 15,338 14,647 
2. MAE miền tiên nghiệm 13,044 13,422 9,977 
So sánh hiệu quả của FIR với phương pháp dự báo chuỗi thời gian sử dụng mô hình 
ARIMA: 
Đầu tiên, ta dùng 1499 trường hợp 
đầu tiên của giá vàng lúc mở cửa để dự 
báo các trường hợp tiếp theo, sau khi 
chạy chương trình dự báo ARIMA, ta 
có bảng 2 so sánh giữa FIR và ARIMA, 
ta thấy MAE của FIR quá nhỏ so với 
ARIMA, từ đó ta rút ra kết luận FIR có 
hiệu quả dự báo tốt hơn rất nhiều so với 
ARIMA. 
Dữ liệu để tại đường dẫn : 
2.2.3. Sử dụng mô hình hồi quy bội để xác định lại 
các giá trị dự báo 
+ Sử dụng phương pháp phân tích thành phần 
chính để xác định chính xác trình tự hồi quy của các 
cột: Sử dụng thuật toán của bài báo [7], ta sẽ tính 
toán được bảng 3. Ở đây, ta lấy cột 1 (giá mở cửa) là 
cột đơn vi, qua bảng trên, ta thấy, cột 3 phụ thuộc cột 
2, cột 1 lại phụ thuộc cột 3. Đó chính là trình tự hồi quy mà ta phải xác định. 
+ Sử dụng mô hình hồi quy bội xác định lại các giá trị dự báo: Xét hồi quy bội 
cho cột 3: vì trường hợp này có 2 cột (biến) tác động vào cột này, đó là cột 2 (giá cao 
nhất) và kết quả dự báo bằng FIR của chính cột 3 (giá thấp nhất), vậy cần xác định 3 
trọng số 1 2 3, ,   bằng việc triển khai biểu thức (14) để qui về việc giải các hệ 3 
phương trình 3 ẩn: 
 0ˆˆˆ2
0ˆˆˆ2
0ˆˆˆ2
1
,3,33,221
1
2
,2
1
,33,221
2
1
2
1
,33,221
1
1
2












n
i
iiii
k
n
i
i
i
n
i
iii
n
i
i
n
i
iii
n
i
i
XXXY
e
XXXY
e
XXY
e






 (15) 
Đặt 
n
X
X
n
i
i
 1
2,
2
, 
n
X
X
n
i
i
 1
3,
3
, 
n
Y
Y
n
i
i
 1 (16) 
XXx ii ,2,2 , XXx ii ,3,3 và YYy ii , ta sẽ xác định được 1ˆ , 2ˆ , 3ˆ : 
33221 X
ˆXˆYˆ    (17) 
Bảng 2. So sánh MAE của FIR và ARIMA. 
MAE của Giá FIR ARIMA 
Giá mở 13,044 1066,87 
Giá cao nhất 13,422 991,48 
Giá thấp nhất 9,977 834,31 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 49, 06 - 2017 139
2
1
,3,2
1
2
1
2
1
,3,2
1
,3
1
2
1
,2
2
,3,2
,3
ˆ


n
i
ii
n
i
n
i
n
i
ii
n
i
ii
n
i
n
i
ii
xxxx
xxxyxxy
ii
i

 (18) 
2n
1i
i,3i,2
n
1i
2
n
1i
2
n
1i
i,3i,2
n
1i
i,2i
n
1i
2
n
1i
i,3i
3
xxxx
xxxyxxy
ˆ
i,3i,2
i,2
 


 (19) 
Thay các giá trị này vào phương trình (6) ta sẽ có giá trị dự báo mới cho cột 3 (giá thấp 
nhất). Lấy số mẫu trong thời kỳ ước lượng, số mẫu trong thời kỳ kiểm đinh, số mẫu để 
kiểm tra tiên nghiệm như bảng 3 ta thấy : 1ˆ = -2.137, 2ˆ = 0.303, 3ˆ = 0.675, ta sẽ tính 
được MAE của miền kiểm định là 47.87. Tuy nhiên, MAE của FIR trong miền này lại rất 
nhỏ (18.497), vậy, không nên lấy giá trị mới làm giá trị dự báo mà giữ nguyên giá trị của 
FIR. Điều này chứng tỏ, các mạng nơ ron lai như FIR có khả năng dự báo rất hiệu quả, 
trong quá trình dự báo, nó đã có thể tự học, tự xác định được yếu tố tác động từ bên ngoài 
vào cột kết quả dự báo. Làm tương tự cho cột 1, sẽ có giá trị dự báo mới của cột giá mở 
cửa, 1ˆ = 2.516, 2ˆ = 0.605, 3ˆ = 0.386 nhưng giá trị MAE của miền kiểm định nhỏ hơn 
MAE của FIR, nên ta chọn giá trị mới làm giá trị dự báo, kết quả MAE của giá trị mới 
trong miền kiểm tra tiên nghiệm là 10.693 nhỏ hơn rất nhiều so với MAE của FIR là 13.04 
trong miền này. Vì khi dự báo ta còn giai đoạn kiểm định mô hình, nếu việc hồi quy không 
mạng lại kết quả tốt hơn thì vẫn có quyền lựa chọn lại kết quả mà FIR đã dự báo ( như 
trường hợp của giá thấp nhất ). Còn trong trường hợp của giá mở, hồi quy lại mang đến 
kết quả tốt hơn, nên việc sử dụng hồi quy bội để xác định lại kết quả là việc phải làm khi 
ta muốn dự báo hệ thống dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian. 
3. KẾT LUẬN 
Trong nghiên cứu thực tế, quy trình phổ biến được các nhà phân tích chấp nhận là các 
biến độc lập với nhau. Tuy nhiên, thực tế chúng lại có tác động lên nhau. Bài báo này đã 
tổng hợp được các tài liệu để có cái nhìn tổng quan về dự báo, đưa ra khả năng dự báo 
vượt trội của FIR so với các mô hình thông thường, đưa ra giải pháp kết hợp với mạng 
nơron FIR với phương pháp phân tích thành phần chính và hồi quy bội để nâng cao chất 
lượng dự báo và cũng đã chứng minh việc xác định trình tự hồi quy và xác định lại giá trị 
sau khi dự báo là quy trình cần thiết . Trong khuôn khổ bài báo, tác giả mới chỉ nêu được 1 
ví dụ minh họa, vì vậy, đây chính là một hướng nghiên cứu mở, có thể tiếp tục phát triển 
các giải thuật phối hợp các mô hình khác để nâng cao hiệu quả dự báo. 
Lời cảm ơn: Tác giả xin chân thành cám ơn tập thể cán bộ, nhân viên Viện CNTT, và đặc biệt 
là 02 TS Ngô Trọng Mại và Tôn Thiện Chiến đã giúp đỡ tận tình về mặt ý tưởng cũng như khi thực 
hiện chi tiết bài báo. 
TÀI LIỆU THAM KHẢO 
[1]. Đỗ Quang Giám, Vũ Thị Hân (2012), “Xây dựng mô hình Arima cho dự báo khách du 
lịch quốc tế đến Việt nam”, Tạp chí Khoa học và Phát triển: Tập 10, số2: 364 - 370, 
Trường ĐH Nông nghiệp Hà Nội. 
[2]. Nguyễn Trung Hòa (2007), “Một số thuật toán mô phỏng và phân tích chuỗi thời 
gian” – Luận án Tiến sỹ Toán ứng dụng, trường ĐHBK Hà Nội , Hà Nội 
[3]. Nguyễn Khắc Hiếu, (2014). "Mô hình ARIMA và dự báo lạm phát 6 tháng cuối năm 
2014" . Tạp chí Kinh tế và Dự báo số 16, tháng 8-2014 . 
[4]. Phạm Văn Khánh (2008) , “Phân tích thống kê dự báo và mô phỏng một số chuỗi thời 
gian ”, Luận án Tiến sỹ Toán ứng dụng , ĐH Quốc gia Hà Nội, Hà Nội. 
Công nghệ thông tin & Cơ sở toán học cho tin học 
Hà Gia Sơn, “Một giải pháp để dự báo sự biến động bằng mạng nơron FIR.” 140 
[5]. Tô Cẩm Tú, Nguyễn Huy Hoàng, “Phân tích số liệu nhiều chiều”, Nhà xuất bản Khoa 
học và Kỹ thuật 
[6]. Hà Gia Sơn, “Một giải pháp phối hợp mô hình trong dự báo”, Tạp chí Nghiên cứu 
Khoa học và Công nghệ quân sự, số 39, tháng 10 năm 2015, tr 82-89. 
[7]. Hà Gia Sơn, “Xác định trình tự hồi quy trong việc dự báo dữ liệu đa chiều”, Tạp chí 
Nghiên cứu Khoa học và Công nghệ quân sự, số 45, tháng 10 năm 2016, tr 99-108. 
[8]. Eric A Wan (2004), “Finite Impulse Response Neural Net works for Autoregressive 
Time Series Prediction” - To appear in Proceedings of the NATO A dvanced 
Workshop on Time Series Prediction and Analysis, (San te Fe, NM, May 14-17 
2003), Ed. b y A. Weigend and N. Gershenfeld, Addison-Wesley) 
[9]. Eric A Wan (2004), “Finite Impulse Response Neural Networks With Application In 
Time Series Prediction” - A dissertation submitted to the department of electrical 
engineering and the committee on graduate studies of stanford university in partial 
fulfillment of the requirements for the degree of doctor of philosophy. 
[10]. Eric A Wan (2014), “Combining fossil and sunspot data: committee predictions”, 
https://www.researchgate.net/publication/3705502. 
[11]. N.Gujarati (2004), “Basic Econometrics”, Fourth Edition - The McGraw − Hill 
Companies. 
[12]. Tao Lei, Regina Barzilay and Tommi Jaakkola, “Rationalizing Neural Predictions”, 
Proceedings of the 2016 Conference on Empirical Methods in Natural Language 
Processing, pages 107–117, Austin, Texas, November 1-5, 2016 
[13]. Valipour, M., Banihabib, M. E., & Behbahani, S. M. R. “Comparison of the ARMA, 
ARIMA, and the autoregressive artificial neural network models in forecasting the 
monthly inflow of Dez dam reservoir”. Journal of Hydrology, 433-441. 2013 
ABSTRACT 
AN ALGORITHM TO FORECAST CHANGES OF MUTUAL DEPENDANT ON TIME 
SERIES MULTIDIMENTIONAL DATA SYSTEM USING FIR NEURAL NETWORKS 
The goal of this paper is an establishment of algorithm to predict the reciprocal-
dependant multi-dimension data system on time series through a FIR neural 
network. Applications of the algorithm are based on data from the web of Forex 
financial market. The result of applications shows the advanced effect of this 
prediction. 
Keywords: Prediction; Time Series; FIR network; Algorithm. 
Nhận bài ngày 17 tháng 1 năm 2017 
Hoàn thiện ngày 16 tháng 6 năm 2017 
Chấp nhận đăng ngày 20 tháng 6 năm 2017 
Địa chỉ: Trường Đại học Công nghiệp Việt-Hung; 
 *Email: hagiason@gmail.com 

File đính kèm:

  • pdfmot_giai_phap_de_du_bao_su_bien_dong_cua_he_thong_cac_du_lie.pdf