Cải biên thuật toán bậc cao của Singh và ứng dụng trong dự báo chuỗi thời gian

TÓM TẮT

Mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự

báo của các phương pháp đề xuất còn chưa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao

hơn và thuật toán đơn giản hơn đang là một ưu tiên. Trong những năm gần đây một số công trình

đã được hoàn thành theo hướng nâng cao độ chính xác và giảm khối lượng tính toán trong mô hình

chuỗi thời gian mờ như các công trình của Chen và Hsu, Huarng, Singh,. Một cách tiếp cận khác

cho mô hình chuỗi thời gian mờ là sử dụng những kỹ thuật khác trong khai phá dữ liệu như phân

cụm, mạng nơ ron, để xây dựng mô hình. Ngoài ra còn có thể sử dụng các thuật toán bậc cao dự

báo. Singh [10] đã đề xuất một thuật toán như vậy.

Trong bài báo này, chúng tôi cải tiến thuật toán bậc cao của Singh cho mô hình chuỗi thời gian mờ.

Cải tiến này đã cho thấy hiệu quả được tăng lên rõ rệt thông qua các tính toán số cho chuỗi thời gian.

Từ khóa: Chuỗi thời gian mờ, biến ngôn ngữ, mối quan hệ mờ

pdf 8 trang phuongnguyen 2160
Bạn đang xem tài liệu "Cải biên thuật toán bậc cao của Singh và ứng dụng trong dự báo chuỗi thời gian", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Cải biên thuật toán bậc cao của Singh và ứng dụng trong dự báo chuỗi thời gian

Cải biên thuật toán bậc cao của Singh và ứng dụng trong dự báo chuỗi thời gian
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 59 
CẢI BIÊN THUẬT TOÁN BẬC CAO CỦA SINGH VÀ ỨNG DỤNG 
TRONG DỰ BÁO CHUỖI THỜI GIAN 
Nguyễn Công Điều1, Trần Thanh Thương2* 
1Viện Công nghệ thông tin - VAST, 2Đại học Thái Nguyên 
TÓM TẮT 
Mô hình chuỗi thời gian mờ đang có nhiều ứng dụng trong công tác dự báo. Tuy nhiên kết quả dự 
báo của các phương pháp đề xuất còn chưa cao. Do đó việc tìm tòi các mô hình có độ chính xác cao 
hơn và thuật toán đơn giản hơn đang là một ưu tiên. Trong những năm gần đây một số công trình 
đã được hoàn thành theo hướng nâng cao độ chính xác và giảm khối lượng tính toán trong mô hình 
chuỗi thời gian mờ như các công trình của Chen và Hsu, Huarng, Singh,... Một cách tiếp cận khác 
cho mô hình chuỗi thời gian mờ là sử dụng những kỹ thuật khác trong khai phá dữ liệu như phân 
cụm, mạng nơ ron, để xây dựng mô hình. Ngoài ra còn có thể sử dụng các thuật toán bậc cao dự 
báo. Singh [10] đã đề xuất một thuật toán như vậy. 
Trong bài báo này, chúng tôi cải tiến thuật toán bậc cao của Singh cho mô hình chuỗi thời gian mờ. 
Cải tiến này đã cho thấy hiệu quả được tăng lên rõ rệt thông qua các tính toán số cho chuỗi thời gian. 
Từ khóa: Chuỗi thời gian mờ, biến ngôn ngữ, mối quan hệ mờ 
MỞ ĐẦU 
Chuỗi thời gian mờ và mô hình chuỗi thời 
gian mờ bậc nhất do Song và Chissom [4]-[6] 
phát triển từ năm 1993. Sau công trình này, 
một loạt các bài báo của nhiều tác giả khác 
nhau tiếp tục dựa trên ý tưởng này để dự báo 
chuỗi thời gian và ứng dụng trong nhiều lĩnh 
vực khác nhau như dự báo dân số, tài chính, 
nhiệt độ, nhu cầu điện, vv... Gần đây có rất 
nhiều tác giả liên tục cải tiến mô hình chuỗi thời 
gian mờ để dự báo đạt kết quả chính xác hơn. 
Chen [7] đã đưa ra phương pháp mới đơn 
giản và hữu hiệu hơn so với phương pháp của 
Song và Chissom bằng cách sử dụng các phép 
tính số học thay vì các phép tính hợp max-
min phức tạp trong xử lý mối quan hệ mờ. 
Phương pháp của Chen cho hiệu quả cao hơn về 
mặt sai số dự báo và độ phức tạp của thuật toán. 
Nhiều công trình tiếp theo đã sử dụng cách tiếp 
cận này để dự báo cho chuỗi thời gian. 
Một trong các hướng được phát triển là sử 
dụng mối quan hệ mờ bậc cao trong mô hình 
chuỗi thời gian mờ. Singh [10] đã đưa ra một 
thuật toán mới khá đơn giản để dự báo số 
lượng sinh viên nhập học và sản lượng mùa 
màng trong nông nghiệp bằng cách sử dụng 
 Tel: 0944550008; Email: thuong.cym@gmail.com 
sai phân các thông số như là mối quan hệ mờ 
để dự báo. Phát triển tiếp tục theo hướng sử 
dụng các thuật toán đơn giản để dự báo, 
trong [10] Singh đã sử dụng thuật toán này 
cho mô hình chuỗi thời gian mờ bậc cao. 
Trong bài báo này, chúng tôi cải tiến thuật 
toán bậc cao của Singh nhằm tăng mức độ 
chính xác của dự báo. 
MỘT SỐ KHÁI NIỆM 
Trong phần này, chúng ta sẽ sử dụng khái 
niệm và phương pháp dự báo của chuỗi thời 
gian mờ được Song và Chissom [4]-[6] phát 
triển và được Chen [7] cải tiến để xây dựng 
thuật toán dự báo cho chuỗi thời gian. 
Giả sử U là không gian nền: U = u1,u2,....,um. 
Tập A là mờ trên không gian nền U nếu A 
được xác định bởi hàm: A : U [0.1] 
A được gọi là hàm thuộc (Membership 
function). Còn với bất kỳ một phần tử u nào 
của A thì hàm A (u) được gọi là độ thuộc 
của u vào tập mờ A. 
Tập mờ A trên không gian nền U được viết 
như sau: 
Một số định nghĩa sau liên quan đến chuỗi 
thời gian mờ [5]. 
n
nAAA
u
u
u
u
u
u
A
)(
...
)()(
2
2
1
1  
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 60 
Định nghĩa 1: Y(t) (t =...0,1,2,...) là một tập 
con của R1. Y(t) là tập nền trên đó xác định 
các tập mờ fi(t). F(t) là tập chứa các tập fi(t) 
(i = 1,2,...). Khi đó ta gọi F(t) là chuỗi thời 
gian mờ xác định trên tập nền Y(t). 
Định nghĩa 2: Tại các thời điểm t và t-1 có tồn 
tại một mối quan hệ mờ giữa F(t) và F(t-1) sao 
cho F(t) = F(t-1) * R(t-1, t) trong đó * là ký 
hiệu của một toán tử xác định trên tập mờ. 
R(t-1, t) là mối quan hệ mờ. Ta cũng có thể ký 
hiệu mối quan hệ mờ giữa F(t) và F(t-1) bằng 
F(t-1) F(t).Nếu đặt F(t-1) = Ai và F(t) = Aj 
thì ta ký hiệu mối quan hệ logic mờ giữa 
chúng như sau: Ai Aj. 
Định nghĩa 3: 
Giả sử F(t) suy ra từ F(t-1) và F(t) = F(t-1) * 
R(t-1, t) cho mọi t. Nếu R(t-1, t) không phụ 
thuộc vào t thì F(t) được gọi là chuỗi thời 
gian mờ dừng, còn ngược lại ta có chuỗi thời 
gian mờ không dừng. 
Định nghĩa 4: 
Giả sử F(t) suy đồng thời từ F(t-1), F(t-2),, 
F(t-m) m>0 và là chuỗi thời gian mờ dừng. 
Khi đó mối quan hệ mờ có thể viết được F(t-1), 
F(t-2),, F(t-m) F(t) và gọi đó là mô hình 
dự báo bậc m của chuỗi thời gian mờ. 
THUẬT TOÁN BẬC CAO CỦA SINGH 
Singh đã phát triển các phương thức tính toán 
để tìm ra một phương pháp tiếp cận tốt hơn 
nhằm khắc phục những nhược điểm của hiện 
tại của mô hình chuỗi thời gian mờ bậc cao. 
Sự đơn giản của phương pháp này nằm ở chỗ 
sử dụng sự sai phân để thay thế cho sự tính 
toán phức tạp trong quan hệ logic mờ. 
Phương pháp của Singh như sau: 
Bước 1: Xác định tập nền. Tập nền U được 
xác định như sau: lấy giá trị lớn nhất fmax và 
nhỏ nhất fmin của chuỗi thời gian và U =[fmin-
f1, fmax+f2] trong đó f1,f2 là những giá trị 
dương nào đó. 
Bước 2: Chia đoạn U thành m khoảng con 
bằng nhau u1, u2,...um. 
Bước 3: Xây dựng các tập mờ Ai tương ứng 
với các khoảng con như trong trong bước 2 và 
sử dụng các hàm thuộc tam giác cho mỗi 
khoảng con của phép chia. 
Bước 4: Mờ hoá các giá trị của chuỗi thời 
gian và thiết lập mối quan hệ mờ theo quy 
tắc: nếu Ai là giá trị mờ hoá tại thời điểm t và 
Aj là giá trị mờ hoá tại thời điểm tiếp theo t+1 
thì ta có mối quan hệ mờ Ai Aj như tại 
Định nghĩa 2. Ai là trạng thái hiện thời còn Aj 
là trạng thái tiếp theo. 
Bước 5: Tính toán và dự báo dựa trên các mối 
quan hệ mờ được thiết lập 
Thiết lập mối quan hệ mờ của các bậc khác 
nhau như đưa ra dưới đây: 
(i) Nếu cho thời điểm t - 2, t - 1 và t , giá trị 
chuỗi thời gian được mờ hóa tương ứng là 
Ai1, Ai và Aj, khi đó có mối quan hệ mờ bậc 2 
như sau: Ai1, Ai → Aj. 
(ii) Nếu cho thời điểm t - 3, t - 2, t - 1 và t, 
giá trị chuỗi thời gian được mờ hóa tương ứng 
là Ai2, Ai1, Ai và Aj, khi đó có mối quan hệ 
mờ bậc 3 như sau: Ai2, Ai1, Ai → Aj. 
(iii) Tương tự như vậy nếu cho thời điểm t - 
4, t - 3, t - 2, t - 1 và t, giá trị chuỗi thời gian 
được mờ hóa tương ứng là Ai3, Ai2, Ai1, Ai và 
Aj, khi đó có mối quan hệ mờ bậc 3 như sau: 
Ai3, Ai2, Ai1, Ai → Aj. 
Theo cách tương tự chúng ta có thể xác định 
được các cao hơn nhiều như: bậc năm, bậc 
sáu, bậc bảy, bậc tám và các mối quan hệ mờ 
tương ứng. 
Tính toán các tham số dn, n = 2, 3, 4,. . . của 
các bậc khác nhau: 
(i) khảo sát một toán tử khác d2 yi = |yi | và 
được định nghĩa là 
d
2
 Ei = |Ei - Ei -1| 
d
3
 Ei = |d
2
Ei - d
2
Ei -1| 
d
4
 Ei = |d
3
Ei – d3Ei -1| 
d
5
 Ei = |d
4
Ei – d4Ei -1| 
d
6
 Ei = |d
5
Ei – d5Ei -1| 
d
7
 Ei = |d
6
Ei – d6Ei -1| 
d
n
 Ei= |d
n-1
Ei – dn-1Ei -1| 
Do đó, d3 Ei= ||Ei - Ei -1| - |Ei -1 - Ei -2 || and 
d
4
Ei= |||Ei - Ei -1| -| Ei -1 - Ei -2 || - ||Ei -1 - 
Ei -2| - |Ei -2 - Ei -3 ||| and d
5
Ei = ||||Ei– Ei–1| 
– |Ei–1– Ei–2||– ||Ei–1– Ei–2 | – |Ei–2– Ei–3 
||| - |||Ei–1– Ei–2 | – |Ei–2– Ei–3 || – ||Ei–2– 
Ei–3| – |Ei–3– Ei–4 |||| và cứ tiếp tục như vậy. 
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 61 
(ii) Số bước w của dự báo mờ = int (số lượng 
khoảng / 2) thu được là: int (7/2) = 3. 
Tính toán và dự báo: 
Một số ký hiệu được sử dụng được định nghĩa 
như sau: 
[*Aj ] là khoảng tương ứng Uj mà hàm thuộc 
trong Aj đạt giá trị Supremum 
L[*Aj ] là giới hạn dưới của khoảng Uj 
U[*Aj ] là giới hạn trên của khoảng Uj 
l[*Aj ] là độ dài khoảng Uj trong đó hàm 
thuộc của Aj đạt Supremum 
M[*Aj ] là giá trị trung bình của khoảng Uj 
trong đó hàm thuộc của Aj đạt Supremum 
Đối với một mối quan hệ mờ Ai → Aj: 
Ai là giá trị mờ tại thời điểm t-1 
Aj là giá trị mờ tại thời điểm t 
Ei là giá trị của chuỗi thời gian tại thời điểm t-1 
Ei-1 là giá trị của chuỗi thời gian tại thời điểm t-2 
Ei-2 là giá trị của chuỗi thời gian tại thời điểm t-3 
Ei-3 là giá trị của chuỗi thời gian tại thời điểm t-4 
Ei-4 là giá trị của chuỗi thời gian tại thời điểm t-5 
Fj là giá trị dự báo của chuỗi thời gian tại thời 
điểm t 
Ở đây, sử dụng mô hình bậc 2 với các giá trị 
của chuỗi thời gian tại thời điểm t - 2, t - 1 
cho khung quy tắc để thực hiện về mối quan 
hệ logic mờ, Ai → Aj, với Ai, trạng thái hiện 
hành, là mờ hóa số liệu tại thời điểm t - 1 và 
Aj, trạng thái kế tiếp, là mờ hóa số liệu tại 
thời điểm t. 
Thuật toán tính toán: 
Đối với dự báo chuỗi thời gian mờ của mô 
hình bậc hai, có thể dự báo từ năm thứ ba của 
dữ liệu chuỗi thời gian và do đó cần phải đặt 
n = 2 và t = 3. 
Đặt n = 2, t = 3 
For t = 3 đến T (kết thúc dữ liệu chuỗi thời gian) 
Thu được mờ quan hệ từ thời điểm t – 1(Ai) 
đến t (Aj): Ai → Aj 
R = 0 và S = 0 
Tính toán 
d
n
Ei= |d
n-1
Ei- d
n-1
Ei–1| 
Xi= Ei + d
n
Ei/2 
XXi= Ei – d
n
Ei/2 
Yi= Ei + d
n
Ei 
YYi= Ei - d
n
Ei 
Pi = Ei + d
n
Ei/4 
PPi = Ei - d
n
Ei/4 
Qi= Ei + 2*d
n
Ei 
QQi = Ei - 2*d
n
Ei 
Gi= Ei + d
n
Ei/6 
GGi = Ei - d
n
Ei/6 
Hi = Ei + 3*d
n
Ei 
HHi = Ei - 3*d
n
Ei 
If Xi ≥ L [* Aj] and Xi ≤ U [*Aj] 
Then R = R + Xi and S = S + 1 
If XXi ≥ L [* Aj] and XXi ≤ U [* Aj] 
Then R = R + XXi and S = S + 1 
If Yi ≥ L [* Aj] and Yi ≤ U [*Aj] 
Then R = R + Yi and S = S + 1 
If YYi ≥ L [* Aj] and YYi ≤ U [* Aj] 
Then R = R + YYi and S = S + 1 
If Pi ≥ L [* Aj] and Pi ≤ U [*Aj] 
Then R = R + Pi and S = S + 1 
If PPi ≥ L [* Aj] and PPi ≤ U [* Aj] 
Then R = R + PPi and S = S + 1 
If Qi ≥ L [*Aj] and Qi ≤ U [* Aj] 
Then R = R + Qi and S = S + 1 
If QQi ≥ L [* Aj] and QQi ≤ U [* Aj] 
Then R = R + QQi and S = S + 1 
If Gi ≥ L [*Aj] and Gi ≤ U [* Aj] 
Then R = R + Gi and S = S + 1 
If GGi ≥ L [*Aj] and GGi ≤ U [*Aj] 
Then R = R + GGi and S = S + 1 
If Hi ≥ L [*Aj] and Hi ≤ U [* Aj] 
Then R = R + Hi and S = S + 1 
If HHi ≥ L [* Aj] and HHi ≤ U [* Aj] 
Then R = R + HHi and S = S + 1 
Fj=(R + M(* Aj))=(S + 1) 
Next t 
Tương tự như vậy, thiết lập n = 3 và t = 4, ta 
có thể nhận được dự đoán bởi mô hình bậc ba 
và n = 4, t = 5 để có được dự đoán bởi mô 
hình bậc 4 và cứ tiếp tục như vậy. Như vậy 
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 62 
giá trị dự báo có thể thu được bằng các mô 
hình bậc cao khác nhau. 
Đề xuất cải biên cho thuật toán của Singh 
Chúng tôi đề xuất một cải biên đơn giản cho 
thuật toán bậc cao của Singh ở bước 2 của 
thuật toán. Chúng tôi thực hiện một thay đổi 
nhỏ trong bước 2 của thuật toán trên để phân 
bố các điểm rơi vào từng khoảng được đều 
hơn. Các bước còn lại được giữ nguyên như 
thuật toán của Singh. Cụ thể: sau khi chia U 
thành m đoạn con bằng nhau, có một vấn đề 
đặt ra là số liệu chuỗi thời gian sẽ phân bố 
không đều trong các khoảng đã chia. Có thể 
có những khoảng không có giá trị chuỗi thời 
gian đang xét rơi vào nhưng cũng có thể có 
những khoảng có rất nhiều giá trị sẽ quy tập 
tại đó. Như vậy dự báo sẽ có nhiều sai số do 
sự phân bố không đều này. Vì vậy sẽ nảy sinh 
ra vấn đề cần chia lại khoảng sao cho phân bố 
của chuỗi thời gian rơi vào các khoảng đã 
chia sẽ được đều hơn. Vấn đề này đã được 
quan tâm trong [6]. Nội dung chủ yếu của lập 
luận là tính toán phân bố của giá trị chuỗi thời 
gian trong từng khoảng con.Giả sử số lượng 
các giá trị chuỗi thời gian là p điểm. Số lượng 
khoảng cần chia là m. Khi đó trung bình mỗi 
khoảng chứa n=p/m giá trị chuỗi thời gian. 
Nếu khoảng nào có số lượng giá trị chuỗi thời 
gian rơi vào nhỏ hơn hoặc bằng n thì không 
chia nhỏ ra, còn số lượng điểm rơi vào 
khoảng này lớn hơn n bao nhiêu lần thì sẽ 
chia nhỏ khoảng đó ra làm từng đó lần. Kết 
quả, sau bước này việc chia khoảng sẽ không 
thành các khoảng đều nhau nữa nhưng giá trị 
chuỗi thời gian lại được phân bố đồng đều 
hơn trong từng khoảng con. 
ỨNG DỤNG TRONG DỰ BÁO CHỈ SỐ 
CHỨNG KHOÁN ĐÀI LOAN 
Xét bài toán dự báo cho chuỗi dữ liệu chỉ số 
thị trường chứng khoán Đài Loan TAIFEX 
[2,3]. Cụ thể như sau: 
Áp dụng thuật toán cải biên cho số liệu này 
như sau: 
Bước 1. Xây dựng tập nền U. Xác định giá trị 
lớn nhất và nhỏ nhất của chuỗi thời gian trên 
là 6200 và 7560 điểm. Do vậy tập nền U 
được xác định là giá trị trong khoảng 
[6200,7600]. 
Bước 2. Chia khoảng. Ta sẽ chia U thành 14 
khoảng u1, u2, ..., u14 với độ rộng là 100, như 
vậy các khoảng sẽ là: u1 = [6200,6300], u2 = 
[6300,6400], , u14 = [7500,7600]. 
Chia lại khoảng 
Tính phân bố của các giá trị chuỗi thời gian 
rơi vào các khoảng đã chia. Điều này thực 
hiện để biết các khoảng nào có nhiều giá trị 
rơi vào để có thể phân khoảng tiếp làm tăng 
độ chính xác khi dự báo. 
Bảng sau đây sẽ cho thấy sự phân bố các giá 
trị của chuỗi thời gian rơi vào từng khoảng: 
Bảng 2. Phân bố giá trị trong từng khoảng 
Khoảng 
Số 
lượng 
Khoảng 
Số 
lượng 
6200-6300 1 6900-7000 5 
6300-6400 0 7000-7100 1 
6400-6500 3 7100-7200 0 
6500-6600 1 7200-7300 6 
6600-6700 2 7300-7400 5 
6700-6800 9 7400-7500 2 
6800-6900 9 7500-7600 3 
Xem xét bảng trên thấy sự phân bố các giá trị 
tại các khoảng khác nhau là không đều nhau. 
Có 47 giá trị trong 14 khoảng nên số lượng 
trung bình rơi vào mỗi khoảng là hơn 3. Vì 
vậy những khoảng nào có 5, 6 giá trị rơi vào 
ta chia tiếp làm 2 khoảng con, còn những 
đoạn nào có 8, 9 giá trị rơi vào ta tiếp tục chia 
thành 3 khoảng để sao cho mỗi khoảng con 
đó có xấp xỉ 3 giá trị rơi vào. Kết quả sẽ hình 
thành 21 khoảng sau: 
Bảng 3. Phân khoảng 
u1=[6200-6300] u8=[6766-6800] u15=[7100-7200] 
u2=[6300-6400] u9=[6800-6833] u16=[7200-7250] 
u3=[6400-6500] u10=[6833-6866] u17=[7250-7300] 
u4=[6500-6600] u11=[6866-6900] u18=[7300-7350] 
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 63 
u5=[6600-6700] u12=[6900-6950] u19=[7350-7400] 
u6=[6700-6733] u13=[6950-7000] u20=[7400-7500] 
u7=[6733-6766] u14=[7000-7100] u21=[7500-7600] 
Bảng 1. Giá trị chỉ số chứng khoán Đài Loan 
Năm Giá trị thực Năm Giá trị thực Năm 
Giá trị 
thực 
3/8/1998 7552 24/08/1998 6955 11/9/1998 6726.5 
4/8/1998 7560 25/08/1998 6949 14/09/1998 6774.55 
5/8/1998 7487 26/08/1998 6790 15/09/1998 6762 
6/8/1998 7462 27/08/1998 6835 16/09/1998 6952.75 
7/8/1998 7515 28/08/1998 6695 17/09/1998 6906 
10/8/1998 7365 29/08/1998 6728 18/09/1998 6842 
11/8/1998 7360 31/08/1998 6566 19/08/1998 7039 
12/8/1998 7330 1/9/1998 6409 21/09/1998 6861 
13/08/1998 7291 2/9/1998 6430 22/09/1998 6926 
14/08/1998 7320 3/9/1998 6200 23/09/1998 6852 
15/08/1998 7300 4/9/1998 6403.2 24/09/1998 6890 
17/08/1998 7219 5/9/1998 6697.5 25/09/1998 6871 
18/08/1998 7220 7/9/1998 6722.3 28/09/1998 6840 
19/08/1998 7283 8/9/1998 6859.4 29/09/1998 6806 
20/08/1998 7274 9/9/1998 6769.6 30/09/1998 6787 
21/08/1998 7225 10/9/1998 6709.75 
Bước 3. Xây dựng các hàm mờ trên khoảng 
đã chia: 
Trong bước này ta xác định lại các tập mờ Ai 
tương ứng với từng khoảng và có thể gán lại 
các giá trị ngôn ngữ cho từng tập mờ này. Các 
tập mờ Ai i=1,2,...,21 được định nghĩa thông 
qua các hàm thuộc để đơn giản có dạng hình 
nón nhận 3 giá trị 0, 0.5 và 1 được viết như 
sau: 
A1 = 1/u1 + 0.5/u2 + 0/u3 +....+ 0/u20 + 0/u21 
A2 = 0.5/u1 + 1/u2 + 0.5/u3 +...+ 0/u20 + 0/u21 
A3 = 0/u1 + 0.5/u2 + 1/u3 + 0.5/u4 +...+ 0/u20 + 
0/u21 
... 
A19 = 0/u1 + 0./u2 +... + 0.5/u18 + 1/u19 + 
0.5/u20 + 0/u21 
A20 = 0/u1 + 0./u2 + ...+ 0.5/u19 + 1/u20 + 
0.5/u21 
A21 = 0/u1 + 0/u2 + ...+ 0/u19 + 0.5/u20 + 1/u21 
Bước 4. Mờ hoá các giá trị của chuỗi thời 
gian và thiết lập mối quan hệ mờ: 
Kết quả mờ hóa các giá trị của chuỗi thời gian 
thể hiện trong Bảng 4. 
Theo định nghĩa phần trên ta lập chuỗi thời 
gian mờ tương ứng với các tập mờ ở trên và 
xác định mối quan hệ mờ tại thời điểm t 
=1,2,...,47. Có thể thấy ngay được các mối 
quan hệ đầu tiên như sau: A21 A21 , A21 
A20 , A20 A21 ,..., A9 A8. 
Bước 5. Tính toán và dự báo dựa trên các mối 
quan hệ mờ được thiết lập: 
Bảng 4. Mối quan hệ mờ 
Năm Giá trị thực Quan hệ mờ Năm Giá trị thực Quan hệ mờ 
3/8/1998 7552 A22 2/9/1998 6430 A4 
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 64 
4/8/1998 7560 A22 3/9/1998 6200 A1 
5/8/1998 7487 A21 4/9/1998 6403.2 A4 
6/8/1998 7462 A21 5/9/1998 6697.5 A6 
7/8/1998 7515 A22 7/9/1998 6722.3 A7 
10/8/1998 7365 A20 8/9/1998 6859.4 A11 
11/8/1998 7360 A20 9/9/1998 6769.6 A9 
12/8/1998 7330 A19 10/9/1998 6709.75 A7 
13/08/1998 7291 A18 11/9/1998 6726.5 A7 
14/08/1998 7320 A19 14/09/1998 6774.55 A9 
15/08/1998 7300 A19 15/09/1998 6762 A8 
17/08/1998 7219 A17 16/09/1998 6952.75 A14 
18/08/1998 7220 A17 17/09/1998 6906 A13 
19/08/1998 7283 A18 18/09/1998 6842 A11 
20/08/1998 7274 A18 19/08/1998 7039 A15 
21/08/1998 7225 A17 21/09/1998 6861 A11 
24/08/1998 6955 A14 22/09/1998 6926 A13 
25/08/1998 6949 A13 23/09/1998 6852 A11 
26/08/1998 6790 A9 24/09/1998 6890 A12 
27/08/1998 6835 A11 25/09/1998 6871 A12 
28/08/1998 6695 A6 28/09/1998 6840 A11 
29/08/1998 6728 A7 29/09/1998 6806 A10 
31/08/1998 6566 A5 30/09/1998 6787 A9 
1/9/1998 6409 A4 
Trong bước này, chỉ ứng dụng tính toán với 
mô hình bậc 2 (nghĩa là n=2 và t=3). Kết quả 
tính toán và dự báo theo thuật toán biểu diễn 
ở Bảng 5. Sai số trung bình bình phương 
MSE được tính theo công thức: 
Ta có thể thấy rằng kết quả dự báo với thuật 
toán Singh là rất tốt, nhất là khi so sánh với 
các kết quả của Chen hay của Huarng. Kết 
quả khi sử dụng thuật toán cải biên còn tốt 
hơn nhiều, sai số MSE của phương pháp chỉ 
bằng 1/2 sai số theo phương pháp ban đầu 
Singh đưa ra. Trong đồ thị ở Hình 1, ta có thể 
nhận thấy giá trị dự báo gần như trùng khớp 
hoàn toàn với giá trị thực. 
KẾT LUẬN 
Bài báo này đưa ra một cải biên cho thuật toán 
bậc cao của Singh. Tuy chỉ là một cải biên nhỏ 
nhưng hiệu quả đạt được là khá tốt. Điều này 
thể hiện thông qua sai số trung bình bình 
phương (MSE) của phương pháp chỉ bằng ½ 
sai số theo phương pháp nguyên thuỷ của 
Singh. So sánh với kết quả của Huarng và các 
phương pháp khác có thể xem trong [1]-[3]. 
Đường dự báo của chúng tôi đưa ra bám khá 
sát với giá trị thực tế nên có thể sử dụng 
phương pháp cải tiến này cho dự báo cho một 
số chuỗi thời gian trong thực tiễn. 
TÀI LIỆU THAM KHẢO 
[1]. Nguyễn Công Điều (2008), Một thuật toán 
mới cho mô hình chuỗi thời gian mờ heuristic 
trong dự báo chứng khoán, Báo cáo tại Đại hội 
Toán học toàn tại Quy Nhơn. Bài gửi đăng tại Tạp 
chí Toán học ứng dụng. 
[2]. Nguyễn Công Điều (2009), “Cải biên cho 
một thuật toán đơn giản trong mô hình chuỗi thời 
gian mờ”, Báo cáo khoa học tại Viện Công nghệ 
thông tin. 
[3]. Q. Song, B.S. Chissom (1993), “Fuzzy Time 
Series and its Model”, Fuzzy set and system, vol. 
54, pp. 269-277. 
[4]. Q.Song, B.S. Chissom (1993), “Forecasting 
Enrollments with Fuzzy Time Series – Part I,” Fuzzy 
set and system, vol. 54, pp. 1-9. 
[5]. Q.Song, B.S. Chissom (1994), “Forecasting 
Enrollments with Fuzzy Time Series – Part II,” 
Fuzzy set and system, vol. 62, pp. 1-8. 
416
n
)g(f
MSE
n
1i
2
ii

Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 65 
[6]S.M.Chen (1996), “Forecasting Enrollments 
based on Fuzzy Time Series,” Fuzzy set and 
system, vol. 81, pp. 311-319. 
[7]S.M.Chen (2002), “Forecasting Enrollments 
based on hight-order Fuzzy Time Series”, Inter. 
Jurnal: Cybernetic and Systems, N.33, pp. 1-16. 
[9]. S.R. Singh (2007), “A simple method of 
forecasting based on fuzzy time series”, Applied 
Mathematics and Computation, 186, pp. 330-339. 
[10]. S.R. Singh (2009), “A computational 
method of forecasting based on high-order fuzzy 
time series”, Expert Systems with Applications, 
36 pp.10551–10559. 
Bảng 5. Kết quả khi sử dụng thuật toán cải biên 
Algorithms/ 
MSE 
Heuristic cải tiến Chen Huarng Singh Singh cải tiến 
MSE 1700 9737 5437 884 416 
Hình 1. Đồ thị so sánh kết quả dự báo bằng thuật toán Singh cải biên với giá trị thực và giá trị dự báo bằng 
thuật toán nguyên thuỷ của Singh 
SUMMARY 
MODIFICATION OF SINGH'S HIGH ORDER ALGORITHM AND ITS 
APPLICATION IN FORECASTING TIME SERIES 
Nguyen Cong Dieu
1
, Tran Thanh Thuong
21 
1Institute of Information Technology - VAST,2Thai Nguyen University 
Fuzzy time series models have many applications in forecastings. However, the predictive results of the 
proposed method were not very accurate. Thus the search for the more accurate models and simpler 
algorithm is in a priority. In recent years, a number of works have been completed under the direction 
of improving the accuracy and reducing the amount calculated in fuzzy time series models such as the 
works of Chen and Hsu, Huarng, Singh, ... A different approach for fuzzy time series model is to use 
these techniques in data mining such as clustering, Neural networking, ... to build the models. There is 
also possible to use high-order prediction algorithm. Singh [10] has proposed such an algorithm. In this 
paper, we modified the algorithm of Singh for high order fuzzy time series model. The modification 
method has showed a very good efficiency. 
Key words: Fuzzy time series, Linguistic variables, Fuzzy logical relations 
Nguyễn Công Điều và cs Tạp chí KHOA HỌC & CÔNG NGHỆ 72(10): 59 - 65 
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên  | 66 

File đính kèm:

  • pdfcai_bien_thuat_toan_bac_cao_cua_singh_va_ung_dung_trong_du_b.pdf