Phát triển các phương pháp dự phòng nâng cao độ tin cậy của hệ thống

Độ tin cậy có vai trò then chốt trong sự phát triển kỹ thuật, nâng cao độ tin cậy giúp tránh được các

sự cố có thể xảy đối với hệ thống. Trong lý thuyết về độ tin cậy của hệ thống đã có nhiều phương

pháp khác nhau được đưa ra nhằm giải một bài toán duy nhất – tăng độ tin cậy của một hệ thống từ

những thành phần không tin cậy: dự phòng truyền thống, dự phòng bảo vệ tích cực Trong bài

báo này, chúng tôi đưa ra giải pháp kết hợp hai cấu trúc dự phòng để đem lại độ tin cậy cao hơn

của hệ thống.

pdf 8 trang phuongnguyen 11700
Bạn đang xem tài liệu "Phát triển các phương pháp dự phòng nâng cao độ tin cậy của hệ thống", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Phát triển các phương pháp dự phòng nâng cao độ tin cậy của hệ thống

Phát triển các phương pháp dự phòng nâng cao độ tin cậy của hệ thống
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
59 
PHÁT TRIỂN CÁC PHƯƠNG PHÁP DỰ PHÒNG NÂNG CAO 
ĐỘ TIN CẬY CỦA HỆ THỐNG 
Lê Quang Minh1, Triệu Xuân Hòa2*, Trần Thanh Thương3 
1Viện Công nghệ thông tin – Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội 
2Trường Đại học Nông Lâm – ĐH Thái Nguyên, 3Đại học Thái Nguyên 
TÓM TẮT 
Độ tin cậy có vai trò then chốt trong sự phát triển kỹ thuật, nâng cao độ tin cậy giúp tránh được các 
sự cố có thể xảy đối với hệ thống. Trong lý thuyết về độ tin cậy của hệ thống đã có nhiều phương 
pháp khác nhau được đưa ra nhằm giải một bài toán duy nhất – tăng độ tin cậy của một hệ thống từ 
những thành phần không tin cậy: dự phòng truyền thống, dự phòng bảo vệ tích cực  Trong bài 
báo này, chúng tôi đưa ra giải pháp kết hợp hai cấu trúc dự phòng để đem lại độ tin cậy cao hơn 
của hệ thống. 
Từ khóa: độ tin cậy, dự phòng truyền thống, bảo vệ chủ động tích cực. 
ĐẶT VẤN ĐỀ* 
Độ tin cậy là đặc tính then chốt trong sự phát 
triển kỹ thuật, đặc biệt là khi xuất hiện những 
hệ thống phức tạp nhằm hoàn thành những 
chức năng quan trọng trong các lĩnh vực khác 
nhau. Dựa vào độ tin cậy của hệ thống giúp 
chúng ta có được kế hoạch bảo trì, dự phòng, 
nâng cao độ tin cậy tránh được các sự cố có 
thể xảy ra. 
Hiện nay, các hệ thống tính toán kỹ thuật 
đang dần được ứng dụng rộng rãi trong các 
lĩnh vực hoạt động khác nhau của đời sốngxã 
hội.Các hệ thốngnày được biết đến trong 
nhiều lĩnh vực: hệ thống kiểm soát nhà máy 
điện hạt nhân, hệ thống máy tính trong hệ 
thống ngân hàng, các công ty chứng khoán, 
hệ thống máy tính trên máy bay, hệ thống 
thông tin liên lạc vệ tinh,.. Những hệ thống 
trên cần phải có khả năng phục hồi và khả 
năng tồn tại trong suốt thời gian hoạt động 
của hệ thống. Lý do là vì những thất bại của 
hệ thống có thể gây tổn thất lớn về kinh tế, để 
lại những hậu quả nghiêm trọng.. 
Trong lý thuyết về độ tin cậy của hệ thống đã 
có nhiều phương pháp khác nhau được đưa ra 
nhằm giải một bài toán duy nhất – tăng độ tin 
cậy của một hệ thống từ những thành phần 
không tin cậy. Tài liệu [3] và [4] đã xét đến 
* Tel: 0944 550007 
các cấu trúc khác nhau của hệ thống với các 
thành phần dự phòng, nhằm bổ sung độ tin 
cậy như: cấu trúc dự phòng truyền thống; cấu 
trúc dự phòng bảo vệ tích cực – còn gọi là cấu 
trúc dự phòng bảo vệ chủ động. Trong nội 
dung bài báo này, chúng tôi nghiên cứu đưa 
ra giải pháp kết hợp hai cấu trúc dự phòng 
đểđem lại độ tin cậy của hệ thống cao hơn 
việc sử dụng cấu trúc dự phòng truyền thống. 
NỘI DUNG 
Xét một mô hình hệ thống mạng máy tính có 
cấu trúc dạng cây gồm 3 cấp: ở cấp độ đầu tiên 
có một bộ vi xử lý kiểm soát, cấp độ thứ hai có 
hai bộ vi xử lý điều khiển, cấp độ thứ ba có năm 
bộ vi xử lý dữ liệu như trong hình 1. 
Hình 1: Mô hình hệ thống mạng máy tính 
Để thuận lợi cho việc quan sát mô hình máy 
tính trên, giả định mỗi vị trí bộ vi xử lý dự 
phòng được coi là một node trên mô hình 
thực nghiệm. Ký hiệu: 
: node gốc (vi xử lý của hệ thống) 
: node dự phòng (vi xử lý dự phòng) 
Chúng ta xem xét ba phương pháp lựa chọn để 
cải thiện độ tin cậy của hệ thống “không phục 
hồi” [2] trong khi duy trì hiệu quả của nó: 
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
60 
1) Sử dụng một biến thể của phần cứng theo 
phương pháp dự phòng truyền thống. 
2) Lựa chọn với sự ra đời của chi nhánh bổ 
sung trong cấu trúc của hệ thống cho việc tổ 
chức hoạt động bảo vệ: Dự phòng bảo vệ tích 
cực (Actice Protection - AP). 
3) Sử dụng phương pháp lựa chọn kết hợp. 
Mô hình bài toán sử dụng dự phòng truyền 
thống 
Với mô hình bài toán hệ thống máy tính được 
trình bày ở trên chúng ta sẽ sử dụng các mô 
hình dự phòng để đánh giá mức độ tin cậy của 
hệ thống máy tính. 
Cấu hình hệ thống tương ứng với tùy chọn 
nghiên cứu phương pháp dự phòng truyền 
thống [5] thể hiện trong hình 2. 
Giả định rằng tất cả các bộ vi xử lý của kiểm 
soát và xử lý hệ thống là đồng nhất, trùng lặp 
được tất cả các tải: 
Ký hiệu: 
p: khả năng hoạt động không có sự thất bại 
của mỗi bộ xử lý. 
q: xác suất thất bại của một bộ xử lý. 
 1: khả năng phát hiện chính xác xác suất thất 
bại của các cặp. 
Theo định nghĩa độ tin cậy của hệ thống [1] ta 
có: p = p(t); q = 1-p. 
Với ký hiệu trên biểu hiện cho khả năng của 
hệ thống, do mỗi cặp có thể coi là một hệ 
thống gồm hai phần tử độc lập mắc song song 
X1, X2 với xác suất hoạt động an toàn cùng là 
p. Khi đó ta có độ tin cậy (sơ cấp và sao lưu) 
[5] của một cặp vi xử lý sẽ là Ps: 
P(X1vX2) = P(X1) + Q(X1).P(X2) = p + (1 - 
p).p = 2p - p2 = 2p(1 - p) + p2 = 2pq + p2 
Với 1 là xác suất thất bại của mỗi cặp nên ta 
có: 
Ps=2 1pq + p2
(1) 
Sau khi chuyển đổi (1) ta có: 
Từ các cấu hình hệ thống với bộ vi xử lý dự 
phòng biểu thị cho khả năng hoạt động không 
có sự thất bại hệ thống viết như sau: 
1 2 3
4 5 6
7 8
9
Hình 2: Cấu hình hệ thống với dự phòng 
1: Cấu hình ban đầu; 2-9: Cấu hình với dự phòng 
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
61 
Trong đó: 
Pi - xác suất thất bại của phần tử thứ i (bộ xử 
lý) trong hệ thống 
N - số lượng các bộ vi xử lý trong hệ thống 
d - số lượng các cặp vi xử lý bản sao trong hệ 
thống. 
Từ biểu thức (2), chúng ta sẽ nhận được biểu 
thức xác suất hoạt động không có sự thất bại 
của mỗi một cấu hình của hệ thống cho trên 
hình 2. 
; 
Mô hình bài toán dự phòng bảo vệ tích cực 
Cùng với mô hình bài toán hệ thống máy tính 
trên, chúng ta sẽ sử dụng phương án thứ hai – 
áp dụng dự phòng bảo vệ tích cực (AP) [5] 
cho hệ thống. Các cấu hình hệ thống khi áp 
dụng APđược thể hiện trong hình 3. 
Chúng ta xem xét một cấu hình thể hiện cho 
khả năng hoạt động không có sự thất bại của 
cấu hình số 10, như thể hiện trong hình 3. Số 
bộ xử lý không dự phòng trong hệ thống mà 
không được bảo vệ chủ động là 5. Do đó, xác 
suất thất bại của hệ thống phần này – p5. 
Tính toán xác suất hoạt động không thất bại 
cho phần bị bắt bởi lớp AP và bao gồm bốn 
bộ vi xử lý. Nguyên tắc linh hoạt nhất của AP 
- tức là bằng cách AP xác định lại bộ vi xử lý 
kiểm soát và kiểm soát ưu tiên thấp được sử 
dụng. Rõ ràng khả năng hoạt động không có 
sự thất bại này là một phần của hệ thống Рh 
bằng tổng xác suất hoạt động của cả bốn bộ vi 
xử lý (р4) và xác suất hoạt động của ba trong 
số bốn bộ vi xử lý. 
Trong đó: α1AP - phát hiện xác suất thất bại 
một tầng AP khi xảy ra. Biểu thức cuối cùng 
biểu thị cho khả năng hoạt động không có sự 
thất bại của hệ thống với cấu hình số 10 có 
thể viết như sau: 
Tương tự như vậy, biểu thức thể hiện cho khả 
năng hoạt động không có sự thất bại của hệ 
thống với cấu hình số 11: 
Giả định α2АP - khả năng phát hiện xác suất 
thất bại cho hai cấp AP. Hệ thống sau khi thất 
bại ở hai cấp độ đầu tiên AP sẽ được chuyển 
thành đơn cấp AP. Ngoài ra, giả định rằng đơn 
cấp AP là một hệ quả của sự biến đổi trong đó 
hai cấp AP và ban đầu hai cấp AP được tạo ra 
với việc sử dụng các nguyên tắc linh hoạt nhất 
của AP - tức là AP xác định lại bộ vi xử lý kiểm 
soát và kiểm soát ưu tiên thấp. 
10 11 12
14 1615
13
Hình 3: Cấu hình hệ thống với AP 
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
62 
Cho các giả định và ký hiệu chúng ta nhận được biểu thức tính xác suất của khả năng hoạt động 
của hệ thống không có sự thất bại với cấu hình số 12, 13 như sau: 
Giả định α3АP - khả năng phát hiện xác suất thất bại cho ba cấp AP. Hệ thống sau khi thất bại ở ba 
cấp độ đầu tiên AP sẽ được chuyển thành hai cấp AP, khi thất bại ở hai cấp độ AP sẽ được 
chuyển thành đơn cấp AP. Với các giả định và ký hiệu như trên, ta nhận được biểu thức tính xác 
suất của khả năng hoạt động của hệ thống không có sự thất bại ở cấu hình 14-16 như sau: 
Với 
; 
Đề xuất mô hình bài toán kết hợp dự phòng truyền thống và dự phòng bảo vệ tích cực 
Cấu hình tương ứng với kết hợp xây dựng phương án chịu lỗi hệ thống được hiển thị trong hình 4. 
17 19
222120
18
Hình 4: Cấu hình hệ thống với AP và nhân bản 
Cho các giả định và ký hiệu viết biểu thức tính xác suất của khả năng hoạt động hệ thống không 
có sự thất bại với cấu hình số 17-23: 
Với 
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
63 
Tương ứng với các cấu hình hệ thống số 1-22, ta đã xác định đượccác biểu thức xác suất hoạt 
động không có sự thất bại của hệ thống P[1] – P[22]. Với P[1] – P[9]: biểu thức xác suất hoạt động 
không có sự thất bại của mỗi một cấu hình hệ thống khi áp dụng phương pháp dự phòng truyền 
thống; P[10] – P[16]: biểu thức xác suất hoạt động không có sự thất bại của mỗi một cấu hình hệ 
thống khi áp dụng AP. P[17] – P[22]: biểu thức xác suất hoạt động không có sự thất bại của mỗi một 
cấu hình hệ thống khi áp dụng kết hợp dự phòng truyền thống và AP. 
Khi tính toán xác suất P[i] (i = 1 .. 22) đã được sử dụng các đầu vào sau: thời gian hoạt động phân 
phối xác suất của mỗi bộ vi xử lý trong hệ thống tương ứng với theo cấp số nhân P(t) = exp(-λt); 
tỷ lệ thất bại λ = 7*10-7 h-1 [2]; α1АP =0,8; α2АP =1-(1- α1АP)2=0,96; α3АP =1-(1- α1АP)3= 0,992; 
α1=0,8; thời gian hoạt động hệ thống - 61.320 giờ (7 năm). 
Với các đầu vào như trên, ta có bảng xác suất hoạt động không có sự thất bại của hệ thống tương 
ứng với mỗi một cấu hình như sau. 
Cấu hình 1 năm 2 năm 3 năm 4 năm 5 năm 6 năm 7 năm 
Số 1 0,9521 0,9065 0,8631 0,8218 0,7825 0,7450 0,7094 
Số 2 0,9556 0,9133 0,8728 0,8341 0,7971 0,7618 0,7280 
Số 3 0,9592 0,9200 0,8825 0,8465 0,8120 0,7789 0,7472 
Số 4 0,9627 0,9268 0,8923 0,8591 0,8272 0,7964 0,7668 
Số 5 0,9663 0,9337 0,9023 0,8719 0,8426 0,8143 0,7870 
Số 6 0,9698 0,9406 0,9123 0,8849 0,8584 0,8326 0,8077 
Số 7 0,9734 0,9476 0,9225 0,8981 0,8744 0,8514 0,8290 
Số 8 0,9770 0,9546 0,9327 0,9115 0,8907 0,8705 0,8508 
Số 9 0,9806 0,9617 0,9431 0,9250 0,9074 0,8901 0,8732 
Số 10 0,9649 0,9309 0,8978 0,8656 0,8345 0,8042 0,7749 
Số 11 0,9732 0,9467 0,9207 0,8950 0,8697 0,8449 0,8205 
Số 12 0,9769 0,9541 0,9316 0,9094 0,8876 0,8662 0,8450 
Số 13 0,9795 0,9594 0,9395 0,9198 0,9005 0,8814 0,8625 
Số 14 0,9805 0,9613 0,9424 0,9237 0,9054 0,8873 0,8696 
Số 15 0,9764 0,9524 0,9280 0,9035 0,8788 0,8540 0,8294 
Số 16 0,9901 0,9797 0,9686 0,9568 0,9444 0,9313 0,9177 
Số 17 0,9758 0,9500 0,9230 0,8951 0,8666 0,8378 0,8089 
Số 18 0,9805 0,9611 0,9420 0,9230 0,9042 0,8856 0,8673 
Số 19 0,9841 0,9684 0,9529 0,9375 0,9223 0,9073 0,8924 
Số 20 0,9877 0,9754 0,9631 0,9507 0,9383 0,9259 0,9135 
Số 21 0,9800 0,9594 0,9384 0,9169 0,8952 0,8732 0,8512 
Số 22 0,9938 0,9869 0,9794 0,9711 0,9620 0,9523 0,9418 
Phân tích các giá trị trong bảng cho thấy ưu điểm của việc sử dụng AP so với dự phòng truyền 
thống với cùng một số bộ vi xử lý cần thiết. Ví dụ: cấu hình 4 và cấu hình 12 đều sử dụng 3 bộ vi 
xử lý dự phòng, độ tin cậy của cấu hình 4 sau 7 năm là 0,7668 trong khi cấu hình 12 đạt độ tin 
cậy là 0,8450. 
Có thể nhận thấy, với cùng một số lượng thiết bị dự phòng, AP kiểm soát bao gồm hầu hết các 
phần của hệ thống (hoặc phát hiện lỗi nhiều khả năng), do đó làm tăng khả năng quan sát của hệ 
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
64 
thống và cung cấp cái gọi là phòng ảo - phòng bộ vi xử lý chính với ít nhất một phần tử dự phòng 
nâng cao khả năng kiểm soát của hệ thống. 
Với cấu hình số 12, khi ta áp dụng kết hợp cả dự phòng truyền thống và AP, ta có các cấu hình 
18, 20 với độ tin cậy được tăng lên lần lượt là 0,8673 và 0,9135. 
Hình 5 cho thấy đồ thị của xác suất khả năng hoạt động không có sự thất bại hệ thống với cấu 
hình số 1, số 4, số 12, số 18, số 20 theo thời gian. 
Hình 5: Đồ thị xác suất khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 1, số 4, số 
12, số 18, số 20 theo thời gian 
Tiếp tục xem xét các trường hợp nhân bản ba cấu hình số 20,thể hiện trong hình 6. 
23 24
22
Hình 6: Cấu hình hệ thống với AP và nhân bản dự phòng chập ba 
Biểu thị РТР - xác suất của các bộ vi xử lý ba trong trường hợp dự phòng chập ba; 2- phát hiện 
xác suất thất bại trong 3 bộ vi xử lý trong trường hợp dự phòngchập ba. Chúng tôi tin rằng sau 
khi phát hiện sự thất bại của một bộ xử lý trong dự phòng chập ba sẽ được chuyển đến trùng lặp 
với khả năng phát hiện chính xác của sự thất bại trong một cặp 1. 
Cho các giả định và ký hiệu, tương tự: 
Biểu hiện cho khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 23-24 sẽ 
tính như sau: 
Cấu hình số 23, 24 cung cấp khả năng hoạt động không có sự thất bại của hệ thống là 0,9222 và 
0,9390. Hình 7 cho thấy đồ thị của xác suất hoạt động không có sự thất bại hệ thống với cấu hình 
số 1, số 20, số 23, số 24. 
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
65 
Hình 7: Đồ thị xác suất khả năng hoạt động không có sự thất bại của hệ thống với cấu hình số 1, số 20, số 
23, số 24 theo thời gian 
So với cấu hình ban đầu, hệ thống sau khi dự 
phòng với AP kết hợp nhân bản (cấu hình số 
20, số 22, số 23, số 24) có độ tin cậy tăng từ 
28,78% - 32,77%. Hiệu quả hơn so với việc 
chỉ áp dụng dự phòng truyền thống hoặc dự 
phòng bảo vệ tích cực. 
KẾT LUẬN 
Bài báo đã đưa ra phương pháp tiếp cận hợp 
lý nhất để nâng cao độ tin cậy của hệ thống là 
sử dụng phương pháp dự phòng truyền thống 
và phương pháp dự phòng tích cực (nhân bản 
ba) ở bộ vi xử lý kiểm soát kết hợp với bộ vi 
xử lý bảo mật dữ liệu hoạt động cấp độ cao. 
Kết quả đánh giá cho thấy xác suất độ tin cậy 
của hệ thống trong suốt 7 năm không nhỏ hơn 
0,9 đảm bảo độ tin cậy hệ thống:So với cấu 
hình ban đầu (cấu hình 1, độ tin cậy của hệ 
thống sau 7 năm chỉ đạt: 0,7094), hệ thống 
sau khi dự phòng (cấu hình số 16, số 20, số 
23, số 24, số 22) có độ tin cậy đạt trong 
khoảng 0,9177 – 0,9418 (tăng từ 28,78% - 
32,77%). Hiệu quả hơn so với việc chỉ áp 
dụng dự phòng truyền thống hoặc dự phòng 
bảo vệ tích cực. Việc phân tích hiệu quả độ 
tin cậy của hệ thống và ứng dụng phương 
pháp bảo vệ chủ động nhằm chống lại những 
thất bại trong việc kiểm soát phân cấp các hệ 
thống tính toán thời gian thực - thể hiện cho 
khả năng hoạt động không có sự thất bại của 
hệ thống với các cấu hình khác nhau. 
TÀI LIỆU THAM KHẢO 
1. Phan Văn Khôi (2001), Cơ sở đánh giá độ tin 
cậy, Nhà xuất bản Khoa học và Kỹ thuật. 
2. Nguyễn Duy Việt (4/2011), “Tính độ tin cậy 
của hệ thống không phục hồi”, tạp chí Khoa học 
Giao thông Vận tải, tr2-4. 
3. Шубинский И.Б. и др. «Активная защита 
от отказов управляющих модульных 
вычислительных систем» //СПб.:Наука, 1993, 
-284с. 
4. Иыуду К.А. «Расчет надежности 
вычислительных и управляющих машин и 
систем летательных аппаратов» // М.: МАИ, 
1978, - 55с. 
5. Le Quang Minh, Романовский А.С., к.т.н., 
доц, (2007) “ОЦЕНКА ЭФФЕКТИВНОСТИ 
ПРИМЕНЕНИЯ МЕТОДОВ АКТИВНОЙ ЗАЩИТЫ 
ОТ ОТКАЗОВ В ИЕРАРХИЧЕСКИХ 
ВЫЧИСЛИТЕЛЬНЫХ СИСТЕМАХ”
Lê Quang Minh và Đtg Tạp chí KHOA HỌC & CÔNG NGHỆ 122(08): 59 - 66 
66 
SUMMARY 
DEVELOPMENT OF PROVISION METHOD 
TO ENHANCE SYSTEM RELIABILITY 
Le Quang Minh1, Trieu Xuan Hoa2*, Tran Thanh Thuong3 
1College of Engineering and Technology – VNU, 
2College of Agriculture and Forestry – TNU, 3Thai Nguyen University 
Reality plays an important role in technical development, enhancing reality can prevent some 
problems in the system. In theory of system reality, lots of solutions have been proposed to 
enhance reality of a system from unreality components: traditional standby, active protection 
standby... In this article, both standby solutions are combined to get an optimal reality system. 
Keywords: Reliability, Traditional Standby, Active Protection 
Ngày nhận bài:12/7/2014; Ngày phản biện:26/7/2014; Ngày duyệt đăng: 25/8/2014 
Phản biện khoa học: TS. Vũ Đức Thái – Trường Đại học Công nghệ Thông tin & Truyền thông - ĐHTN 
* Tel: 0944 550007 

File đính kèm:

  • pdfphat_trien_cac_phuong_phap_du_phong_nang_cao_do_tin_cay_cua.pdf