Tối ưu cơ hội truyền gói tin trong mạng vô tuyến sử dụng lý thuyết trò chơi

TÓM TẮT
Trong bài báo này, tác giả phát triển mô hình truyền gói tin cơ hội dựa trên lý thuyết trò
chơi cho mạng vô tuyến hoạt động trong điều kiện nguồn năng lượng thấp. Để giảm thiểu việc
truyền gói tin không thành công do lỗi kênh truyền và xung đột trong quá trình truyền gói tin
gây ra sự lãng phí năng lượng, chiến lược truyền gói tin cơ hội cố gắng truyền gói tin ở điều
kiện kênh truyền tốt nhất với ràng buộc về độ trễ gói tin với mô hình kênh truyền fading biến
thiên theo thời gian. Mô hình lý thuyết trò chơi ngẫu nhiên kết hợp chi phí được đề xuất để
xác định một ngưỡng tối ưu cho việc truyền gói tin theo cơ chế truyền thông cơ hội. Kết quả
mô phỏng cho thấy với chiến lược truyền thông cơ hội, các nút mạng có xu hướng trì hoãn
truyền trong điều kiện kênh truyền xấu nhằm tránh xung đột và giảm tỷ lệ mất gói tin dẫn đến
việc tăng hiệu quả sử dụng năng lượng của mỗi nút và kéo dài thời gian hoạt động của mạng
9 trang phuongnguyen 16960
Download
Bạn đang xem tài liệu "Tối ưu cơ hội truyền gói tin trong mạng vô tuyến sử dụng lý thuyết trò chơi", để tải tài liệu gốc về máy hãy click vào nút Download ở trên
Tóm tắt nội dung tài liệu: Tối ưu cơ hội truyền gói tin trong mạng vô tuyến sử dụng lý thuyết trò chơi

42 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
TỐI ƯU CƠ HỘI TRUYỀN GÓI TIN TRONG MẠNG VÔ TUYẾN 
 SỬ DỤNG LÝ THUYẾT TRÒ CHƠI 
MAXIMIZING PACKET TRANSMISSION OPPORTUNITIES IN THE 
WIRELESS NETWORK BY USING THE GAME THEORY 
Nguyễn Chánh Tín, Phan Văn Ca 
Trường Đại học Sư phạm Kỹ thuật TP.HCM, Việt Nam 
Ngày toà soạn nhận bài 9/4/2018, ngày phản biện đánh giá 14/4/2018, ngày chấp nhận đăng 27/4/2018. 
TÓM TẮT 
Trong bài báo này, tác giả phát triển mô hình truyền gói tin cơ hội dựa trên lý thuyết trò 
chơi cho mạng vô tuyến hoạt động trong điều kiện nguồn năng lượng thấp. Để giảm thiểu việc 
truyền gói tin không thành công do lỗi kênh truyền và xung đột trong quá trình truyền gói tin 
gây ra sự lãng phí năng lượng, chiến lược truyền gói tin cơ hội cố gắng truyền gói tin ở điều 
kiện kênh truyền tốt nhất với ràng buộc về độ trễ gói tin với mô hình kênh truyền fading biến 
thiên theo thời gian. Mô hình lý thuyết trò chơi ngẫu nhiên kết hợp chi phí được đề xuất để 
xác định một ngưỡng tối ưu cho việc truyền gói tin theo cơ chế truyền thông cơ hội. Kết quả 
mô phỏng cho thấy với chiến lược truyền thông cơ hội, các nút mạng có xu hướng trì hoãn 
truyền trong điều kiện kênh truyền xấu nhằm tránh xung đột và giảm tỷ lệ mất gói tin dẫn đến 
việc tăng hiệu quả sử dụng năng lượng của mỗi nút và kéo dài thời gian hoạt động của mạng. 
Từ khóa: Lý thuyết trò chơi; chiến lược truyền thông cơ hội; mạng vô tuyến; kênh truyền biến 
thiên theo thời gian; trò chơi ngẫu nhiên kết hợp hàm chi phí. 
ABSTRACT 
In this paper, the authors have developed a game theory framework for an opportunity 
communication strategy for wireless networks that operate in a strict energy-constrained 
environment. In order to minimize unsuccessful transmission due to channel errors and packet 
collisions that causing a waste of energy, the opportunity communication strategy attempts to 
transmit at good channel conditions while meeting the delay constraint under the 
time-varying wireless channel. Thus a constrained cost-coupled stochastic game algorithm is 
formulated to obtain an optimal threshold for successful transmission in the opportunistic 
transmission manner. The simulation result shows that with the opportunity transmission 
strategy, the nodes trend to defer their transmissions in bad channel conditions to avoid 
collision and reduce packet loss rate. This can lead to improve the performance of energy 
usage at each node as well as to prolong the network lifetime. 
Keywords: Game theory; opportunistic transmission; wireless network; time-varying wireless 
channel; cost-coupled stochastic. 
1. GIỚI THIỆU 
Trong những năm gần đây, lý thuyết trò 
chơi đã trở thành một công cụ thiết yếu, hiệu 
quả để phân tích và thiết kế mạng vô tuyến. 
Giao thức đa truy cập cảm nhận sóng mang 
(CSMA) ứng dụng lý thuyết trò chơi cho 
mạng vô tuyến đang được xem như là một 
giải pháp thay thế CSMA cổ điển dựa trên cơ 
chế back-off ngẫu nhiên [1]. Trong bài báo 
này, các tác giả đưa ra một thiết kế giao thức 
MAC dựa trên lý thuyết trò chơi cho mạng 
vô tuyến và thực hiện thử nghiệm trên mạng 
vô tuyến trong nhà với 22 nút lập trình được 
dựa trên chuẩn IEEE 802.11. Các phép đo 
của tác giả cho thấy thiết kế đề xuất cho hiệu 
năng về tổng thông lượng đạt được ở cân 
bằng Nash duy nhất và độ cân bằng tải truyền 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
43 
giữa các nút mạng so với thuật toán DCF 
chuẩn. Trong bài báo số [2], các tác giả đề 
xuất một phương pháp tiếp cận mới dựa trên 
lý thuyết trò chơi để thay đổi tốc độ, điều chế 
và công suất trong thuật toán trò chơi. Tất cả 
người dùng đều hài lòng với việc kết hợp các 
quy tắc trò chơi. Tính ích kỷ của người sử 
dụng độc lập bị hạn chế trong khuôn khổ này. 
Tính ích kỷ trò chơi đạt đến điểm mong 
muốn được gọi là điểm cân bằng Nash. 
Thông qua các kết quả khác nhau, tác giả 
thấy rằng tất cả người dùng đều có một sự 
cân bằng giữa tối đa hóa lợi ích và tối thiểu 
năng lượng truyền, giữa tốc độ và kiểu điều 
chế trong chiến lược của họ. Trong các mạng 
vô tuyến đa chặng (multi-hop) [3], các nút bị 
hạn chế năng lượng và nguồn tài nguyên có 
thể gây ra hiện tượng không sẵn sàng chuyển 
tiếp gói tin cho các nút lân cận để tiết kiệm 
nguồn năng lượng. Trạng thái này của các 
nút có thể làm giảm thông lượng mạng và có 
thể làm giảm hiệu suất mạng. Trong các thiết 
kế thuật toán lý thuyết trò chơi cho việc 
chuyển tiếp lặp lại gói tin, hầu hết các công 
trình trước đây đã bỏ qua các yếu tố nhiễu 
của môi trường vô tuyến đối với hoạt động 
của các nút. Thuật toán trong bài báo này 
được so sánh với các thuật toán lý thuyết trò 
chơi nổi tiếng khác và kết quả mô phỏng 
được thực hiện để chứng minh sự tối ưu của 
thuật toán ngay cả dưới môi trường nhiễu. 
Bên cạnh các phương pháp tiếp cận liên 
quan đến chiến lược truyền ở trên, một số 
cách tiếp cận khác ( [4], [5], [6], [7], [8]) áp 
dụng lý thuyết trò chơi để nghiên cứu kiểm 
soát tranh chấp cho mạng vô tuyến. Các tác 
giả [4] đã trình bày tổng quan mô hình lý 
thuyết trò chơi để nghiên cứu sự tương tác 
giữa các nút cho các kênh vô tuyến phổ biến. 
Ngoài ra, các tác giả đã nghiên cứu sự cân 
bằng Nash của trò chơi này và thiết kế một 
phương pháp để đạt được nó theo phương 
pháp phân phối. Việc mở rộng bài toán này 
đã được thảo luận trong bài báo [5]. Trong 
bài báo này, các tác giả đã khái quát hóa 
kiểm soát truy cập trò chơi cho trường hợp 
mỗi nút có thể quan sát nhiều tín hiệu tranh 
chấp để hướng dẫn chúng cân bằng Nash và 
đưa ra các điều kiện cho sự tồn tại duy nhất 
của sự cân bằng này. Một khái niệm mới của 
lý thuyết trò chơi không hoàn toàn hợp tác đã 
được đề xuất ( [6], [7], [8]) để cải thiện hiệu 
suất của CSMA/CA trong mạng di động 
ad-hoc. Trong mô hình trò chơi này, mỗi nút 
ước lượng trạng thái trò chơi và thay đổi 
trạng thái cân bằng bằng cách thay đổi các 
tham số tranh chấp để đạt được hiệu suất tối 
ưu. Các mở rộng này đã được trình bày trong 
bài báo [8]. Trong bài báo này, các tác giả đã 
trình bày một phương pháp ước lượng điều 
kiện xác suất va chạm dựa trên kỹ thuật ảo 
hóa - CSMA và đề xuất một giao thức lý 
thuyết trò chơi MAC đơn giản mà có thể 
được thực hiện trong các mạng vô tuyến. Một 
kỹ thuật đảo ngược của giao thức truy cập 
ngẫu nhiên MAC dựa trên backoff sử dụng 
cách tiếp cận lý thuyết trò chơi đã được trình 
bày trong [9]. Như trình bày trong bài báo, 
giao thức backoff hàm mũ là kỹ thuật đảo 
ngược thông qua một trò chơi không hợp tác 
trong đó mỗi liên kết cố gắng tối đa hoá một 
hàm lợi ích cục bộ. Ngoài ra, các tác giả đã 
chứng minh sự tồn tại của cân bằng Nash và 
đã cung cấp các điều kiện cho tính đơn trị đó 
và ổn định cho các trò chơi. 
Gần đây bài toán về sự tồn tại của các 
hành vi ích kỷ trong kiểm soát truy cập môi 
trường mạng vô tuyến cũng đã thu hút sự chú 
ý của một số nhà nghiên cứu ( [10], [11], [12], 
[13]). Các tác giả [10] đã nghiên cứu hành vi 
ích kỷ của các nút trong mạng CSMA/CA 
bằng cách sử dụng lý thuyết trò chơi và phát 
triển một giao thức cục bộ và phân tán để điều 
khiển hành vi ích kỷ các nút cho đến khi cân 
bằng Nash tối ưu Pareto. Một bài toán tương 
tự đã được nghiên cứu trong [11], trong đó các 
cuộc tấn công backoff trong các mạng ad-hoc 
với các trạm nặc danh đã được phân tích trong 
hai mô hình trò chơi không hợp tác khác 
nhau: duy nhất và lặp lại các trò chơi 
CSMA/CA. Hơn nữa, các tác giả đã phát triển 
một chiến lược cho các trạm, cung cấp một 
hiệu suất Pareto và sự cân bằng Nash hoàn 
hảo của việc tái lập lại trò chơi CSMA/CA. 
Trong [12], các tác giả đã nghiên cứu sự ổn 
định của CSMA/CA trên nền tảng mạng vô 
tuyến với người dùng ích kỷ tham gia vào trò 
chơi CSMA/CA không hợp tác. Trong trò chơi 
44 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
này, giá trị của mỗi người dùng có thể tự động 
thay đổi theo tình trạng nghẽn mạng và tình 
trạng tiêu thụ năng lượng. Thêm vào đó, một 
phương pháp lặp lại có mục đích nhằm đảm 
bảo sự hội tụ cân bằng Nash đơn trị. Trong 
[13], một trò chơi truy cập ngẫu nhiên cho 
mạng vô tuyến đã được trình bày để nghiên 
cứu hành vi ích kỷ của nút mạng. Hơn nữa, 
các tác giả đã phân tích kỹ thông lượng kênh 
ở cân bằng Nash và cung cấp các phân tích 
tiệm cận của trò chơi vì số lượng các máy 
phát ích kỷ đạt đến vô cùng. Ngoài ra, trò chơi 
có ràng buộc chi phí ngẫu nhiên trong đó mỗi 
người chơi kết hợp với một chuỗi Markov của 
riêng mình được kiểm soát bởi hành động của 
chính nó đã được nghiên cứu [14]. Tại mỗi 
thời điểm, mỗi người chơi sẽ xác định một 
hành động theo cho một số chiến lược nhằm 
giảm thiểu hàm chi phí trong một số ràng 
buộc các chiến lược của nó. Sự tương tác giữa 
một số người chơi khác nhau được kết hợp 
trong hàm chi phí của họ. 
Mục tiêu của chúng tôi trong bài báo này 
là mô hình hóa cơ chế chiến lược truyền 
thông (OTS) với điều kiện trễ trong bối cảnh 
kênh vô tuyến biến thiên theo thời gian. 
Trong hệ thống OTS, trước khi gửi một gói 
tin, nút gửi đưa ra quyết định có nên gửi gói 
tin tại khe thời gian hiện tại hay trì hoãn việc 
truyền này dựa trên trạng thái kênh để giảm 
thiểu mức tiêu thụ năng lượng. Các trạng thái 
của hệ thống OTS được xây dựng như là trò 
chơi ngẫu nhiên kết hợp chi phí dựa trên quá 
trình Markov để có được chính sách truyền 
tải tối ưu. 
Phần còn lại của bài báo được bố cục 
như sau: phần 2 trình bày mô hình kênh 
truyền, phần 3 trình bày lý thuyết trò chơi, 
phần 4 đưa ra kết quả mô phỏng và đánh giá, 
phần 5 kết luận của bài báo. 
2. MÔ HÌNH KÊNH TRUYỀN 
Đề tài xem xét một mạng ad-hoc trong 
đó N nút di động sử dụng giao thức MAC 
phân khe để truy cập một kênh chung. Trong 
mạng đó, trục thời gian được chia thành các 
khe thời gian bằng chiều dài Tf và tất cả các 
nút di động được đồng bộ với cùng tham 
chiếu khe thời gian. Bất cứ khi nào nút di 
động có một gói tin đang chờ để gửi đi, nút 
sẽ thực hiện một trong hai hành động: Truyền 
và Hoãn, tương ứng với truyền gói tin và 
hoãn truyền gói tin, dựa trên trạng thái thông 
tin kênh truyền cục bộ (CSI). Giả sử CSI 
được xác định tại mỗi nút ở đầu mỗi khe thời 
gian. Ngoài ra, khe thời gian được giả định 
đủ ngắn và lưu lượng gói tin đến đủ nhỏ sao 
cho gói tin đến mỗi khe thời gian theo phân 
phối Beroulli với tham số . Giả định rằng 
kết quả của sự truyền dẫn là ngay lập tức có 
được ở cuối của mỗi khe thời gian. 
Mô hình kênh truyền Markov trạng thái 
hữu hạn (FSMC) như minh họa trong hình 1 
mô tả tính chất thay đổi theo thời gian của 
kênh truyền fading vô tuyến. Trong kênh 
truyền Rayleigh fading, SNR (y) tức thời 
nhận được phân phối theo hàm mũ với hàm 
mật độ xác suất: 
1
( )
y
yf y e
 (1) 
Với = E[y]. Đặt yi là ngưỡng của SNR 
nhận được, trong đó 0 = y0 < y1 < y2  
<yK=∞. Kênh được gọi là ở trạng thái gk, 0 ≤ 
k < K, nếu SNR nhận được trong khoảng [yk, 
yk+1). Giả sử rằng quá trình chuyển đổi trong 
mô hình FSMC xảy ra tại ranh giới của khe 
thời gian trong đó một khung có kích thước 
cố định được truyền đi và sự thay đổi chỉ 
diễn ra giữa các trạng thái gần nhau. Hơn nữa, 
độ lợi kênh truyền là hằng số trong một khe 
thời gian của truyền dẫn. Các thông số của 
mô hình Markov có thể thu được bằng cách 
sử dụng các kỹ thuật trong [15]. 
Hình 1. Mô hình kênh truyền Markov trạng 
thái hữu hạn 
Đặt mf là tần số Doppler cực đại: 
m
v
f

 (2) 
Trong đó: v là tốc độ của nút di động 
và  là bước sóng. 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
45 
Xác suất chuyển tiếp trạng thái được cho 
bởi phương trình sau: 
1
12( , 1) , 0 2
2
( , 1) , 1 1
k
yk
y
f k
g m
k
f k
g m
k
T y
P k k f e k K
T y
P k k f e k K
 (3) 
Trong đó: fm là tần số Doppler lớn nhất, 
Tf là thời gian truyền của khung, k là xác 
suất trạng thái ổn định được cho bởi phương 
trình sau: 
1
1
( )
k k
k
k
y y
y
k y
y
f y dy e e 
 (4) 
Trong trường hợp BPSK, xác suất lỗi là 
một hàm của SNR nhận được có thể được 
viết như sau: 
1 ( 2 )mP F y (5) 
F(x) là ký hiệu của hàm phân phối tích lũy 
CDF của một biến ngẫu nhiên chuẩn hóa 
được cho bởi phương trình sau: 
2
2
1
( )
2
x
F e dx
 (6) 
Với hàm mật độ xác suất của SNR trong 
công thức (1), xác suất lỗi kí tự được viết 
dưới dạng như sau 
 1
1
1
1 2
( )
1
k
k
k
k
y
y
y
b k y
y
y
e F y dy
P g
e dy
 (7) 
Công thức (7) theo chứng minh bài báo 
[15] được viết lại như sau: 
1( ) k kb k
k
P g
 
 (8) 
Trong đó: 
 2 ( 1)1 2
1
ky
k
k k
y
e F y F 

(9) 
3. LÝ THUYẾT TRÒ CHƠI 
3.1 Trò chơi ngẫu nhiên bị ràng buộc bởi 
hàm chi phí 
Trong mô hình này, tác giả xem xét một 
mạng mà trong đó có khả năng lưu trữ nhiều 
nhất một gói tin ở mỗi nút đối với các ứng 
dụng đòi hỏi dữ liệu mới nhất. Như vậy 
khung hiện tại trong bộ đệm được thay thế 
bằng một khung mới đến. Độ nhạy thời gian 
trễ của gói tin được mô hình hóa qua D khe 
thời gian cho mỗi khung. Điều này có nghĩa 
rằng một khung có thời gian dài hơn D khe 
thời gian phải được loại bỏ. Trạng thái của 
hệ thống tại khe thời gian i được kí hiệu như 
sau: 
,i i ix g n (10) 
Trong đó: gi là trạng thái kênh truyền tại 
khe thời gian i, 0 ≤ gi < K và ni là trạng thái 
của nút di động tại khe thời gian i. Trạng 
thái có thể có của nút di động bao gồm I là 
trạng thái rỗi và (D+1) trạng thái trễ trong 
đó D tương ứng thời gian trễ tối đa của 
khung. Đặt I và Dk (k = 0,1,..., D) biểu thị 
tương ứng trạng thái rỗi, (D+1) trạng thái trễ. 
Nút di động được cho là ở trạng thái trễ thứ 
k (được kí hiệu bằng Dk) khi khung bị trì 
hoãn bởi k khe thời gian và ở trạng thái rỗi 
khi không có khung tin. Đặt Ai(xi) là kí hiệu 
cho tập hợp tất cả các hành động điều khiển 
có thể có cho nút i ở trạng thái xi. ai là hành 
động điều khiển được thực hiện tại khe thời 
gian i. 
Mỗi hành động trong tập A(xi) tương 
ứng với các giá trị sau: 
𝑎𝑖 = {
0,
1,
 𝐻𝑜ã𝑛 
𝑇𝑟𝑢𝑦ề𝑛
 (11) 
Đặt 1( , , )n i iP n n a kí hiệu xác suất 
chuyển đổi của nút di động từ trạng thái in 
đến 1in dưới sự điều khiển hành động a 
theo sơ đồ trạng thái thể hiện trong hình 2 
[16]. Trong mô hình này, các nút mạng 
không áp dụng cơ chế truyền lại cho các gói 
tin lỗi và các nút mạng không có thông tin 
về xác suất xung đột gói tin. Cho trạng thái 
hệ thống ,i i ix g n và hành động điều 
khiển 
i
a , xác suất của hệ thống đang ở trạng 
thái 
1 1 1,i i ix g n trong khe thời gian tiếp 
theo là: 
 1 1 1Pr | , ( , ) ( , , )i i i g i i n i ix x a a P g g P n n a (12) 
46 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
1 - α 
I D0 D1 DD
α 
α 
1 - α 
1 - α 
1 - α 
1 - α 
1 - α 
α 
1 - α 
α 
α ---
Truyền
Hoãn truyền
α 
α 
 Hình 2. Sơ đồ trạng thái truyền dẫn với ràng 
buộc trễ 
Trong đó: 1( , )g i iP g g là xác suất chuyển 
đổi trạng thái kênh từ 
ig đến 1ig và xác suất 
chuyển đổi trạng thái nút 
1( , , )n i iP n n a được 
cho bởi 
0
1
0
( , ,.) (1 )
( , ,.)
( , ,0) (1 ), 0,..., 1
( , ,0) (1 )
( , ,.) , 0,...,
( , ,1) (1 ), 1,...,
t
t
t i i
t D
t i
t i
P I I
P I D
P D D i D
P D I
P D D i D
P D I i D
 (13) 
Dựa theo mô hình 2, tác giả [16] đã bỏ 
qua các yếu tố nhiễu của môi trường vô 
tuyến đối với hoạt động của các nút. Điều 
này đã thúc đẩy chúng tôi nghiên cứu ảnh 
hưởng của nhiễu đến xác suất truyền gói tin. 
Trong trường hợp nút mạng sử dụng cơ chế 
truyền lại đối với các gói tin lỗi với giả thiết 
gói tin có xác suất lỗi là Pf và xác suất xung 
đột của các gói tin được giả thiết là d. Các 
mô hình này sẽ mô tả cụ thể trong hình 3 đối 
với mô hình chỉ xét đến cơ chế truyền lại với 
xác suất lỗi gói tin do kênh truyền và hình 4 
với mô hình xét đến cơ chế truyền lại do lỗi 
kênh truyền và xung đột gói tin. 
I D0 D1 DD
α 
α 
(1 - α )
(1 - α )
(1 - α )
(1 - α ).(1-Pf)
(1 - α) 
α α 
α ---
Truyền
Hoãn truyền
(1 - α ).(1-Pf)
(1 - α ).Pf
(1 - α ).Pf
1 - α 
α 
α 
Hình 3. Sơ đồ trạng thái truyền dẫn với ràng 
buộc trễ và truyền lại tập tin khi có lỗi kênh 
truyền Pf 
Như hình 3, xác suất chuyển đổi trạng 
thái nút 
1( , , )n i iP n n a được cho bởi 
0
1
1
0
( , ,.) (1 )
( , ,.)
( , ,0) (1 ), 0,..., 1
( , ,1) (1 ). , 0,..., 1
( , ,0) (1 )
( , ,:) , 0,...,
( , ,1) (1 )(1 ), 1,...,
t
t
t i i
t i i f
t D
t i
t i f
P I I
P I D
P D D i D
P D D P i D
P D I
P D D i D
P D I P i D
 (14) 
Trong đó Pf là xác suất lỗi kênh truyền 
Hình 4 là mô hình trạng thái của nút thực 
hiện truyền lại tập tin khi có lỗi khung tin Pf 
và xung đột d. 
1( , , )n i iP n n a là kí hiệu xác 
suất chuyển đổi của nút di động từ trạng thái 
in đến 1in dưới sự điều khiển hành động a 
theo sơ đồ trạng thái thể hiện trong hình 4. 
Truyền
Hoãn truyền
I D0 D1 DD
α 
(1 - α )
(1 - α )
(1 - α )
(1 - α) 
α α 
α ---
(1 - α ).Pf
(1 - α ).(1-Pf).(1-d)
(1 - α ).Pf.d
(1 - α ).Pf.d
(1 - α ).(1-Pf).(1-d)
(1 -α) .Pf
α 
α 1 - α 
Hình 4. Sơ đồ trạng thái truyền dẫn với ràng 
buộc trễ, xác suất xung đột d, lỗi kênh 
truyền Pf 
Như hình 4, xác suất chuyển đổi trạng 
thái nút 
1( , , )n i iP n n a được cho bởi 
0
1
1
0
( , ,.) (1 )
( , ,.)
( , ,0) (1 ), 0,..., 1
( , ,1) (1 ). . (1 ). , 0,..., 1
( , ,0) (1 )
( , ,:) , 0,...,
( , ,1) (1 )(1 )(1 ), 1,...,
t
t
t i i
t i i f f
t D
t i
t i f
P I I
P I D
P D D i D
P D D P d P i D
P D I
P D D i D
P D I P d i D
(15) 
Các chiến lược lựa chọn bởi tất cả các 
nút di động xác định chi phí cho mỗi nút di 
động. Dưới trạng thái hệ thống
1 2( , ,..., )
t t t t
Nx x x x và các hành động điều khiển 
1 2( , ,..., )
t t t t
Na a a a của tất cả các nút di động tại 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
47 
thời điểm t, chi phí cho mỗi nút di động được 
cho bởi công thức sau 
, ,
( , ) {max (a )+ [1-max (a )]P (g )}Et t t t t ti i j j f i c
j j i j j i
e x a a 
 (16) 
Trong đó Ec là mức tiêu thụ năng lượng 
mỗi khung. Trọng số  , (0 1) , được sử 
dụng để chỉ mối quan hệ của va chạm khung 
tin và lỗi khung tin của kênh truyền. P (g )f i 
là xác suất lỗi khung khi trạng thái kênh là 
ig . Giả định lỗi bit độc lập, xác suất lỗi 
khung P (g )f i cho khung kích thước L và 
trạng thái kênh 
ig có công thức như sau: 
P (g ) 1 (1 ( ))Lf i b iP g (17) 
Trong đó ( )b iP g thu được từ công thức (8) 
Để tránh lãng phí năng lượng, nút có thể 
hoãn việc truyền tải bất cứ khi nào có thể với 
sự chấp nhận được việc tràn bộ nhớ đệm. Với 
trạng thái 
t
ix và hành động điều khiển 
t
ia , 
tràn bộ nhớ đệm của nút i cho bởi 
𝑙𝑖
𝑡(𝑥𝑖
𝑡, 𝑎𝑖
𝑡) = {
∝, 𝑛𝑖
𝑡 = 𝐷𝑘 𝑣à 𝑎𝑖
𝑡 = 𝐻𝑜ã𝑛 
1, 𝑛𝑖
𝑡 = 𝐷𝐷 𝑣à 𝑎𝑖
𝑡 = 𝐻𝑜ã𝑛
0, 𝐾ℎá𝑐
 (18) 
Trong đó 0 k D 
Cho ( | )i i iu a x kí hiệu của xác suất nút 
di động có hành động điều khiển a khi nút ở 
trạng thái ix , i biểu thị phân bố xác suất 
của trạng thái khởi tạo 
0t
ix
. Ràng buộc kỳ 
vọng tràn bộ đệm trung bình có thể được 
định nghĩa như sau 
 
,
1
0
1
lim sup ( , )i
i i i
T
i t t t i
i const
T t
L E l x a L
T

  
  (19) 
Định nghĩa các vectơ 1 2( , ,..., )Nu u u u 
và 1 2( , ,..., )N    tương ứng là tập hợp 
các chiến lược và trạng thái phân phối xác 
suất ban đầu cho tất cả các nút di động. Chi 
phí trung bình cho mỗi giai đoạn của mỗi nút 
di động được xác định như sau 
 
1
,
0
1
lim sup ( , )
T
i u t t
u i
T t
E E e x a
T
 
  (20) 
Mục tiêu của mỗi nút là tìm ra chiến 
lược tối ưu iu để đạt cực tiểu ,
i
uE (20) 
thoả điều kiện (19). Đặt 
iE là giá trị tối ưu 
của OP. Một quy tắc đạt được ,
i i
uE E  gọi 
là tối ưu cho OP. Kí hiệu 
iU  là tập tất cả các 
chính sách tối ưu đó. 
3.2 Quy hoạch tuyến tính 
Một phương pháp giải quyết OP dựa trên 
giải pháp của quy hoạch tuyến tính sẽ được 
trình bày như bên dưới. Tầm quan trọng của 
phương pháp này nằm ở thực tế là phương 
pháp cũng cho phép xử lý các vấn đề tối ưu 
hóa với các ràng buộc bổ sung, trong đó các 
phương pháp khác (dựa trên lập trình động) 
không áp dụng được. 
Chúng ta bắt đầu bằng mô tả phản ứng 
tối ưu cố định cho nút i được tính toán cho 
một đa quy tắc cố định u. Sửa đổi quy tắc cố 
định iu nút i. Chúng ta có công thức sau với 
mọi i ix X và i iy X 
( )
( | )
i i
x u y x a yi i i i i i
i i i
i i i
a A x
u a x 
  (21) 
Kí hiệu chi phí tức thời do nút khác i gây 
ra khi nút i sử dụng hành động điều khiển ia 
và những nút khác sử dụng đa quy tắc cố 
định iu cho bởi phương trình sau 
,
( , )
( , ) ( | ) ( ) ( , )
i i
j u u t t
i i i l l l l l i
x a K l i
e x a u a x x e x a 
  (22) 
Trong đó: 
u
l là xác suất trạng thái ổn 
định (bất biến) của chuỗi Markov mô tả quá 
trình trạng thái của nút i khi sử dụng quy tắc 
u, ( , )
t t
ie x a chi phí của nút di động i 
Tập tất cả phản ứng tối ưu nút i dựa trên 
chính sách iu có thể thu được bằng cách sử 
dụng phương trình tuyến tính được định 
nghĩa trong [14]. 
Phương trình tuyến tính (i,u): tìm 
* *
,: { ( , )}i i x az z x a , trong đó ( , ) ix a K , sao 
cho phương trình (22) nhỏ nhất 
,
( , )
( , ) ( , )
i
j u
i i
x a K
e x a z x a
 (23) 
48 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
Thỏa điều kiện 
ar[ ( )- ] ( , ) 0,
i i
i
r x i i
x X a A
x z x a r X 
    (24) 
( , ) ( , )
i i
i i const
x X a A
l x a z x a L
   (25) 
( , )
( , ) 0, ( , ) , ( , ) 1
i
i i i
x a K
z x a x a K z x a
   (26) 
Trong đó arP .
i
x g nP P 
( )r x : hàm Kronecker delta là một hàm của 
hai biến, thường chỉ là các số không âm. 
Hàm bằng 1 nếu các biến bằng nhau và bằng 
0 nếu các biến khác nhau: 
0
( )
1
r
r x
x
r x

 (27) 
4. KẾT QUẢ MÔ PHỎNG 
Bảng 1. Các tham số mô phỏng 
Tham số Giá trị 
Số nút mạng 2-10 
Thời gian truyền khung (Tf ) 1ms 
SNR trung bình 10dB 
Kích thước gói tin (L) 80 (bytes) 
Kích thước gói tin điều khiển 8 (bytes) 
Tần số Doppler (fm) 10Hz 
Yếu tố trọng số trong hàm chi phí () 0.5 
Bảng 1 tóm tắt giá trị các tham số được 
sử dụng trong các thí nghiệm của tác giả. 
Trong phần này, tác giả phân tích các đặc 
tính của mô hình OTS và thực hiện các thí 
nghiệm khác nhau để điều tra các đặc tính 
của mô hình OTS. 
Hình 5. Ngưỡng truyền tối ưu theo phương 
pháp truyền tải cơ hội trong điều kiện không 
phụ thuộc khe thời gian trễ khi D=2 và 
fm=5Hz 
Hình 6. Ngưỡng truyền tối ưu theo phương 
pháp truyền tải cơ hội trong điều kiện không 
phụ thuộc khe thời gian trễ khi D=2 và 
fm=10Hz 
Hình 5 và Hình 6 cho thấy các tác động 
của kênh biến thiên theo thời gian lên 
ngưỡng truyền tối ưu trong điều kiện không 
phụ thuộc khe thời gian trễ. Như thể hiện 
trong Hình 5 và Hình 6, các trạng thái kênh 
truyền được phân chia thành bộ các trạng thái 
biểu diễn bởi các tập B, M và G. Tập B chứa 
các trạng thái 0 k Dthg g trong đó kênh 
truyền ở trạng thái và truyền dẫn luôn luôn bị 
hoãn. Các SNR tương ứng đến Dthg là 
ngưỡng hoãn truyền. Tập M bao gồm các 
trạng thái Dth k Tthg g g trong đó nút truyền 
gói với xác suất tối ưu p* và SNR tương ứng 
với Tthg là ngưỡng truyền tối ưu. Theo Hình 
5 và Hình 6, mô hình OTS cải tiến truyền lại 
tập tin lỗi có xác suất truyền tối ưu lớn hơn 
so với xác suất truyền tối ưu mô hình ban đầu 
do cơ chế cập nhật xác suất lỗi vào trạng thái 
truyền dẫn của nút, góp phần hạn chế hoãn 
truyền gói tin gây lỗi tràn bộ nhớ. 
Hình 7. Ngưỡng truyền tối ưu theo phương 
pháp truyền thông cơ hội phụ thuộc khe thời 
gian trễ khi fm=10Hz và D=4 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
49 
Hình 8. Ngưỡng truyền tối ưu theo phương 
pháp truyền thông cơ hội phụ thuộc khe thời 
gian trễ khi fm=10Hz và D=8 
Hình 7 và Hình 8 thể hiện tác động của 
kênh truyền biến thiên lên ngưỡng truyền tối 
ưu với các ràng buộc trễ (D). Khi điều kiện 
ràng buộc độ trễ (D) trở nên thoải mái hơn, 
chiến lược truyền tải tối ưu sẽ hội tụ đến 
hành động hoãn truyền, dẫn đến ngưỡng 
truyền tăng lên. Như minh họa ở Hình 7 và 
Hình 8, ngưỡng ngưng và ngưỡng truyền 
tăng khi kênh truyền biến thiên nhanh hơn 
hoặc thời gian trễ trở nên không nhạy cảm. 
Quan sát này là trực quan vì việc hoãn truyền 
để xem xét một kênh tốt hơn là cần thiết để 
giảm chi phí của thất bại truyền tải khi kênh 
fading biến thiên nhanh. Theo Hình 7 và 
Hình 8, mô hình OTS cải tiến truyền lại tập 
tin lỗi có ngưỡng hoãn truyền và ngưỡng 
truyền nhỏ hơn ngưỡng hoãn truyền và 
ngưỡng truyền mô hình ban đầu, giúp cho 
gói tin được truyền đi dễ dàng hơn trong khi 
vẫn đảm bảo số lần truyền dẫn thành công 
giúp nâng cao hiệu suất truyền dẫn 
5. KẾT LUẬN 
Đề tài trên đã phát triển mô hình truyền 
gói tin cơ hội dựa trên lý thuyết trò chơi kết 
hợp hàm chi phí để khảo sát các đặc tính của 
mô hình OTS sử dụng cơ chế truyền lại tập 
tin và mô hình OTS không sử dụng cơ chế 
truyền lại tập tin, một chiến lược truyền 
thông cơ hội cho các mạng vô tuyến có kênh 
truyền biến thiên theo thời gian được rút ra. 
Đề tài đã tiến hành nhiều thí nghiệm để quan 
sát và phân tích hành vi của mô hình OTS 
qua lỗi tràn bộ đệm trong phạm vi các ứng 
dụng nhạy với thời gian trễ. Một chính sách 
truyền thông tối ưu được rút ra cho sơ đồ 
OTS, mô hình OTS truyền lại tập tin lỗi cho 
xác suất truyền tối ưu lớn hơn xác suất 
truyền tối ưu mô hình không có cơ chế 
truyền lại tập tin lỗi, trong đó nút di động 
chỉ bắt đầu truyền khi chất lượng kênh vượt 
qua ngưỡng tối ưu, do đó tránh được bất cứ 
sự truyền dẫn không thành công gây lãng 
phí năng lượng và giúp kéo dài thời gian 
hoạt động của mạng. 
TÀI LIỆU THAM KHẢO 
[1] S. Chakraborty, D. Dash, D. K. Sanyal, S. Chattopadhyay, M. Chattopadhyay, 
"Game-theoretic wireless CSMA MAC protocols: Measurements from an indoor 
testbed," IEEE Conference on Computer Communications Workshops (INFOCOM 
WKSHPS), 2016, pp. 1063 - 1064. 
[2] M. Aliaskari, A. Shahzadi, "A game theoretic approach to joint resource management in 
wireless ad hoc networks," in Proceedings of the 8th IEEE International Symposium on 
Telecommunications (IST), 2016, pp. 6-11. 
[3] O. Baig, Y. S. AI-Harthi, E. Al-Tubaishi, "Game-theoretic algorithm stimulating 
cooperation in multi-hop wireless networks," in Proceedings of the 5th International 
Conference on Game Theory for Networks, 2014, pp. 1-5. 
[4] L. Chen, S. Low, and J. Doyle, "Contention control: A game-theoretic approach," in 
Proceedings of the 46th IEEE Corference on Decision and Control (CDC 2007), Dec. 
2007, pp. 3428-3434. 
[5] T. Cui, L. Chen, and S. Low, "A game-theoretic famework for medium access control," 
IEEE J Set. Areas Commun., vol. 26, no. 7, pp. 1116-1127, September 2008. 
[6] L. Zhao, J. Zhang, K. Yang, and H. Zhang, "Using incompletely cooperative game theory 
in mobile ad hoc networks," in Proceedings of IEEE International Corerence on 
Communications (ICC 2007), June 2007, pp. 3401-3406. 
50 
Tạp Chí Khoa Học Giáo Dục Kỹ Thuật Số 50 (11/2018) 
Trường Đại Học Sư Phạm Kỹ Thuật TP. Hồ Chí Minh 
[7] L. Zhao, J. Zhang, and H. Zhang, "Gdcf: game-theoretic distributed co-ordination 
function in wlans," Electronics Letters, vol. 43, no. 9, pp. 510-511,26 2007. 
[8] L. Zhao, J. Zhang, H. Zhang, "Using incompletely cooperative game theory in wireless 
mesh networks," IEEEIACM Trans. Netw., vol. 22, no. 1, pp. 39-44, Jan.-Feb. 2008. 
[9] L. Jang-Won, T. Ao, H. Jianwei, M. Chiang, and A. Robert, "Rever-seengineering mac: 
A non-cooperative game model," IEEE J Sel. Areas Commun., vol. 25, no. 6, pp. 
1135-1147, August 2007. 
[10] M. Cagalj, S. Ganeriwal, I. Aad, and J.-P. Hubaux, "On selfish behavior in csma/ca 
networks," in Proceedings of the 24th Annual Joint Corerence of the IEEE Computer and 
Communications Societies (INFOCOM 2005), vol. 4, March 2005, pp. 2513-2524 vol. 4. 
[11] J. Konorski, "A game-theoretic study of csma/ca under a backoﬀ attack," IEEE/ACM 
Trans. Netw., vol. 14, no. 6, pp. 1167-1178, Dec. 2006. 
[12] Y Jin and G. Kesidis, "Distributed contention window control for selfish users in ieee 802.11 
wireless lans," IEEE J Set. Areas Commun., vol. 25, no. 6, pp. 1113-1123, August 2007. 
[13] H. Inaltekin and S. Wicker, "The analysis of nash equilibria of the oneshot random-access 
game for wireless networks and the behavior of selfish nodes," IEEE/ACM Trans. Netw., 
vol. 16, no. 5, pp. 1094-1107, Oct. 2008. 
[14] E. Altmana, K. Avrachenkova, N. Bonneaua, M. Debbahc, R. EIAzouzid, and D. S. 
Menaschee, "Constrained cost-coupled stochastic games with independent state 
processes," Operations Research Letters, vol. 36, no. 2, pp. 160-164, Mar. 2008. 
[15] H. S. Wang and N. Moayeri, "Finite-state markov channel-a useful model for radio 
communication channels," IEEE Trans. Veh. Technol., vol. 44,no. I,pp. 163-171, Feb. 1995. 
[16] Ca Van Phan, "A game-theoretic framework for opportunistic transmission in wireless 
networks," Proceeding of the International Conference on Communications and 
Electronics (ICCE’14), Danang, Vietnam, July 2014. 
Tác giả chịu trách nhiệm bài viết: 
Nguyễn Chánh Tín 
Trường Đại học Sư phạm Kỹ thuật TP. HCM 
Email: [email protected]
File đính kèm:
toi_uu_co_hoi_truyen_goi_tin_trong_mang_vo_tuyen_su_dung_ly.pdf