Mã hóa lai nguồn-kênh với băng thông mở rộng

Tóm tắt: Kiến trúc mã hóa lai nguồn-kênh đã được sử dụng rộng rãi trong lĩnh

vực truyền thông, đặc biệt là truyền các loại dữ liệu âm thanh, tiếng nói và video.

Mã hóa lai nguồn kênh kết hợp ưu điểm của cả mã hóa số và mã hóa tương tự để

nâng cao chất lượng truyền dữ liệu trong nhiều điều kiện kênh khác nhau. Mặc dù

vậy, trong các nghiên cứu đã có, kiến trúc mã hóa nguồn-kênh chỉ áp dụng cho các

tín hiệu liên tục. Trong bài báo này, chúng tôi tiếp cận bài toán truyền thông tin từ

nguồn rời rạc, qua các loại kênh truyền nhiễu. Cụ thể, bài báo đề xuất mô hình

truyền thông tin dành cho dữ liệu tiếng nói với mã hóa PCM. Chúng tôi giới thiệu

hai mô hình cho phần mã hóa tương tự: mã hóa tuyến tính và mã hóa phi tuyến. Mô

hình mã hóa tuyến tính áp dụng cơ chế bảo vệ thông tin cân bằng truyền thống,

trong khi mô hình mã hóa phi tuyến sử dụng chỉ số độ quan trọng của các giá trị

nguồn để áp dụng cơ chế bảo vệ thông tin bất cân bằng. Kết quả thực nghiệm cho

thấy, mô hình mã hóa nguồn kênh trong bài báo đưa ra kết quả tốt hơn so với hệ

thống mã hóa số truyền thống, trên nhiều điều kiện kênh truyền khác nhau.

pdf 12 trang phuongnguyen 8240
Bạn đang xem tài liệu "Mã hóa lai nguồn-kênh với băng thông mở rộng", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Mã hóa lai nguồn-kênh với băng thông mở rộng

Mã hóa lai nguồn-kênh với băng thông mở rộng
Kỹ thuật điều khiển & Điện tử 
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 66 
MÃ HÓA LAI NGUỒN-KÊNH VỚI BĂNG THÔNG MỞ RỘNG 
Nguyễn Minh Quang1, 2*, Nguyễn Đăng Tiến3 
Tóm tắt: Kiến trúc mã hóa lai nguồn-kênh đã được sử dụng rộng rãi trong lĩnh 
vực truyền thông, đặc biệt là truyền các loại dữ liệu âm thanh, tiếng nói và video. 
Mã hóa lai nguồn kênh kết hợp ưu điểm của cả mã hóa số và mã hóa tương tự để 
nâng cao chất lượng truyền dữ liệu trong nhiều điều kiện kênh khác nhau. Mặc dù 
vậy, trong các nghiên cứu đã có, kiến trúc mã hóa nguồn-kênh chỉ áp dụng cho các 
tín hiệu liên tục. Trong bài báo này, chúng tôi tiếp cận bài toán truyền thông tin từ 
nguồn rời rạc, qua các loại kênh truyền nhiễu. Cụ thể, bài báo đề xuất mô hình 
truyền thông tin dành cho dữ liệu tiếng nói với mã hóa PCM. Chúng tôi giới thiệu 
hai mô hình cho phần mã hóa tương tự: mã hóa tuyến tính và mã hóa phi tuyến. Mô 
hình mã hóa tuyến tính áp dụng cơ chế bảo vệ thông tin cân bằng truyền thống, 
trong khi mô hình mã hóa phi tuyến sử dụng chỉ số độ quan trọng của các giá trị 
nguồn để áp dụng cơ chế bảo vệ thông tin bất cân bằng. Kết quả thực nghiệm cho 
thấy, mô hình mã hóa nguồn kênh trong bài báo đưa ra kết quả tốt hơn so với hệ 
thống mã hóa số truyền thống, trên nhiều điều kiện kênh truyền khác nhau. 
Từ khóa: Mã hóa lai nguồn-kênh, Mã hóa số, Mã hóa tương tự, Truyền thông tin từ nguồn rời rạc. 
1. GIỚI THIỆU 
Trong bài báo này, chúng tôi đề xuất một mô hình truyền tín hiệu rời rạc qua kênh 
không nhớ Gausian, rời rạc về thời gian. Cụ thể, hệ thống được đề xuất truyền dữ liệu 
tiếng nói dưới dạng số giữa hai điểm để giải quyết một trong những vấn đề của các hệ 
thống truyền âm thanh đó là đảm bảo chất lượng âm thanh ở mức độ tốt, đồng thời giới 
hạn băng thông sử dụng. 
Dựa trên lý thuyết Shannon về kết hợp mã hóa nguồn và mã hóa kênh, các hệ thống 
truyền tin thông thường áp dụng mô hình mã hóa nguồn-kệnh độc lập. Nói cách khác, mã 
hóa nguồn được lựa chọn mà không cần thông tin về mã hóa kênh và mã hóa kênh không 
cần quan tâm đến phân bố đầu ra của mã hóa nguồn. Hơn nữa, trong một số hệ thống truyền 
tin multimedia, một số phần thông tin được gán độ quan trọng cao hơn các phần thông tin 
khác, nên được bảo vệ bằng các loại mã hóa kênh tốt hơn các thông tin khác. Chiến lược này 
được gọi là bảo vệ bất cân bằng (UEP - Unequal error protection). Việc áp dụng chiến lược 
này đem lại hiệu quả cao hơn so với hệ thống truyền thống, nhất là với các loại dữ liệu 
multimedia. Trong các công trình đã được công bố, có hai hướng phát triển chính khi áp 
dụng mô hình UEP: Bảo vệ theo vị trí dữ liệu (bit-wise UEP) và bảo vệ theo giá trị gói tin 
(message-wise UEP) [1]. Với mô hình bảo vệ theo vị trí dữ liệu, các bit trong gói tin gửi đi 
sẽ được chia thành các tập con, mỗi tập con được gán một độ quan trọng, ứng với các mức 
độ bảo vệ khác nhau. Trong khi đó, mô hình bảo vệ theo gói tin, các gói tin được chia thành 
các tập con. Mỗi tập con được gán các mức độ bảo vệ khác nhau. 
Tuy nhiên, một nhược điểm của các hệ thống số với mô hình mã hóa nguồn-kênh là 
hiệu ứng "chững lại" (leveling-off effect) [2], trong đó, hiệu năng của hệ thống dừng lại ở 
một mức cố định, dù tỉ số tín hiệu trên nhiễu tiến đến vô cùng. Các hệ thống mã hóa lai 
không có nhược điểm này, nhờ hoạt động của phần mã hóa tương tự. Cụ thể, trong mô 
hình mã hóa lai số-tương tự, ta có thể sử dụng kết hợp mã hóa nguồn và mã hóa kênh ở 
phần mã hóa số để bảo vệ dữ liệu và tăng hiệu quả truyền thông trong các điều kiện kênh 
xấu. Thêm vào đó, bộ ánh xạ tương tự ở phần mã hóa tương tự giúp tăng hiệu năng của hệ 
thống ở các kênh có chỉ số CSNR cao. Nhiều mô hình mã hóa lai số-tương tự đã được 
nghiên cứu và giới thiệu trong các công trình đã được công bố. Trong các hệ thống truyền 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 67
thông giữa hai điểm, Mittal và Phamdo [3] đề xuất ba mô hình mã hóa lai để tăng chất 
lượng truyền tin, đặc biệt là về vùng nhiễu có thể đạt được. Dựa trên các thiết kế đó, 
Skoglund và đồng sự [4] đề xuất mô hình mã hóa tuyến tính và mã hóa phi tuyến tính cho 
phần tương tự, có thể áp dụng vào mọi giá trị băng thông. Với dữ liệu tiếng nói, các công 
trình được trình bày trong [5], [6], [7] đã áp dụng thiết kế mã hóa lai để tăng chất lượng 
truyền tiếng nói so với mô hình mã hóa số trong một vài dải CSNR khác nhau. Matthias và 
cộng sự [8], [9] đã công bố một vài phiên bản của hệ mã hóa lai có sử dụng điều chế 
pulse-code và Adaptive DPCM. Tuy nhiên, thiết kế mã hóa tuyến tính và phi tuyến tính 
của họ ở phần tương tự, sử dụng đường cong Archimedes [10], chỉ hoạt động với tín hiệu 
liên tục. Rất ít các công trình đã công bố tập trung vào việc ứng dụng mã hóa lai cho tín 
hiệu rời rạc. 
Trong bài báo này, chúng tôi đưa ra mô hình truyền thông giữa hai điểm, trong đó, dữ 
liệu tiếng nói được truyền qua kênh nhiễu Gaussian với sự hỗ trợ của mã hóa lai số-tương 
tự. Chúng tôi quan sát thấy các lợi ích đạt được khi khai thác ưu điểm của mã hóa tương tự 
khi truyền thông trong các kênh ở các dải CSNR cao. Cụ thể, bằng cách sử dụng một cách 
mã hóa thích hợp, dữ liệu số đã được nén bằng phần số được truyền tải đồng thời với việc 
truyền tải các giá trị lỗi, các giá trị biểu diễn thông tin mất mát khi thực hiện quá trình 
nén/giải nén. Mặt khác, chúng tôi nhận thấy các giá trị lỗi với tần số xuất hiện lớn sẽ có độ 
quan trọng lớn hơn các giá trị lỗi còn lại. Do đó, chúng cần được bảo vệ tốt hơn. Xuất phát 
từ các quan sát trên, ý tưởng của bài báo này là áp dụng cơ chế bảo vệ bất cân bằng vào 
phần tương tự để bảo vệ các giá trị lỗi quan trọng, qua đó, giảm được độ méo của dữ liệu 
nhận được. Đóng góp trong bài báo này có thể tóm tắt như sau: 
 Ứng dụng kiến trúc mã hóa lai số-tương tự vào truyền thông cho nguồn rời rạc, trong 
đó, các giá trị rời rạc được lấy từ dữ liệu tiếng nói. 
 Sử dụng mô hình mã hóa tuyến tính cho các giá trị lỗi rời rạc. Mô hình đề xuất trong 
bài báo này là sự mở rộng của mô hình đã được công bố trong [4]. Chúng tôi cũng đề 
xuất một mô hình mã hóa phi tuyến tính, trong đó sử dụng kĩ thuật bảo vệ theo gói tin 
để tăng hiệu quả của bộ tương tự. 
 Xây dựng chương trình mô phỏng và chứng minh chất lượng truyền thông của mô 
hình đề xuất. 
 Phần còn lại của bài báo được tổ chức như sau. Sau phần giới thiệu về mô hình mã hóa 
số-tương tự ở mục II-A, bài báo mô tả hệ thống mã hóa lai số-tương tự cho dữ liệu tiếng 
nói ở mục II-B. Ở mục III, chúng tôi mô tả chi tiết phương pháp mã hóa tuyến tính và phi 
tuyến tính cho phần tương tự và sau đó, các kết quả thực nghiệm được mô tả ở mục IV. 
Cuối cùng, các kết luận được đưa ra ở phần V. 
2. KIẾN TRÚC MÃ HÓA LAI SỐ-TƯƠNG TỰ 
2.1. Kiến trúc truyền thống 
Hình 1. Mô hình tổng quát của hệ thống mã hóa số-tương tự. 
Kỹ thuật điều khiển & Điện tử 
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 68 
Trong phần này, chúng tôi trình bày mô hình mã hóa lai số-tương tự cho truyền tín hiệu 
tương tự qua kênh rời rạc không nhớ. Các phiên bản của mô hình này đã được công bố 
trong [4], [11]. Hình 1 mô tả mô hình tổng quát của một hệ thống mã hóa số tương tự, 
trong đó, phần số và phần tương tự được kết hợp với nhau. Dưới đây là mô tả chi tiết cách 
thức hoạt động của hệ thống. 
2.1.1. Phần truyền tin 
Tại phần truyền tin, n mẫu iX từ nguồn rời rạc được nhóm lại thành một khối 
nX . Bộ mã hóa nguồn, trong đó chứa một bộ mã gồm N vector 0,..., nS S , lấy 
nX làm 
đầu vào và ánh xạ nX tới một trong số các từ mã của nó. Mỗi từ mã là một nhóm gồm n 
mẫu. Chú ý rằng, bộ mã hóa và giải mã cần thống nhất trước về danh sách từ mã trong bộ 
mã. Đầu ra của bộ mã hóa nguồn, một chỉ số I của một từ mã, được đưa vào bộ mã hóa 
kênh. Bộ mã hóa kênh này sẽ đưa ra kí hiệu kênh kIs , trong đó k n . Chỉ số I đồng thời 
cũng được chuyển đến bộ giải mã nguồn. Tại đây, một từ mã IS được chọn ra tương ứng. 
Tại phần tương tự, một vector chứa các giá trí lỗi nE được tính bằng cách thực hiện 
phép trừ với IS từ 
nX . Vector lỗi nE sau đó được gửi đến bộ mã hóa tương tự, trong đó, 
nE được ánh xạ tới một vector k chiều 1( ,..., v )
k
kV v , trong đó ,1iv R i k . Hệ 
thống thực hiện cộng đầu ra kIs của bộ mã hóa kênh và vector 
kV và kết quả của phép tính 
này, kR , được gửi đến nơi nhận qua kênh nhiễu. 
Chú ý rằng, kí hiệu kênh kIs phải thỏa mãn || s || k (1 t) P
k
IE   , trong đó P là tổng 
năng lượng trong một lần sử dụng kênh và 0 ≤ t ≤ 1. Thêm vào đó, đầu ra của bộ mã hóa 
kV phải thỏa mãn ràng buộc năng lượng || s || k (1 t) PkIE   . 
2.1.2. Phần nhận tin 
Tại phần nhận tin, sau khi nhận được gói tin ˆ kR từ kênh, một bộ giải mã kênh lấy ˆ kR 
làm đầu vào và đưa ra một giá trị chỉ số Iˆ ,là giá trị định giá của I ở phần truyền tin. Chỉ số 
Iˆ sau đó được đưa vào bộ giải mã nguồn, nơi sẽ sử dụng Iˆ để đưa ra vector ˆ
ˆ n
I
X S  , 
ˆ nX là ước lượng của nX ở phần mã hóa số. 
Cùng lúc đó, chỉ số Iˆ cũng được truyền tới bộ giải mã kênh để tạo ra kí hiệu kênh ˆ
k
I
s . 
Lúc này, ˆ
k
I
s được trừ từ ˆ kR để đưa ra vector 1
ˆ ˆ ˆ( ,..., v )k kV v , một ước lượng của 
kV ở 
phần gửi tin. Bộ giải mã tương tự sẽ ánh xạ ˆ kV tới ước lượng ˆ nE của vector chứa các giá 
trị lỗi nE . Cuối cùng, ước lượng của nX đưa ra bởi hệ thống mã hóa lai được tính bằng 
cách cộng ˆ nE vào
ˆ nX . 
2.2. Hệ thống mã hóa lai cho dữ liệu tiếng nói 
Ý tưởng chính trong bài báo này là mở rộng mô hình mã hóa lai số-tương tự và áp dụng 
cho truyền thông với các nguồn rời rạc. Trong hệ thống đề xuất, phần mã hóa và giải mã 
số làm việc tương tự như phần mã hóa/giải mã số của hệ thống truyền thống đã mô tả ở 
phần trên. Cụ thể, chúng tôi sử dụng một bộ mã hóa AMR, một bộ mã hóa kênh turbo 
code và một bộ điều chế pha nhị phân ờ phần số. Tại phần tương tự, chúng tôi nghiên cứu 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 69
và ứng dụng hai loại mã hóa: Mã hóa tương tự và mã hóa số, để ánh xạ từ vector kV tới 
vector chứa giá trị lỗi kE . Mô hình hoạt động của hệ thống được mô tả trong hình 2. 
Trong phần dưới đây, chúng tôi sẽ trình bày chi tiết cách thức hoạt động của hệ thống. 
Hình 2. Mô hình hoạt động của hệ thống mã hóa lai cho dữ liệu tiếng nói. 
2.2.1. Phần gửi tin 
Trong hệ thống đề xuất, nguồn cần truyền là dữ liệu tiếng nói thô trong định dạng 
PCM, với độ dài của mẫu là 16 bits trên một mẫu. Khác với loại nguồn liên tục được sử 
dụng trong các hệ thống truyền thống, các mẫu được sử dụng là các giá trị số tự nhiên x, 
với 15 152 2 1x . Một chuỗi Q giá trị liên tiếp của x được nhóm lại thành một khối 
1 2( , ,..., )QX x x x và đưa vào bộ mã hóa AMR. Đầu ra của bộ mã hóa AMR là các frame 
được nén với độ dài n bit, trong đó, giá trị của n phụ thuộc vào chế độ nén được sử dụng 
trong bộ mã hóa AMR. 
Bộ mã hóa kênh sử dụng mã turbo, với tỷ lệ r. Chúng tôi sử dụng giả thiết bộ mã hóa 
kênh được sử dụng đủ thông minh để sửa tất cả các lỗi gây ra bởi kênh trong phần mã hóa 
số. Đầu ra của bộ mã hóa kênh (có độ dài là M bit) được đưa vào bộ điều chế pha nhị 
phân, tại đó tạo ra kí hiệu {-1,1}Mks . Tỷ lệ r được lựa chọn để thỏa mãn điều kiện: 
/ , , 1M n r l P l N l  (1) 
Tại phần tương tự, chúng tôi sử dụng bộ một giải mã AMR để giải mã các frame nén và 
đưa ra đầu ra là một vector khối 1 2( , ,..., )QX x x x , một ước lượng của vector X ở phần 
gửi tin. Một vector chứa các giá trị lỗi E, trong đó bao gồm Q số tự nhiên, sẽ được tính 
toán dựa trên đầu ra X của bộ giải mã AMR và X. 
Tiếp theo, hệ thống cần tìm biểu diễn dưới dạng tương tự của E. Điều này được thực 
hiện bằng cách ánh xạ mỗi giá trị số tự nhiên ie E với một bộ l phần tử 1(v ,..., v )i l i l l  , 
trong đó , 1,...iv R i l . Hệ thống nhóm Q bộ l liên tiếp, tương ứng với Q giá trị tự nhiên 
của vector E, tạo thành một biểu diễn tương tự 1( ,..., )Q lV v v  của vector lỗi. Vì mức 
năng lượng tại phần số là 1, nên vector V phải thỏa mãn điều kiện về mức năng lượng: 
2|| V || (1 )E k P  (2) 
Vector đầu ra ở phần tương tự V và vector đầu ra S ở phần số được kết hợp với nhau để 
tạo thành kí hiệu kênh 1( ,..., )MR r r trước khi được truyền tới nơi nhận, thông qua kênh 
thời gian rời rạc, với nhiễu Gaussian W và phương sai 2 một phần: 
Kỹ thuật điều khiển & Điện tử 
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 70 
0 ,
0 #
j j
j
v s j Q l
r
TH
  
 (3) 
2.2.2. Phần nhận tin 
Tại phần số, một bộ giải mã AMR và một bộ giải mã turbo được sử dụng để tính ước 
lượng của X (ở dạng số). Cụ thể, giả sử kí hiệu kênh nhận được là 1
ˆ ˆ ˆ( ,..., )MR r r , hệ 
thống sẽ gửi Rˆ đến bộ giải mã turbo. Bộ giải mã này sẽ đưa ra đầu ra là một frame AMR 
với độ dài n bit, và gửi frame tới bộ giải mã AMR. Đồng thời, frame cũng được mã hóa 
bởi bộ mã hóa turbo và ánh xạ vào một kí hiệu BPSK bởi bộ điều chế. Đầu ra của bộ giải 
mã AMR là một ước lượng Xˆ của X ở phần số, trong đó 1
ˆ ˆ ˆ(x ,..., x )QX . 
Tại phần tương tự, một ước lượng của vector lỗi V là 1
ˆ ˆ ˆ(v ,..., v )MV , sẽ được tính 
bằng cách trừ đầu ra của bộ điều chế từ kí hiệu kênh Rˆ . Bộ giải mã tương tự ánh xạ mỗi 
tập con 1
ˆˆ ˆ(v ,..., v ) Vi l i l l   vào một giá trị rời rạc iˆe . Lưu ý rằng, mỗi giá trị rời rạc iˆe là 
một ước lượng của một phần tử rạc ie trong vector lỗi E. Ước lượng cuối cùng của X, là 
1
ˆ ˆ ˆ(x ,..., )QX x , được tính bằng cách cộng vector 0
ˆ ˆ ˆ(e ,..., e )QE với ước lượng Xˆ

 tạo 
ra bởi bộ giải mã AMR: 
ˆ ˆ 0
ˆ
ˆ #
j j
j
j
v s j Q l
r
v TH
  
 (4) 
Phần còn lại phải làm rõ trong mô hình này là bộ mã hóa và giải mã ở phần tương tự. 
Chúng tôi nghiên cứu hai hệ thống, trong đó ứng dụng bộ mã hóa/giải mã tuyến tính và phi 
tuyến tính. Hai hệ thống được trình bày chi tiết trong phần dưới đây. 
3. BỘ MÃ HÓA/GIẢI MÃ TƯƠNG TỰ 
3.1. Bộ mã hóa/giải mã tuyến tính 
Ở hệ thống đầu tiên, chúng tôi sử dụng bộ mã hóa tuyến tính ở phần tương tự. Một cách 
tóm tắt, có thể coi mỗi giá trị của vector E được gửi l lần tại đầu ra của bộ mã hóa tuyến 
tính này. Nói cách khác, mỗi phần tử ie E được gửi l lần bởi l giá trị giống nhau của V: 
1 1...i l i l i l l iv v v a e    (5) 
trong đó, a là hằng số chúng tôi sử dụng để điều chỉnh độ lớn của tín hiệu phần tương tự. 
Để tính giá trị của a, chúng tôi sử dụng phương pháp được trình bày bởi Slokun [4]. Cụ 
thể, một hệ số năng lương 0 < ∆ < 1 được gán vào phần tương tự. Hằng số a được chọn để 
thỏa mãn điều kiện: 
2
2
Qa E E
M Qa E E
 (6) 
Tại nơi nhận, sau khi nhận được vector con 1ˆ ˆ(v ,..., v )i l i l l  , bộ giải mã tuyến tính sẽ 
đưa ra ước lượng của mỗi phần tử ie của vector lỗi. Với giả thiết σ đã được biết trước tại 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 71
nơi nhận, chúng tôi mở rộng phương pháp đề xuất bởi Slokun [4] (được đề xuất để áp 
dụng trong trường hợp l = 2) để áp dụng trong trường hợp tổng quát của giá trị l như sau: 
2 0
1 1ˆ ˆ
1
 ...  quả của mô hình đề xuất 
với dữ liệu tiếng nói thô dạng số, dưới hai kịch bản: hệ thống sử dụng mã hóa tuyến tính 
và phi tuyến tính. Trong phần sau, chúng tôi sẽ mô tả chi tiết chương trình mô phỏng ở 
mục V-A, sau đó, sử dụng chương trình mô phỏng để so sánh hiệu quả của hệ thống đề 
xuất và các hệ thống đã có ở mục V-B. 
4.1. Chương trình mô phỏng 
Chương trình mô phỏng đầu tiên được xây dựng cho dữ liệu tiếng nói, sử dụng thuật 
toán nén tiếng nói AMR cho phần mã hóa nguồn, và một bộ mã hóa turbo cho phần mã 
hóa kênh. Bộ mã hóa AMR tiến hành nén P = 380 giá trị số tự nhiên từ dữ liệu tiếng nói 
dạng thô, tạo thành một frame AMR. Trong thí nghiệm, chúng tôi sử dụng chế độ nến 6.7 
kbits/s, có nghĩa là một frame AMR chứa 144 bit (L = 144). Mã hóa kênh turbo với tỷ lệ r 
= 1/3, sử dụng với bộ tạo (37, 21) và khối chèn bit ngẫu nhiên. Do đó, đầu ra của phần số 
là các vector 432 chiều. 
Chương trình mô phỏng thứ hai được thực hiện trên dữ liệu ảnh, sử dụng hệ thống mô 
tả phía trên. Dữ liệu ảnh thô dưới định dạng png truyền đi từ phía nguồn. Thuật toán nén 
JPEG được sử dụng tại bộ mã hóa nguồn. Các thông số cho các thành phần còn lại của hệ 
thống tương tự thông số của chương trình mô phỏng với tiếng nói. 
Trong phần mã hóa tuyến tính, mỗi phần tử của vector chứa giá trị lỗi được gửi l = 3 
lần bởi V. Cụ thể, chúng tôi sử dụng bộ ba giá trị số thực giống nhau để biểu diễn một giá 
trị lỗi, được tính bằng công thức (1) và (2). Giá trị ước lượng của lỗi được tính dựa trên 
công thức (3) (lưu ý, tính toán được thực hiện với giả thiết nơi nhận tín hiệu biết trước giá 
trị của 2 ). 
Trong phần mã hóa phi tuyến tính, chúng tôi tạo ra đường cong tín hiệu bằng cách nối 
các hình chiếu của một hình xoắn ốc Archimedes lên bốn mặt cầu. Sau đó, các giá trị lỗi 
có tần suất xuất hiện cao nhất được biểu diễn bằng các điểm trên đường cong. Cụ thể, 
chúng tôi sử dụng bốn đường cong với công thức sau: 
2 2
cos ,
sin ,
z ,s
x c
y c
r c
 
 

  
  
 
 (8) 
trong đó:x, y và z là các biến, c là hằng số, sr , s = 1,2,3 là bán kính của các mặt cầu. 
Chúng tôi chọn giá trị c = 0.065 và gán một hằng số ∆ cho phần tương tự, giá trị của sr
được tính từ công thức: 
QE E
M QE E
 (9) 
Các giá trị quan trọng được chọn ra từ các giá trị lỗi theo tần suất xuất hiện của chúng 
trong vector lỗi. Cụ thể, các giá trị có tần suất suất hiện cao nhất sẽ được chọn ra và biểu 
diễn trên đường cong tín hiệu. Ví dụ, đồ thị trong hình 4 mô tả tần suất xuất hiện của 1000 
giá trị lỗi trong khoảng (-500, 500) của dữ liệu âm thanh. Dựa vào đồ thị này, các giá trị 
lỗi quan trọng sẽ được lọc ra. 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 73
Hình 4. Tần suất xuất hiện của các giá trị lỗi với dữ liệu âm thanh. 
4.2. Kết quả mô phỏng 
Hình 5. Kết quả mô phỏng về chỉ số chất lượng trung bình (MOS). 
Hình 5 và 6 mô tả kết quả mô phỏng của các hệ thống về chỉ số ý kiến chất lượng trung 
bình MOS [12] và giá trị bình phương trung bình 
2
10
ˆ10 logMSE E X X  (10) 
cho các hệ thống sau: 
 Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình tuyến tính. 
Hai hệ thống này được đánh giá trên tỷ số năng lượng ∆ = 0.1 và ∆ = 0.4. 
 Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến 
tính, trong đó 600 giá trị lỗi được biểu diễn bởi 600 điểm trong đường cong tín hiệu. 
Tỷ số năng lượng sử dụng là ∆ = 0.1 và 0.4. 
Kỹ thuật điều khiển & Điện tử 
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 74 
 Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến 
tính với 1000 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, 
giống như hai hệ thống trên, là ∆ = 0.1 và 0.4. 
 Một hệ thống bảo vệ bất cân bằng, trong đó sử dụng mã hóa nguồn là bộ mã hóa 
AMR ở chế độ 6.7 bits/s, một bộ turbo code với tỷ số 1/ 5hr cho dữ liệu header 
của các frame, và 8 / 23cr cho dữ liệu thuộc lớp A và B của các frame (chú ý, 
trong chế độ 6.7 bits/s, các dữ liệu trong các frame AMR không có class C). 
Hình 6. Kết quả mô phỏng về giá trị bình phương trung bình (MSE). 
Hình 7 mô tả kết quả chương trình mô phỏng dựa trên chỉ số SSIM [13] với dữ liệu 
ảnh, với các hệ thống: 
 Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến 
tính với 600 giá trị lỗi được biểu diễn trong đường cong tín hiệu và ∆ = 0.1 và 0.4. 
 Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến 
tính với 1000 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, ∆ = 
0.1 và 0.4. 
 Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến 
tính với 600 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, ∆ = 
0.1 và 0.4. 
Như được thể hiện trong Hình 5, xét trên chỉ số MOS, hệ thống lai số-tương tự cho kết 
quả tốt hơn so với hệ thống chỉ sử dụng mã hóa số và mô hình bảo vệ bất cân bằng, trên tất 
cả các điều kiện kênh thuộc dải CSNR từ 0 dB đến 25 dB. Cụ thể, hệ thống lai số-tương tự 
với mã hóa tuyến tính hoạt động tốt hơn so với hệ thống số trên các dải CSNR từ 0 dB đến 
12 dB và từ 17 dB đến 25 dB. Hơn thế nữa, hệ thống trang bị mã hóa phi tuyến tính ở phần 
tương tự với 1000 điểm trên đường cong tín hiệu cũng đạt được chỉ số MOS tốt hơn sơ với 
hệ thống sử dụng mã hóa số đơn thuần trong dải CSNR thấp (từ 0 dB đến 5 dB) và dải 
CSNR cao (từ 10 dB đến 25 dB). Tương tự, ở Hình 6, có thể thấy hiệu quả đáng kể của mô 
hình lai so với mô hình mã hóa số nếu xét trên chỉ số MSE. Ví dụ, xét chỉ số MSE, trong 
trường hợp mã hóa tuyến tính và ∆ = 0.4, hệ thống mã hóa lai cho kết quả cao hơn so với 
hệ thống số 6 db và 12 dB, tương ứng ở các giá trị CSNR = 0 dB và CSNR = 3 dB. Sự cải 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 75
tiến này thể hiện rõ rệt hơn ở dải CSNR cao, khi hệ thống lai tốt hơn hệ thống số ít nhất 
22.5 dB trong dải CSNR từ 15 đến 15 dB. Điều này thể hiện ưu điểm của bộ mã hóa tương 
tự trong truyền dữ liệu tiếng nói. Tương tự, ở hình 7, hệ thống lai số-tương tự sử dụng mô 
hình phi tuyến tính cũng cho kết quả tốt hơn so với các hệ thống mã hóa số với kĩ thuật 
bảo vệ bất cân bằng và mã hóa số-tương tự kết hợp mô hình tuyến tính. Cụ thể, hệ thống 
số-tương tự với mã hóa phi tuyến cho kết quả tốt hơn hệ thống số-tương tự và mã hóa 
tuyến tính trên một dải rộng của điều kiện kênh, từ CSNR = 8 dB đến CSNR = 23 dB, với 
khác biết lớn nhất xét trên chỉ số SSIM là 0.225 tại CSNR = 11 dB. 
Hình 7. Kết quả mô phỏng với chỉ số SSIM. 
Chú ý rằng, hệ thống trang bị mã hóa phi tuyến tính sẽ có hiệu ứng "chững lại" 
(leveling-off effect), tức là hiệu năng của hệ thống giữ nguyên tại một giá trị hằng số, dù 
chỉ số CSNR tiếp tục tăng đến vô cùng. Ví dụ, hiệu năng của hệ thống với mã hóa phi 
tuyến tính, 600 điểm trên đường tín hiệu và ∆ = 0.1 và 0.4 dừng ở MOS = 4.389, với tất cả 
các giá trị CSNR lớn hơn 14 dB và 17 dB, tương ứng. Tương tự, nếu xét chỉ số MSE, các 
hệ thống dừng lại ở MSE = 65.8 dB với tất cả các giá trị CSNR lớn hơn 15 dB và 18 dB. 
Với chỉ số SSIM và dữ liệu ảnh, kết quả của hệ thống dừng lại tại SSIM = 0.829 và SSIM 
= 0.839 tương ứng với hệ thống 600 điểm và 1000 điểm trên đường cong tín hiệu. Lý do vì 
với các hệ thống phi tuyến tính, ta chỉ có thể truyền các giá trị xấp xỉ của lỗi, chứ không có 
khả năng truyền tất cả các giá trị một cách chính xác. Như vậy, tại nơi nhận tin, không có 
đủ cơ sở để khôi phục lại hoàn toàn gói tin đã truyền đi, kể cả trong trường hợp kênh 
không có nhiễu. Ngược lại, hệ thống được trang bị cơ chế mã hóa tuyến tính khắc phục 
hạn chế này. Nói cách khác, chỉ số MOS trong hệ thống với mã hóa tuyến tính sẽ tăng khi 
chỉ số CSNR của kênh tăng. Lý do dẫn đến điều này là do nguyên lý hoạt động của mã hóa 
tương tự tuyến tính, trong đó tất cả các giá trị lỗi đều có khả năng được ước chính xác, 
miễn là điều kiện kênh đủ tốt. 
Chúng tôi cũng chú ý rằng, trong với trường hợp mã hóa phi tuyến, đường cong tín 
hiệu với 1000 điểm cho kết quả tốt hơn so với đường cong có 600 điểm trên dải CSNR 
cao. Thêm vào đó, ngưỡng đạt được trong hiệu ứng "chững lại" của đường cong 1000 
điểm cũng tốt hơn. Lý do cho hiện tượng này là đường cong với 1000 điểm có khả năng 
biểu diễn tín hiệu tốt hơn các giá trị lỗi so với đường cong 600 điểm. Trong các điều kiện 
kênh tốt, ứng với dải CSNR cao, nơi nhận có thể khôi phục các giá trị lỗi với độ méo thấp. 
Từ đó, số giá trị lỗi ở đường cong 1000 điểm được khôi phục chính xác nhiều hơn số giá 
trị lỗi được khôi phục ở trường hợp còn lại, dẫn đến kết quả tốt hơn. 
Một điểm chú ý nữa được rút ra từ Hình 5 là hiệu quả của hệ thống mã hóa phi tuyến 
tính tốt hơn so với hệ thống mã hóa tuyến tính trên dải CSNR cao. Ví dụ, xét chỉ số MOS, 
Kỹ thuật điều khiển & Điện tử 
N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 76 
mã hóa phi tuyến sử dụng đường cong 600 điểm đưa ra kết quả cao hơn so với mã hóa 
tuyến tính trên dải CSNR từ 14 dB đến 24 dB, với các hệ thống có ∆ = 0.4. Hơn nữa, kết 
quả này còn tốt hơn nếu xét trên chỉ số MSE. Cụ thể, trên dải CSNR từ 17 dB đến 25 dB, 
mã hóa phi tuyến với đường cong tín hiệu 1000 điểm tốt hơn má hóa tuyến tính ít nhất 
55.1 dB và 55.3 dB với ∆ = 0.4, tương ứng. Điều này chứng minh ưu điểm của việc áp 
dụng kĩ thuật bảo vệ bất cân bằng trong phần tương tự đã được đề xuất trong bài báo. 
Chúng tôi cũng nhận thấy rằng, mã hóa tuyến tính cho kết quả tốt hơn mã hóa phi tuyến ở 
dải các giá trị CSNR thấp. Cụ thể, hệ thống trang bị mã hóa tuyến tính và ∆ = 0.4 đạt được 
kết quả tốt hơn so với mã hóa phi tuyến trong khoảng CSNR từ 0 dB đến 10 dB, kết quả 
tốt hơn ít nhất là 0.45 và 8.45 dB, xét trên chỉ số MOS và MSE tương ứng. Nguyên nhân 
của hiện tương này là với điều kiện kênh tồi, nhiễu của kênh có thể đưa một điểm từ một 
phần trên đường cong tin hiệu tới một phần khác cách xa phần ban đầu. Điều này dẫn tới 
sai khác lớn khi nơi nhận khôi phục giá trị ban đầu của lỗi. 
Cuối cùng, một điểm đáng chú ý là các hệ thống sử dụng giá trị ∆ lớn đạt chất lượng 
truyền tin tốt hơn so với hệ thống sử dụng giá trị ∆ nhỏ. Lý do dẫn đến hiện tượng này là 
quá trình khôi phục thông tin sẽ thực hiện tốt hơn với sự hỗ trợ của giá trị ∆ lớn, khi các 
điểm trên đường cong tín hiệu có xu hướng cách xa nhau. Việc sử dụng giá trị ∆ nhỏ sẽ 
làm cho hệ thống nhạy cảm hơn với nhiễu, làm giảm chất lượng khôi phục dữ liệu gốc. 
5. KẾT LUẬN 
Trong bài báo này, chúng tôi đã đề xuất một mô hình mã hóa lai số-tương tự, trong đó 
ứng dụng kiến trúc mã hóa kết hợp nguồn-kênh ở phần số, tận dụng ưu điểm của bộ mã 
hóa tương tự ở phần tương tự. Việc áp dụng cơ chế bảo vệ bất cân bằng ở phần tương tự 
giúp nâng cao chất lượng truyền tin của hệ thống, giảm độ méo dữ liệu, nhờ tận dụng được 
thông tin về xác suất phân bố của các giá trị trong vector lỗi. Kết quả thực nghiệm cho 
thấy, hệ thống đề xuất đưa đến kết quả tốt hơn so với các hệ thống mã hóa lai số-tương tự 
truyền thống và hệ thống mã hóa số đơn thuần. 
TÀI LIỆU THAM KHẢO 
[1]. S. Borade, B. Nakiboglu, and L. Zheng, “Unequal error protection: some 
fundamental limits,” in IN PROC. OF THE INTERNATIONAL SYMPOSIUM ON 
INFORMATION THEORY. Citeseer, 2008. 
[2]. C. E. Shannon, “Communication in the presence of noise,” Proceedings of the IRE, 
Vol. 37, no. 1, pp. 10–21, 1949. 
[3]. U. Mittal and N. Phamdo, “Hybrid digital-analog (hda) joint sourcechannel codes 
for broadcasting and robust communications,” IEEE Transactions on Information 
Theory, Vol. 48, no. 5, pp. 1082–1102, 2002. 
[4]. M. Skoglund, N. Phamdo, and F. Alajaji, “Hybrid digital–analog source–channel 
coding for bandwidth compression/expansion,” IEEE Transactions on Information 
Theory, Vol. 52, no. 8, pp. 3757–3763, 2006. 
[5]. T. Miki, C.-E. Sundberg, and N. Seshadri, “Pseudo-analog speech transmission in 
mobile radio communication systems,” IEEE transactions on vehicular technology, 
Vol. 42, no. 1, pp. 69–77, 1993. 
[6]. N. Phamdo and U. Mittal, “A joint source-channel speech coder using hybrid digital-
analog (hda) modulation,” IEEE transactions on speech and audio processing, Vol. 
10, no. 4, pp. 222–231, 2002. 
[7]. C. Hoelper and P. Vary, “Bandwidth-efficient mixed pseudo analoguedigital speech 
and audio transmission,” in Multimedia Signal Processing, 2006 IEEE 8th 
Workshop on. IEEE, 2006, pp. 141–145. 
Nghiên cứu khoa học công nghệ 
Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 77
[8]. M. Rungeler, J. Bunte, and P. Vary, “Design and evaluation of hybrid¨ digital-
analog transmission outperforming purely digital concepts,” IEEE Transactions on 
Communications, Vol. 62, no. 11, pp. 3983–3996, 2014. 
[9]. M. Rungeler, F. Kleifgen, and P. Vary, “Wideband speech coding with ¨ hybrid 
digital-analog transmission,” in Signal Processing Conference (EUSIPCO), 2015 
23rd European. IEEE, 2015, pp. 784–788. 
[10]. P. A. Floor and T. A. Ramstad, “Optimality of dimension expanding shannon-
kotel’nikov mappings,” in Information Theory Workshop, 2007. ITW’07. IEEE. 
IEEE, 2007, pp. 289–294. 
[11]. P. Minero, S. H. Lim, and Y.-H. Kim, “A unified approach to hybrid coding,” IEEE 
Transactions on Information Theory, Vol. 61, no. 4, pp. 1509–1523, 2015. 
[12]. P.862: Perceptual evaluation of speech quality (pesq): “An objective method for end-
to-end speech quality assessment of narrowband telephone networks and speech 
codes.” Available:  
ABSTRACT 
HYBRID SOURCE–CHANNEL CODING FOR BANDWIDTH EXPANSION 
 The structure of hybrid source–channel coding has extensively used in 
telecommunication, especially in transmitting speed or video data. Hybrid source-
channel coding integrates the advantages of both digital-coding and analog-coding 
to improve the quality of data transmission in different types of channels. However, 
in existing works, hybrid source-channel coding has been only applied for 
continuous signal. In this paper, an information transmission model for discrete 
signals is proposed. Specifically, two different models for analog encoding: linear 
analog coding and nonlinear analog encoding are introduced. Linear encoding 
model utilizes equal error protection mechanism while the nonlinear coding model 
uses unequal error protection mechanism with significant information from source. 
The experimental result shows that our proposed methods outperform existing 
works in terms of transmission quality. 
Keywords: Hybrid source-channel coding, Digital Coding, Analog Coding, Information transmission from 
discrete source. 
Nhận bài ngày 10 tháng 5 năm 2017 
Hoàn thiện ngày 5 tháng 9 năm 2017 
Chấp nhận đăng ngày 25 tháng 10 năm 2017 
Địa chỉ: 1Viện Công nghệ Thông tin và Truyền thông, Đại học Bách Khoa Hà Nội; 
 2SAMOVAR, Télécom SudParis, CNRS, Université Paris-Saclay, 
 9 rue Charles Fourier - 91011 Evry Cedex; 
 3Trường Đại học Kỹ thuật Hậu cần Công an Nhân dân, Bộ Công an. 
 *Email: quangnm@hnue.edu.vn. 

File đính kèm:

  • pdfma_hoa_lai_nguon_kenh_voi_bang_thong_mo_rong.pdf