Mã hóa lai nguồn-kênh với băng thông mở rộng
Tóm tắt: Kiến trúc mã hóa lai nguồn-kênh đã được sử dụng rộng rãi trong lĩnh
vực truyền thông, đặc biệt là truyền các loại dữ liệu âm thanh, tiếng nói và video.
Mã hóa lai nguồn kênh kết hợp ưu điểm của cả mã hóa số và mã hóa tương tự để
nâng cao chất lượng truyền dữ liệu trong nhiều điều kiện kênh khác nhau. Mặc dù
vậy, trong các nghiên cứu đã có, kiến trúc mã hóa nguồn-kênh chỉ áp dụng cho các
tín hiệu liên tục. Trong bài báo này, chúng tôi tiếp cận bài toán truyền thông tin từ
nguồn rời rạc, qua các loại kênh truyền nhiễu. Cụ thể, bài báo đề xuất mô hình
truyền thông tin dành cho dữ liệu tiếng nói với mã hóa PCM. Chúng tôi giới thiệu
hai mô hình cho phần mã hóa tương tự: mã hóa tuyến tính và mã hóa phi tuyến. Mô
hình mã hóa tuyến tính áp dụng cơ chế bảo vệ thông tin cân bằng truyền thống,
trong khi mô hình mã hóa phi tuyến sử dụng chỉ số độ quan trọng của các giá trị
nguồn để áp dụng cơ chế bảo vệ thông tin bất cân bằng. Kết quả thực nghiệm cho
thấy, mô hình mã hóa nguồn kênh trong bài báo đưa ra kết quả tốt hơn so với hệ
thống mã hóa số truyền thống, trên nhiều điều kiện kênh truyền khác nhau.
Tóm tắt nội dung tài liệu: Mã hóa lai nguồn-kênh với băng thông mở rộng
Kỹ thuật điều khiển & Điện tử N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 66 Mà HÓA LAI NGUỒN-KÊNH VỚI BĂNG THÔNG MỞ RỘNG Nguyễn Minh Quang1, 2*, Nguyễn Đăng Tiến3 Tóm tắt: Kiến trúc mã hóa lai nguồn-kênh đã được sử dụng rộng rãi trong lĩnh vực truyền thông, đặc biệt là truyền các loại dữ liệu âm thanh, tiếng nói và video. Mã hóa lai nguồn kênh kết hợp ưu điểm của cả mã hóa số và mã hóa tương tự để nâng cao chất lượng truyền dữ liệu trong nhiều điều kiện kênh khác nhau. Mặc dù vậy, trong các nghiên cứu đã có, kiến trúc mã hóa nguồn-kênh chỉ áp dụng cho các tín hiệu liên tục. Trong bài báo này, chúng tôi tiếp cận bài toán truyền thông tin từ nguồn rời rạc, qua các loại kênh truyền nhiễu. Cụ thể, bài báo đề xuất mô hình truyền thông tin dành cho dữ liệu tiếng nói với mã hóa PCM. Chúng tôi giới thiệu hai mô hình cho phần mã hóa tương tự: mã hóa tuyến tính và mã hóa phi tuyến. Mô hình mã hóa tuyến tính áp dụng cơ chế bảo vệ thông tin cân bằng truyền thống, trong khi mô hình mã hóa phi tuyến sử dụng chỉ số độ quan trọng của các giá trị nguồn để áp dụng cơ chế bảo vệ thông tin bất cân bằng. Kết quả thực nghiệm cho thấy, mô hình mã hóa nguồn kênh trong bài báo đưa ra kết quả tốt hơn so với hệ thống mã hóa số truyền thống, trên nhiều điều kiện kênh truyền khác nhau. Từ khóa: Mã hóa lai nguồn-kênh, Mã hóa số, Mã hóa tương tự, Truyền thông tin từ nguồn rời rạc. 1. GIỚI THIỆU Trong bài báo này, chúng tôi đề xuất một mô hình truyền tín hiệu rời rạc qua kênh không nhớ Gausian, rời rạc về thời gian. Cụ thể, hệ thống được đề xuất truyền dữ liệu tiếng nói dưới dạng số giữa hai điểm để giải quyết một trong những vấn đề của các hệ thống truyền âm thanh đó là đảm bảo chất lượng âm thanh ở mức độ tốt, đồng thời giới hạn băng thông sử dụng. Dựa trên lý thuyết Shannon về kết hợp mã hóa nguồn và mã hóa kênh, các hệ thống truyền tin thông thường áp dụng mô hình mã hóa nguồn-kệnh độc lập. Nói cách khác, mã hóa nguồn được lựa chọn mà không cần thông tin về mã hóa kênh và mã hóa kênh không cần quan tâm đến phân bố đầu ra của mã hóa nguồn. Hơn nữa, trong một số hệ thống truyền tin multimedia, một số phần thông tin được gán độ quan trọng cao hơn các phần thông tin khác, nên được bảo vệ bằng các loại mã hóa kênh tốt hơn các thông tin khác. Chiến lược này được gọi là bảo vệ bất cân bằng (UEP - Unequal error protection). Việc áp dụng chiến lược này đem lại hiệu quả cao hơn so với hệ thống truyền thống, nhất là với các loại dữ liệu multimedia. Trong các công trình đã được công bố, có hai hướng phát triển chính khi áp dụng mô hình UEP: Bảo vệ theo vị trí dữ liệu (bit-wise UEP) và bảo vệ theo giá trị gói tin (message-wise UEP) [1]. Với mô hình bảo vệ theo vị trí dữ liệu, các bit trong gói tin gửi đi sẽ được chia thành các tập con, mỗi tập con được gán một độ quan trọng, ứng với các mức độ bảo vệ khác nhau. Trong khi đó, mô hình bảo vệ theo gói tin, các gói tin được chia thành các tập con. Mỗi tập con được gán các mức độ bảo vệ khác nhau. Tuy nhiên, một nhược điểm của các hệ thống số với mô hình mã hóa nguồn-kênh là hiệu ứng "chững lại" (leveling-off effect) [2], trong đó, hiệu năng của hệ thống dừng lại ở một mức cố định, dù tỉ số tín hiệu trên nhiễu tiến đến vô cùng. Các hệ thống mã hóa lai không có nhược điểm này, nhờ hoạt động của phần mã hóa tương tự. Cụ thể, trong mô hình mã hóa lai số-tương tự, ta có thể sử dụng kết hợp mã hóa nguồn và mã hóa kênh ở phần mã hóa số để bảo vệ dữ liệu và tăng hiệu quả truyền thông trong các điều kiện kênh xấu. Thêm vào đó, bộ ánh xạ tương tự ở phần mã hóa tương tự giúp tăng hiệu năng của hệ thống ở các kênh có chỉ số CSNR cao. Nhiều mô hình mã hóa lai số-tương tự đã được nghiên cứu và giới thiệu trong các công trình đã được công bố. Trong các hệ thống truyền Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 67 thông giữa hai điểm, Mittal và Phamdo [3] đề xuất ba mô hình mã hóa lai để tăng chất lượng truyền tin, đặc biệt là về vùng nhiễu có thể đạt được. Dựa trên các thiết kế đó, Skoglund và đồng sự [4] đề xuất mô hình mã hóa tuyến tính và mã hóa phi tuyến tính cho phần tương tự, có thể áp dụng vào mọi giá trị băng thông. Với dữ liệu tiếng nói, các công trình được trình bày trong [5], [6], [7] đã áp dụng thiết kế mã hóa lai để tăng chất lượng truyền tiếng nói so với mô hình mã hóa số trong một vài dải CSNR khác nhau. Matthias và cộng sự [8], [9] đã công bố một vài phiên bản của hệ mã hóa lai có sử dụng điều chế pulse-code và Adaptive DPCM. Tuy nhiên, thiết kế mã hóa tuyến tính và phi tuyến tính của họ ở phần tương tự, sử dụng đường cong Archimedes [10], chỉ hoạt động với tín hiệu liên tục. Rất ít các công trình đã công bố tập trung vào việc ứng dụng mã hóa lai cho tín hiệu rời rạc. Trong bài báo này, chúng tôi đưa ra mô hình truyền thông giữa hai điểm, trong đó, dữ liệu tiếng nói được truyền qua kênh nhiễu Gaussian với sự hỗ trợ của mã hóa lai số-tương tự. Chúng tôi quan sát thấy các lợi ích đạt được khi khai thác ưu điểm của mã hóa tương tự khi truyền thông trong các kênh ở các dải CSNR cao. Cụ thể, bằng cách sử dụng một cách mã hóa thích hợp, dữ liệu số đã được nén bằng phần số được truyền tải đồng thời với việc truyền tải các giá trị lỗi, các giá trị biểu diễn thông tin mất mát khi thực hiện quá trình nén/giải nén. Mặt khác, chúng tôi nhận thấy các giá trị lỗi với tần số xuất hiện lớn sẽ có độ quan trọng lớn hơn các giá trị lỗi còn lại. Do đó, chúng cần được bảo vệ tốt hơn. Xuất phát từ các quan sát trên, ý tưởng của bài báo này là áp dụng cơ chế bảo vệ bất cân bằng vào phần tương tự để bảo vệ các giá trị lỗi quan trọng, qua đó, giảm được độ méo của dữ liệu nhận được. Đóng góp trong bài báo này có thể tóm tắt như sau: Ứng dụng kiến trúc mã hóa lai số-tương tự vào truyền thông cho nguồn rời rạc, trong đó, các giá trị rời rạc được lấy từ dữ liệu tiếng nói. Sử dụng mô hình mã hóa tuyến tính cho các giá trị lỗi rời rạc. Mô hình đề xuất trong bài báo này là sự mở rộng của mô hình đã được công bố trong [4]. Chúng tôi cũng đề xuất một mô hình mã hóa phi tuyến tính, trong đó sử dụng kĩ thuật bảo vệ theo gói tin để tăng hiệu quả của bộ tương tự. Xây dựng chương trình mô phỏng và chứng minh chất lượng truyền thông của mô hình đề xuất. Phần còn lại của bài báo được tổ chức như sau. Sau phần giới thiệu về mô hình mã hóa số-tương tự ở mục II-A, bài báo mô tả hệ thống mã hóa lai số-tương tự cho dữ liệu tiếng nói ở mục II-B. Ở mục III, chúng tôi mô tả chi tiết phương pháp mã hóa tuyến tính và phi tuyến tính cho phần tương tự và sau đó, các kết quả thực nghiệm được mô tả ở mục IV. Cuối cùng, các kết luận được đưa ra ở phần V. 2. KIẾN TRÚC Mà HÓA LAI SỐ-TƯƠNG TỰ 2.1. Kiến trúc truyền thống Hình 1. Mô hình tổng quát của hệ thống mã hóa số-tương tự. Kỹ thuật điều khiển & Điện tử N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 68 Trong phần này, chúng tôi trình bày mô hình mã hóa lai số-tương tự cho truyền tín hiệu tương tự qua kênh rời rạc không nhớ. Các phiên bản của mô hình này đã được công bố trong [4], [11]. Hình 1 mô tả mô hình tổng quát của một hệ thống mã hóa số tương tự, trong đó, phần số và phần tương tự được kết hợp với nhau. Dưới đây là mô tả chi tiết cách thức hoạt động của hệ thống. 2.1.1. Phần truyền tin Tại phần truyền tin, n mẫu iX từ nguồn rời rạc được nhóm lại thành một khối nX . Bộ mã hóa nguồn, trong đó chứa một bộ mã gồm N vector 0,..., nS S , lấy nX làm đầu vào và ánh xạ nX tới một trong số các từ mã của nó. Mỗi từ mã là một nhóm gồm n mẫu. Chú ý rằng, bộ mã hóa và giải mã cần thống nhất trước về danh sách từ mã trong bộ mã. Đầu ra của bộ mã hóa nguồn, một chỉ số I của một từ mã, được đưa vào bộ mã hóa kênh. Bộ mã hóa kênh này sẽ đưa ra kí hiệu kênh kIs , trong đó k n . Chỉ số I đồng thời cũng được chuyển đến bộ giải mã nguồn. Tại đây, một từ mã IS được chọn ra tương ứng. Tại phần tương tự, một vector chứa các giá trí lỗi nE được tính bằng cách thực hiện phép trừ với IS từ nX . Vector lỗi nE sau đó được gửi đến bộ mã hóa tương tự, trong đó, nE được ánh xạ tới một vector k chiều 1( ,..., v ) k kV v , trong đó ,1iv R i k . Hệ thống thực hiện cộng đầu ra kIs của bộ mã hóa kênh và vector kV và kết quả của phép tính này, kR , được gửi đến nơi nhận qua kênh nhiễu. Chú ý rằng, kí hiệu kênh kIs phải thỏa mãn || s || k (1 t) P k IE , trong đó P là tổng năng lượng trong một lần sử dụng kênh và 0 ≤ t ≤ 1. Thêm vào đó, đầu ra của bộ mã hóa kV phải thỏa mãn ràng buộc năng lượng || s || k (1 t) PkIE . 2.1.2. Phần nhận tin Tại phần nhận tin, sau khi nhận được gói tin ˆ kR từ kênh, một bộ giải mã kênh lấy ˆ kR làm đầu vào và đưa ra một giá trị chỉ số Iˆ ,là giá trị định giá của I ở phần truyền tin. Chỉ số Iˆ sau đó được đưa vào bộ giải mã nguồn, nơi sẽ sử dụng Iˆ để đưa ra vector ˆ ˆ n I X S , ˆ nX là ước lượng của nX ở phần mã hóa số. Cùng lúc đó, chỉ số Iˆ cũng được truyền tới bộ giải mã kênh để tạo ra kí hiệu kênh ˆ k I s . Lúc này, ˆ k I s được trừ từ ˆ kR để đưa ra vector 1 ˆ ˆ ˆ( ,..., v )k kV v , một ước lượng của kV ở phần gửi tin. Bộ giải mã tương tự sẽ ánh xạ ˆ kV tới ước lượng ˆ nE của vector chứa các giá trị lỗi nE . Cuối cùng, ước lượng của nX đưa ra bởi hệ thống mã hóa lai được tính bằng cách cộng ˆ nE vào ˆ nX . 2.2. Hệ thống mã hóa lai cho dữ liệu tiếng nói Ý tưởng chính trong bài báo này là mở rộng mô hình mã hóa lai số-tương tự và áp dụng cho truyền thông với các nguồn rời rạc. Trong hệ thống đề xuất, phần mã hóa và giải mã số làm việc tương tự như phần mã hóa/giải mã số của hệ thống truyền thống đã mô tả ở phần trên. Cụ thể, chúng tôi sử dụng một bộ mã hóa AMR, một bộ mã hóa kênh turbo code và một bộ điều chế pha nhị phân ờ phần số. Tại phần tương tự, chúng tôi nghiên cứu Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 69 và ứng dụng hai loại mã hóa: Mã hóa tương tự và mã hóa số, để ánh xạ từ vector kV tới vector chứa giá trị lỗi kE . Mô hình hoạt động của hệ thống được mô tả trong hình 2. Trong phần dưới đây, chúng tôi sẽ trình bày chi tiết cách thức hoạt động của hệ thống. Hình 2. Mô hình hoạt động của hệ thống mã hóa lai cho dữ liệu tiếng nói. 2.2.1. Phần gửi tin Trong hệ thống đề xuất, nguồn cần truyền là dữ liệu tiếng nói thô trong định dạng PCM, với độ dài của mẫu là 16 bits trên một mẫu. Khác với loại nguồn liên tục được sử dụng trong các hệ thống truyền thống, các mẫu được sử dụng là các giá trị số tự nhiên x, với 15 152 2 1x . Một chuỗi Q giá trị liên tiếp của x được nhóm lại thành một khối 1 2( , ,..., )QX x x x và đưa vào bộ mã hóa AMR. Đầu ra của bộ mã hóa AMR là các frame được nén với độ dài n bit, trong đó, giá trị của n phụ thuộc vào chế độ nén được sử dụng trong bộ mã hóa AMR. Bộ mã hóa kênh sử dụng mã turbo, với tỷ lệ r. Chúng tôi sử dụng giả thiết bộ mã hóa kênh được sử dụng đủ thông minh để sửa tất cả các lỗi gây ra bởi kênh trong phần mã hóa số. Đầu ra của bộ mã hóa kênh (có độ dài là M bit) được đưa vào bộ điều chế pha nhị phân, tại đó tạo ra kí hiệu {-1,1}Mks . Tỷ lệ r được lựa chọn để thỏa mãn điều kiện: / , , 1M n r l P l N l (1) Tại phần tương tự, chúng tôi sử dụng bộ một giải mã AMR để giải mã các frame nén và đưa ra đầu ra là một vector khối 1 2( , ,..., )QX x x x , một ước lượng của vector X ở phần gửi tin. Một vector chứa các giá trị lỗi E, trong đó bao gồm Q số tự nhiên, sẽ được tính toán dựa trên đầu ra X của bộ giải mã AMR và X. Tiếp theo, hệ thống cần tìm biểu diễn dưới dạng tương tự của E. Điều này được thực hiện bằng cách ánh xạ mỗi giá trị số tự nhiên ie E với một bộ l phần tử 1(v ,..., v )i l i l l , trong đó , 1,...iv R i l . Hệ thống nhóm Q bộ l liên tiếp, tương ứng với Q giá trị tự nhiên của vector E, tạo thành một biểu diễn tương tự 1( ,..., )Q lV v v của vector lỗi. Vì mức năng lượng tại phần số là 1, nên vector V phải thỏa mãn điều kiện về mức năng lượng: 2|| V || (1 )E k P (2) Vector đầu ra ở phần tương tự V và vector đầu ra S ở phần số được kết hợp với nhau để tạo thành kí hiệu kênh 1( ,..., )MR r r trước khi được truyền tới nơi nhận, thông qua kênh thời gian rời rạc, với nhiễu Gaussian W và phương sai 2 một phần: Kỹ thuật điều khiển & Điện tử N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 70 0 , 0 # j j j v s j Q l r TH (3) 2.2.2. Phần nhận tin Tại phần số, một bộ giải mã AMR và một bộ giải mã turbo được sử dụng để tính ước lượng của X (ở dạng số). Cụ thể, giả sử kí hiệu kênh nhận được là 1 ˆ ˆ ˆ( ,..., )MR r r , hệ thống sẽ gửi Rˆ đến bộ giải mã turbo. Bộ giải mã này sẽ đưa ra đầu ra là một frame AMR với độ dài n bit, và gửi frame tới bộ giải mã AMR. Đồng thời, frame cũng được mã hóa bởi bộ mã hóa turbo và ánh xạ vào một kí hiệu BPSK bởi bộ điều chế. Đầu ra của bộ giải mã AMR là một ước lượng Xˆ của X ở phần số, trong đó 1 ˆ ˆ ˆ(x ,..., x )QX . Tại phần tương tự, một ước lượng của vector lỗi V là 1 ˆ ˆ ˆ(v ,..., v )MV , sẽ được tính bằng cách trừ đầu ra của bộ điều chế từ kí hiệu kênh Rˆ . Bộ giải mã tương tự ánh xạ mỗi tập con 1 ˆˆ ˆ(v ,..., v ) Vi l i l l vào một giá trị rời rạc iˆe . Lưu ý rằng, mỗi giá trị rời rạc iˆe là một ước lượng của một phần tử rạc ie trong vector lỗi E. Ước lượng cuối cùng của X, là 1 ˆ ˆ ˆ(x ,..., )QX x , được tính bằng cách cộng vector 0 ˆ ˆ ˆ(e ,..., e )QE với ước lượng Xˆ tạo ra bởi bộ giải mã AMR: ˆ ˆ 0 ˆ ˆ # j j j j v s j Q l r v TH (4) Phần còn lại phải làm rõ trong mô hình này là bộ mã hóa và giải mã ở phần tương tự. Chúng tôi nghiên cứu hai hệ thống, trong đó ứng dụng bộ mã hóa/giải mã tuyến tính và phi tuyến tính. Hai hệ thống được trình bày chi tiết trong phần dưới đây. 3. BỘ Mà HÓA/GIẢI Mà TƯƠNG TỰ 3.1. Bộ mã hóa/giải mã tuyến tính Ở hệ thống đầu tiên, chúng tôi sử dụng bộ mã hóa tuyến tính ở phần tương tự. Một cách tóm tắt, có thể coi mỗi giá trị của vector E được gửi l lần tại đầu ra của bộ mã hóa tuyến tính này. Nói cách khác, mỗi phần tử ie E được gửi l lần bởi l giá trị giống nhau của V: 1 1...i l i l i l l iv v v a e (5) trong đó, a là hằng số chúng tôi sử dụng để điều chỉnh độ lớn của tín hiệu phần tương tự. Để tính giá trị của a, chúng tôi sử dụng phương pháp được trình bày bởi Slokun [4]. Cụ thể, một hệ số năng lương 0 < ∆ < 1 được gán vào phần tương tự. Hằng số a được chọn để thỏa mãn điều kiện: 2 2 Qa E E M Qa E E (6) Tại nơi nhận, sau khi nhận được vector con 1ˆ ˆ(v ,..., v )i l i l l , bộ giải mã tuyến tính sẽ đưa ra ước lượng của mỗi phần tử ie của vector lỗi. Với giả thiết σ đã được biết trước tại Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 71 nơi nhận, chúng tôi mở rộng phương pháp đề xuất bởi Slokun [4] (được đề xuất để áp dụng trong trường hợp l = 2) để áp dụng trong trường hợp tổng quát của giá trị l như sau: 2 0 1 1ˆ ˆ 1 ... quả của mô hình đề xuất với dữ liệu tiếng nói thô dạng số, dưới hai kịch bản: hệ thống sử dụng mã hóa tuyến tính và phi tuyến tính. Trong phần sau, chúng tôi sẽ mô tả chi tiết chương trình mô phỏng ở mục V-A, sau đó, sử dụng chương trình mô phỏng để so sánh hiệu quả của hệ thống đề xuất và các hệ thống đã có ở mục V-B. 4.1. Chương trình mô phỏng Chương trình mô phỏng đầu tiên được xây dựng cho dữ liệu tiếng nói, sử dụng thuật toán nén tiếng nói AMR cho phần mã hóa nguồn, và một bộ mã hóa turbo cho phần mã hóa kênh. Bộ mã hóa AMR tiến hành nén P = 380 giá trị số tự nhiên từ dữ liệu tiếng nói dạng thô, tạo thành một frame AMR. Trong thí nghiệm, chúng tôi sử dụng chế độ nến 6.7 kbits/s, có nghĩa là một frame AMR chứa 144 bit (L = 144). Mã hóa kênh turbo với tỷ lệ r = 1/3, sử dụng với bộ tạo (37, 21) và khối chèn bit ngẫu nhiên. Do đó, đầu ra của phần số là các vector 432 chiều. Chương trình mô phỏng thứ hai được thực hiện trên dữ liệu ảnh, sử dụng hệ thống mô tả phía trên. Dữ liệu ảnh thô dưới định dạng png truyền đi từ phía nguồn. Thuật toán nén JPEG được sử dụng tại bộ mã hóa nguồn. Các thông số cho các thành phần còn lại của hệ thống tương tự thông số của chương trình mô phỏng với tiếng nói. Trong phần mã hóa tuyến tính, mỗi phần tử của vector chứa giá trị lỗi được gửi l = 3 lần bởi V. Cụ thể, chúng tôi sử dụng bộ ba giá trị số thực giống nhau để biểu diễn một giá trị lỗi, được tính bằng công thức (1) và (2). Giá trị ước lượng của lỗi được tính dựa trên công thức (3) (lưu ý, tính toán được thực hiện với giả thiết nơi nhận tín hiệu biết trước giá trị của 2 ). Trong phần mã hóa phi tuyến tính, chúng tôi tạo ra đường cong tín hiệu bằng cách nối các hình chiếu của một hình xoắn ốc Archimedes lên bốn mặt cầu. Sau đó, các giá trị lỗi có tần suất xuất hiện cao nhất được biểu diễn bằng các điểm trên đường cong. Cụ thể, chúng tôi sử dụng bốn đường cong với công thức sau: 2 2 cos , sin , z ,s x c y c r c (8) trong đó:x, y và z là các biến, c là hằng số, sr , s = 1,2,3 là bán kính của các mặt cầu. Chúng tôi chọn giá trị c = 0.065 và gán một hằng số ∆ cho phần tương tự, giá trị của sr được tính từ công thức: QE E M QE E (9) Các giá trị quan trọng được chọn ra từ các giá trị lỗi theo tần suất xuất hiện của chúng trong vector lỗi. Cụ thể, các giá trị có tần suất suất hiện cao nhất sẽ được chọn ra và biểu diễn trên đường cong tín hiệu. Ví dụ, đồ thị trong hình 4 mô tả tần suất xuất hiện của 1000 giá trị lỗi trong khoảng (-500, 500) của dữ liệu âm thanh. Dựa vào đồ thị này, các giá trị lỗi quan trọng sẽ được lọc ra. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 73 Hình 4. Tần suất xuất hiện của các giá trị lỗi với dữ liệu âm thanh. 4.2. Kết quả mô phỏng Hình 5. Kết quả mô phỏng về chỉ số chất lượng trung bình (MOS). Hình 5 và 6 mô tả kết quả mô phỏng của các hệ thống về chỉ số ý kiến chất lượng trung bình MOS [12] và giá trị bình phương trung bình 2 10 ˆ10 logMSE E X X (10) cho các hệ thống sau: Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình tuyến tính. Hai hệ thống này được đánh giá trên tỷ số năng lượng ∆ = 0.1 và ∆ = 0.4. Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến tính, trong đó 600 giá trị lỗi được biểu diễn bởi 600 điểm trong đường cong tín hiệu. Tỷ số năng lượng sử dụng là ∆ = 0.1 và 0.4. Kỹ thuật điều khiển & Điện tử N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 74 Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến tính với 1000 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, giống như hai hệ thống trên, là ∆ = 0.1 và 0.4. Một hệ thống bảo vệ bất cân bằng, trong đó sử dụng mã hóa nguồn là bộ mã hóa AMR ở chế độ 6.7 bits/s, một bộ turbo code với tỷ số 1/ 5hr cho dữ liệu header của các frame, và 8 / 23cr cho dữ liệu thuộc lớp A và B của các frame (chú ý, trong chế độ 6.7 bits/s, các dữ liệu trong các frame AMR không có class C). Hình 6. Kết quả mô phỏng về giá trị bình phương trung bình (MSE). Hình 7 mô tả kết quả chương trình mô phỏng dựa trên chỉ số SSIM [13] với dữ liệu ảnh, với các hệ thống: Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến tính với 600 giá trị lỗi được biểu diễn trong đường cong tín hiệu và ∆ = 0.1 và 0.4. Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến tính với 1000 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, ∆ = 0.1 và 0.4. Hai hệ thống lai số-tương tự với phần mã hóa tương tự sử dụng mô hình phi tuyến tính với 600 điểm được sử dụng trên đường cong tín hiệu và tỷ số năng lượng, ∆ = 0.1 và 0.4. Như được thể hiện trong Hình 5, xét trên chỉ số MOS, hệ thống lai số-tương tự cho kết quả tốt hơn so với hệ thống chỉ sử dụng mã hóa số và mô hình bảo vệ bất cân bằng, trên tất cả các điều kiện kênh thuộc dải CSNR từ 0 dB đến 25 dB. Cụ thể, hệ thống lai số-tương tự với mã hóa tuyến tính hoạt động tốt hơn so với hệ thống số trên các dải CSNR từ 0 dB đến 12 dB và từ 17 dB đến 25 dB. Hơn thế nữa, hệ thống trang bị mã hóa phi tuyến tính ở phần tương tự với 1000 điểm trên đường cong tín hiệu cũng đạt được chỉ số MOS tốt hơn sơ với hệ thống sử dụng mã hóa số đơn thuần trong dải CSNR thấp (từ 0 dB đến 5 dB) và dải CSNR cao (từ 10 dB đến 25 dB). Tương tự, ở Hình 6, có thể thấy hiệu quả đáng kể của mô hình lai so với mô hình mã hóa số nếu xét trên chỉ số MSE. Ví dụ, xét chỉ số MSE, trong trường hợp mã hóa tuyến tính và ∆ = 0.4, hệ thống mã hóa lai cho kết quả cao hơn so với hệ thống số 6 db và 12 dB, tương ứng ở các giá trị CSNR = 0 dB và CSNR = 3 dB. Sự cải Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 75 tiến này thể hiện rõ rệt hơn ở dải CSNR cao, khi hệ thống lai tốt hơn hệ thống số ít nhất 22.5 dB trong dải CSNR từ 15 đến 15 dB. Điều này thể hiện ưu điểm của bộ mã hóa tương tự trong truyền dữ liệu tiếng nói. Tương tự, ở hình 7, hệ thống lai số-tương tự sử dụng mô hình phi tuyến tính cũng cho kết quả tốt hơn so với các hệ thống mã hóa số với kĩ thuật bảo vệ bất cân bằng và mã hóa số-tương tự kết hợp mô hình tuyến tính. Cụ thể, hệ thống số-tương tự với mã hóa phi tuyến cho kết quả tốt hơn hệ thống số-tương tự và mã hóa tuyến tính trên một dải rộng của điều kiện kênh, từ CSNR = 8 dB đến CSNR = 23 dB, với khác biết lớn nhất xét trên chỉ số SSIM là 0.225 tại CSNR = 11 dB. Hình 7. Kết quả mô phỏng với chỉ số SSIM. Chú ý rằng, hệ thống trang bị mã hóa phi tuyến tính sẽ có hiệu ứng "chững lại" (leveling-off effect), tức là hiệu năng của hệ thống giữ nguyên tại một giá trị hằng số, dù chỉ số CSNR tiếp tục tăng đến vô cùng. Ví dụ, hiệu năng của hệ thống với mã hóa phi tuyến tính, 600 điểm trên đường tín hiệu và ∆ = 0.1 và 0.4 dừng ở MOS = 4.389, với tất cả các giá trị CSNR lớn hơn 14 dB và 17 dB, tương ứng. Tương tự, nếu xét chỉ số MSE, các hệ thống dừng lại ở MSE = 65.8 dB với tất cả các giá trị CSNR lớn hơn 15 dB và 18 dB. Với chỉ số SSIM và dữ liệu ảnh, kết quả của hệ thống dừng lại tại SSIM = 0.829 và SSIM = 0.839 tương ứng với hệ thống 600 điểm và 1000 điểm trên đường cong tín hiệu. Lý do vì với các hệ thống phi tuyến tính, ta chỉ có thể truyền các giá trị xấp xỉ của lỗi, chứ không có khả năng truyền tất cả các giá trị một cách chính xác. Như vậy, tại nơi nhận tin, không có đủ cơ sở để khôi phục lại hoàn toàn gói tin đã truyền đi, kể cả trong trường hợp kênh không có nhiễu. Ngược lại, hệ thống được trang bị cơ chế mã hóa tuyến tính khắc phục hạn chế này. Nói cách khác, chỉ số MOS trong hệ thống với mã hóa tuyến tính sẽ tăng khi chỉ số CSNR của kênh tăng. Lý do dẫn đến điều này là do nguyên lý hoạt động của mã hóa tương tự tuyến tính, trong đó tất cả các giá trị lỗi đều có khả năng được ước chính xác, miễn là điều kiện kênh đủ tốt. Chúng tôi cũng chú ý rằng, trong với trường hợp mã hóa phi tuyến, đường cong tín hiệu với 1000 điểm cho kết quả tốt hơn so với đường cong có 600 điểm trên dải CSNR cao. Thêm vào đó, ngưỡng đạt được trong hiệu ứng "chững lại" của đường cong 1000 điểm cũng tốt hơn. Lý do cho hiện tượng này là đường cong với 1000 điểm có khả năng biểu diễn tín hiệu tốt hơn các giá trị lỗi so với đường cong 600 điểm. Trong các điều kiện kênh tốt, ứng với dải CSNR cao, nơi nhận có thể khôi phục các giá trị lỗi với độ méo thấp. Từ đó, số giá trị lỗi ở đường cong 1000 điểm được khôi phục chính xác nhiều hơn số giá trị lỗi được khôi phục ở trường hợp còn lại, dẫn đến kết quả tốt hơn. Một điểm chú ý nữa được rút ra từ Hình 5 là hiệu quả của hệ thống mã hóa phi tuyến tính tốt hơn so với hệ thống mã hóa tuyến tính trên dải CSNR cao. Ví dụ, xét chỉ số MOS, Kỹ thuật điều khiển & Điện tử N. M. Quang, N. Đ. Tiến, “Mã hóa lai nguồn-kênh với băng thông mở rộng.” 76 mã hóa phi tuyến sử dụng đường cong 600 điểm đưa ra kết quả cao hơn so với mã hóa tuyến tính trên dải CSNR từ 14 dB đến 24 dB, với các hệ thống có ∆ = 0.4. Hơn nữa, kết quả này còn tốt hơn nếu xét trên chỉ số MSE. Cụ thể, trên dải CSNR từ 17 dB đến 25 dB, mã hóa phi tuyến với đường cong tín hiệu 1000 điểm tốt hơn má hóa tuyến tính ít nhất 55.1 dB và 55.3 dB với ∆ = 0.4, tương ứng. Điều này chứng minh ưu điểm của việc áp dụng kĩ thuật bảo vệ bất cân bằng trong phần tương tự đã được đề xuất trong bài báo. Chúng tôi cũng nhận thấy rằng, mã hóa tuyến tính cho kết quả tốt hơn mã hóa phi tuyến ở dải các giá trị CSNR thấp. Cụ thể, hệ thống trang bị mã hóa tuyến tính và ∆ = 0.4 đạt được kết quả tốt hơn so với mã hóa phi tuyến trong khoảng CSNR từ 0 dB đến 10 dB, kết quả tốt hơn ít nhất là 0.45 và 8.45 dB, xét trên chỉ số MOS và MSE tương ứng. Nguyên nhân của hiện tương này là với điều kiện kênh tồi, nhiễu của kênh có thể đưa một điểm từ một phần trên đường cong tin hiệu tới một phần khác cách xa phần ban đầu. Điều này dẫn tới sai khác lớn khi nơi nhận khôi phục giá trị ban đầu của lỗi. Cuối cùng, một điểm đáng chú ý là các hệ thống sử dụng giá trị ∆ lớn đạt chất lượng truyền tin tốt hơn so với hệ thống sử dụng giá trị ∆ nhỏ. Lý do dẫn đến hiện tượng này là quá trình khôi phục thông tin sẽ thực hiện tốt hơn với sự hỗ trợ của giá trị ∆ lớn, khi các điểm trên đường cong tín hiệu có xu hướng cách xa nhau. Việc sử dụng giá trị ∆ nhỏ sẽ làm cho hệ thống nhạy cảm hơn với nhiễu, làm giảm chất lượng khôi phục dữ liệu gốc. 5. KẾT LUẬN Trong bài báo này, chúng tôi đã đề xuất một mô hình mã hóa lai số-tương tự, trong đó ứng dụng kiến trúc mã hóa kết hợp nguồn-kênh ở phần số, tận dụng ưu điểm của bộ mã hóa tương tự ở phần tương tự. Việc áp dụng cơ chế bảo vệ bất cân bằng ở phần tương tự giúp nâng cao chất lượng truyền tin của hệ thống, giảm độ méo dữ liệu, nhờ tận dụng được thông tin về xác suất phân bố của các giá trị trong vector lỗi. Kết quả thực nghiệm cho thấy, hệ thống đề xuất đưa đến kết quả tốt hơn so với các hệ thống mã hóa lai số-tương tự truyền thống và hệ thống mã hóa số đơn thuần. TÀI LIỆU THAM KHẢO [1]. S. Borade, B. Nakiboglu, and L. Zheng, “Unequal error protection: some fundamental limits,” in IN PROC. OF THE INTERNATIONAL SYMPOSIUM ON INFORMATION THEORY. Citeseer, 2008. [2]. C. E. Shannon, “Communication in the presence of noise,” Proceedings of the IRE, Vol. 37, no. 1, pp. 10–21, 1949. [3]. U. Mittal and N. Phamdo, “Hybrid digital-analog (hda) joint sourcechannel codes for broadcasting and robust communications,” IEEE Transactions on Information Theory, Vol. 48, no. 5, pp. 1082–1102, 2002. [4]. M. Skoglund, N. Phamdo, and F. Alajaji, “Hybrid digital–analog source–channel coding for bandwidth compression/expansion,” IEEE Transactions on Information Theory, Vol. 52, no. 8, pp. 3757–3763, 2006. [5]. T. Miki, C.-E. Sundberg, and N. Seshadri, “Pseudo-analog speech transmission in mobile radio communication systems,” IEEE transactions on vehicular technology, Vol. 42, no. 1, pp. 69–77, 1993. [6]. N. Phamdo and U. Mittal, “A joint source-channel speech coder using hybrid digital- analog (hda) modulation,” IEEE transactions on speech and audio processing, Vol. 10, no. 4, pp. 222–231, 2002. [7]. C. Hoelper and P. Vary, “Bandwidth-efficient mixed pseudo analoguedigital speech and audio transmission,” in Multimedia Signal Processing, 2006 IEEE 8th Workshop on. IEEE, 2006, pp. 141–145. Nghiên cứu khoa học công nghệ Tạp chí Nghiên cứu KH&CN quân sự, Số 51, 10 - 2017 77 [8]. M. Rungeler, J. Bunte, and P. Vary, “Design and evaluation of hybrid¨ digital- analog transmission outperforming purely digital concepts,” IEEE Transactions on Communications, Vol. 62, no. 11, pp. 3983–3996, 2014. [9]. M. Rungeler, F. Kleifgen, and P. Vary, “Wideband speech coding with ¨ hybrid digital-analog transmission,” in Signal Processing Conference (EUSIPCO), 2015 23rd European. IEEE, 2015, pp. 784–788. [10]. P. A. Floor and T. A. Ramstad, “Optimality of dimension expanding shannon- kotel’nikov mappings,” in Information Theory Workshop, 2007. ITW’07. IEEE. IEEE, 2007, pp. 289–294. [11]. P. Minero, S. H. Lim, and Y.-H. Kim, “A unified approach to hybrid coding,” IEEE Transactions on Information Theory, Vol. 61, no. 4, pp. 1509–1523, 2015. [12]. P.862: Perceptual evaluation of speech quality (pesq): “An objective method for end- to-end speech quality assessment of narrowband telephone networks and speech codes.” Available: ABSTRACT HYBRID SOURCE–CHANNEL CODING FOR BANDWIDTH EXPANSION The structure of hybrid source–channel coding has extensively used in telecommunication, especially in transmitting speed or video data. Hybrid source- channel coding integrates the advantages of both digital-coding and analog-coding to improve the quality of data transmission in different types of channels. However, in existing works, hybrid source-channel coding has been only applied for continuous signal. In this paper, an information transmission model for discrete signals is proposed. Specifically, two different models for analog encoding: linear analog coding and nonlinear analog encoding are introduced. Linear encoding model utilizes equal error protection mechanism while the nonlinear coding model uses unequal error protection mechanism with significant information from source. The experimental result shows that our proposed methods outperform existing works in terms of transmission quality. Keywords: Hybrid source-channel coding, Digital Coding, Analog Coding, Information transmission from discrete source. Nhận bài ngày 10 tháng 5 năm 2017 Hoàn thiện ngày 5 tháng 9 năm 2017 Chấp nhận đăng ngày 25 tháng 10 năm 2017 Địa chỉ: 1Viện Công nghệ Thông tin và Truyền thông, Đại học Bách Khoa Hà Nội; 2SAMOVAR, Télécom SudParis, CNRS, Université Paris-Saclay, 9 rue Charles Fourier - 91011 Evry Cedex; 3Trường Đại học Kỹ thuật Hậu cần Công an Nhân dân, Bộ Công an. *Email: quangnm@hnue.edu.vn.
File đính kèm:
- ma_hoa_lai_nguon_kenh_voi_bang_thong_mo_rong.pdf