Giải pháp thống kê phương tiện giao thông sử dụng camera

Abstract: This paper proposes a solution for

vehicle counting using camera as a sensor. We also

present a novel texture feature that is a modified

version of the well-known Local Binary Pattern (LBP)

feature. The experimental results are evaluated on a

data set collected in the intersection of Ly Tu Trong –

Pasteur, Ho Chi Minh City at various times. The

proposed solution achived an accuracy of car

counting from 90% to 97%, and accuracy of

motorcycle counting over 75% during the day and

over 50 % at night.

pdf 8 trang phuongnguyen 8740
Bạn đang xem tài liệu "Giải pháp thống kê phương tiện giao thông sử dụng camera", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giải pháp thống kê phương tiện giao thông sử dụng camera

Giải pháp thống kê phương tiện giao thông sử dụng camera
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 55 - 
Giải pháp thống kê phƣơng tiện giao thông sử 
dụng camera 
Vehicle Counting Solution using Video Camera 
Trần Nguyên Ngọc, Hoàng Anh Tuấn, Từ Minh Phƣơng 
Abstract: This paper proposes a solution for 
vehicle counting using camera as a sensor. We also 
present a novel texture feature that is a modified 
version of the well-known Local Binary Pattern (LBP) 
feature. The experimental results are evaluated on a 
data set collected in the intersection of Ly Tu Trong – 
Pasteur, Ho Chi Minh City at various times. The 
proposed solution achived an accuracy of car 
counting from 90% to 97%, and accuracy of 
motorcycle counting over 75% during the day and 
over 50 % at night. 
 Keywords: Local Binary Pattern; Object 
detection; Vehicle Counting; Computer vision. 
I. ĐẶT VẤN ĐỀ 
Thống kê và phân loại phương tiện giao thông như 
ô tô, xe máy lưu thông trên đường là bài toán có ứng 
dụng quan trọng trong quản lý giao thông, giúp giám 
sát tình hình, thực hiện điều hành giao thông theo thời 
gian thực, cũng như cung cấp thông tin phục vụ quy 
hoạch hạ tầng giao thông trong ngắn và dài hạn. 
Có ba cách tiếp cận chính cho thống kê phương 
tiện giao thông trên đường theo thời gian thực. Cách 
thứ nhất sử dụng các cảm biến áp suất chôn dưới mặt 
đường cho phép phát hiện xe nhờ áp suất của xe lên 
cảm biến. Phương pháp này có độ ổn định cao, có thể 
hoạt động trong nhiều điều kiện thời tiết. Tuy nhiên, 
phương pháp này chỉ chính xác trong trường hợp xe đi 
đúng làn đường, khó áp dụng cho giao thông tại Việt 
Nam. Cách thứ hai sử dụng cảm biến siêu âm [1] do 
động cơ ô tô, xe máy tạo ra dựa theo tần số đặc trưng 
cho từng loại xe. Phương pháp này đã được nhóm các 
nhà nghiên cứu Đại học Giao thông vận tải thực hiện, 
mặc dù vậy cũng cho độ chính xác không cao nếu mật 
độ giao thông lớn, hướng nghiên cứu này cũng tìm 
cách kết hợp với đếm xe bằng hồng ngoại, tuy nhiên 
hệ thống tương đối phức tạp. Cách tiếp cận thứ ba sử 
dụng kỹ thuật xử lý ảnh và nhận dạng để phát hiện 
phương tiện giao thông từ camera lắp đặt trên đường 
hoặc tại các giao lộ. Phương pháp này phụ thuộc nhiều 
vào điều kiện thời tiết, ánh sáng, song dễ lắp đặt và có 
thể giải quyết cả ba vấn đề: phát hiện, phân loại, cũng 
như bám chuyển động để xác định quỹ đạo phương 
tiện, nhờ vậy cung cấp thêm thông tin bổ sung so với 
hai nhóm phương pháp trên [2]. Yếu tố chủ yếu quyết 
định sự thành công của giải pháp loại này là phát triển 
được giải thuật xử lý ảnh cho phép phát hiện và bám 
chính xác, ít phụ thuộc vào điều kiện thời tiết [3]. 
Trong bài báo này, chúng tôi sẽ tập trung vào giải 
pháp thuộc nhóm thứ ba. Cụ thể, camera được đặt tại 
ngã ba, ngã tư hoặc trên đường và được nối với máy 
tính. Từ video thu được cần phát hiện phương tiện 
giao thông, phân loại thành ôtô, xe máy, bám được 
chuyển động của phương tiện, từ đây tính số lượng và 
quỹ đạo của luồng giao thông. Các thao tác này phải 
thực hiện trong thời gian thực trên một CPU thông 
dụng, trong điều kiện ánh sáng ban ngày và ban đêm 
khi có đèn đường, với mật độ giao thông thực tế dầy 
đặc tại Tp. Hồ Chí Minh hoặc Hà Nội. 
Khác với những giải pháp phát hiện và bám xe đã 
có, theo đó vùng ảnh chứa phương tiện được xác định 
dựa trên vùng chuyển động [4-7], phương pháp của 
chúng tôi coi phát hiện ô tô, xe máy như bài toán phát 
hiện đối tượng từ ảnh tĩnh (object detection), và sử 
dụng các khung hình liên tiếp trong video để bám đối 
tượng nhằm tăng độ chính xác. Phương tiện giao thông 
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 56 - 
được phát hiện dựa trên việc phân loại vùng ảnh nằm 
trong cửa sổ trượt thành các loại phương tiện hoặc là 
vùng nền và biểu diễn đối tượng trong cửa sổ bằng đặc 
trưng phù hợp [8]. Đóng góp chính trong nghiên cứu 
của chúng tôi là đề xuất cải tiến đặc trưng LBP (Local 
Binary Pattern) [11], qua đó tăng độ chính xác khi sử 
dụng với bộ phân loại cho cửa sổ trượt. Đóng góp 
quan trọng khác là xác lập các bước xử lý kết hợp để 
bám chuyển động và gán nhãn đối tượng. 
II. CÁC NGHIÊN CỨU LIÊN QUAN 
Bài toán phát hiện và bám phương tiện giao thông 
từ camera đặt trên đường đã được nghiên cứu từ nhiều 
năm với một số hệ thống được sử dụng thực tế [2]. 
Tính năng chung của các hệ thống dạng này là phát 
hiện phương tiện giao thông. Một số hệ thống có thêm 
khả năng phân loại phương tiện, chẳng hạn thành xe 
máy, xe đạp, ô tô con, ô tô tải v.v., cũng như bám 
phương tiện để xác định chuyển động đi thẳng hay rẽ 
[4,7]. Trong các hệ thống dạng này, phần quan trọng 
nhất là phần phát hiện phương tiện giao thông. Cách 
tiếp cận chung cho phát hiện phương tiện giao thông là 
phát hiện vùng chuyển động, kết hợp với phân loại 
vùng chuyển động thành các loại phương tiện khác 
nhau. Nhiều phương pháp phát hiện vùng chuyển động 
được sử dụng như dùng moving map [7], sử dụng mô 
hình Gausian Mixture Model (GMM) để sinh hình nền 
[4], hay kết hợp GMM sinh hình nền với xóa bóng cho 
trường hợp trời nắng [5]. Vấn đề lớn nhất khi phát 
hiện vùng chuyển động là giảm ảnh hưởng của điều 
kiện chiếu sáng và nhiễu vùng nền. Một số giải pháp 
đã được đề xuất cho vấn đề này như sử dụng ngưỡng 
động có khả năng thay đổi theo ánh sáng [3]. Sau khi 
tách được vùng chuyển động, bước tiếp theo là phân 
loại vùng chuyển động thành các loại phương tiện giao 
thông hoặc không phải phương tiện (do nhiễu). 
Phương pháp thường được dùng cho bước này là sử 
dụng mô hình 3D dựng sẵn của các loại xe sau đó so 
khớp với hình viền vùng chuyển động đã phát hiện 
trong bước trước [4,7]. Một phương pháp khác cũng 
được sử dụng là dùng các dạng đặc trưng ảnh thông 
dụng như HOG kết hợp với thuật toán phân loại như 
SVM [5]. Khó khăn khi sử dụng những phương pháp 
này là không thể phân biệt các phương tiện giao thông 
đi theo nhóm gần nhau. Giải pháp cho vấn đề này 
được giải quyết trong [6] bằng cách sử dụng đồ thị 
AND-OR. Giải pháp được chọn trong phương pháp 
của chúng tôi cho phép tránh các khó khăn thường gặp 
trong giải pháp phát hiện vùng chuyển động do các 
phương tiện di chuyển gần nhau gây chồng lấn trong 
các khung hình, do vậy thích hợp hơn với điều kiện tại 
Việt Nam. 
Nội dung nghiên cứu được trình bày lần lượt theo 
trình tự sau: mục 3 trình bày đặc điểm bố trí hệ thống 
camera thu nhận hình ảnh và yêu cầu cụ thể của bài 
toán; mục 4 đề xuất giải pháp cải tiến đặc trưng mô tả 
đối tượng hình ảnh cần phát hiện; mục 5 mô tả giải 
pháp bám và gán nhãn đối tượng; mục 6 tổng hợp một 
số kết quả thực nghiệm và đánh giá. 
III. ĐẶC ĐIỂM HÌNH ẢNH ĐỐI TƢỢNG 
Xuất phát từ nhu cầu thực tế, nghiên cứu của chúng 
tôi được xây dựng trên cơ sở hạ tầng hệ thống camera 
gắn tại các nút giao thông tại Tp. Hồ Chí Minh. Các 
camera được bố trí ở độ cao 618 cm so với mặt đường, 
các ngã tư là những vị trí ưu tiên tập trung thống kê 
lưu lượng giao thông. Tại đó, có 1 hoặc 2 camera đặt ở 
một góc của ngã tư, đảm bảo cho phép quan sát toàn 
bộ các hướng di chuyển tới phía camera, các camera 
đặt nghiêng góc 20 độ so với phương ngang. 
Hình 1. Bố trí camera trên đường Cộng hòa 
Bài toán đặt ra cho nhóm nghiên cứu là thống kê 
các phương tiện giao thông di chuyển theo các hướng 
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 57 - 
khác nhau, từ đó tổng hợp làm cơ sở dự báo vận tốc, 
lưu lượng giao thông trong thành phố. 
Hình 2. Hình ảnh thu được từ camera tại ngã tư 
Pasteur - Lý Tự Trọng 
Do đặc điểm bố trí thiết bị đã có, hình ảnh các đối 
tượng sẽ gồm 2 dạng cơ bản: dạng đi thẳng trực diện 
với camera và dạng đi hướng tới camera nhưng lệch 
về bên sườn trái. 
IV. XÂY DỰNG BỘ MÔ TẢ ĐỐI TƢỢNG 
Trong các dạng mô tả đặc trưng đối tượng phục vụ 
cho các giải pháp phát hiện nhanh đối tượng trong ảnh 
hiện đa phần hướng tới các bộ mô tả đặc trưng 
(Descriptor) phục vụ cho kỹ thuật cửa sổ trượt như 
Haar-like [8], HOG [12], LBP [11]Để đảm bảo các 
tính toán không quá phức tạp và cho phép chạy đồng 
thời nhiều bộ tìm kiếm (Detector) trên cùng một ảnh 
tĩnh, nhóm nghiên cứu đã cải tiến bộ mô tả đặc trưng 
LBP. 
Trong đó, bộ mô tả đặc trưng LBP phản ảnh mối 
tương quan về mức xám giữa mỗi điểm ảnh (hoặc một 
vùng ảnh) với các điểm ảnh (hoặc vùng ảnh) lân cận. 
Thực chất việc áp dụng bộ mô tả này cho phép ánh xạ 
ảnh đối tượng sang một ảnh khác có khả năng bất biến 
cao hơn trước các thay đổi về mức sáng, cũng như một 
số biến dạng hình học [11]. 
Trong nghiên cứu [10] việc áp dụng LBP cho việc 
nhận dạng một đối tượng hình ảnh được tiến hành theo 
trình tự sau: 
Bƣớc 1. Chia cửa sổ vùng ảnh cần xem xét thành 
các ô vuông. 
Bƣớc 2. Tại mỗi ô, so sánh từng điểm ảnh với 8 
điểm ảnh khác xung quanh nó (số lượng điểm ảnh lân 
cận có thể thay như trên Hình 3). 
Hình 3. LBP và 3 kiểu sử dụng điểm ảnh lân cận 
Bƣớc 3. Quy đổi kết quả so sánh thành chuỗi bit 
thông tin đại diện (xem Hình 4). 
Hình 4. Quy đổi kết quả thành chuỗi bit 
Bƣớc 4. Tính lược đồ histogram các giá trị đại diện 
vừa tính được ở bước 3. 
Bƣớc 5. Chuẩn hóa histogram về khoảng giá trị 
quy định trước. 
Bƣớc 6. Tập hợp tất cả histogram của tất cả các ô 
trong cửa sổ tạo thành một vector đặc trưng của cửa sổ 
đó. 
Hình 5. Cách xác định Vector đặc trưng LBP 
Bƣớc 7. Sử dụng cho các thuật toán học máy, mô 
hình cascade với thuật toán huấn luyện AdaBoost để 
phân biệt kết quả thu được ở bước 6. Chi tiết của bước 
này được mô tả trong [8]. 
Trong toàn bộ các bước thực hiện trên, việc xác 
định chuỗi bit quy đổi dựa trên lựa chọn các so sánh 
chênh lệch mức xám của các điểm ảnh ở bước 2,3 có ý 
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 58 - 
nghĩa hết sức quan trọng. Lưu ý rằng, đặc trưng LBP 
này có thể được mở rộng ra về kích thước cũng như số 
lượng các điểm ảnh lân cận. Ví dụ như đặc trưng 
LBP4,1 sử dụng 4 điểm ảnh lân cận, đặc trưng 
LBP16,2 sử dụng 16 điểm ảnh lân cận với bán kính là 
2. Tổng quát hóa thì đặc trưng LBPP,R sẽ sử dụng P 
điểm ảnh lân cận tương đương với vùng không gian có 
bán kính điểm ảnh là R, vùng không gian đó bao gồm 
tập các điểm ảnh lân cận tạo thành một hình tròn. Từ 
đặc trưng LBPP,R có thể tạo ra được 2P giá trị đầu ra, 
tương ứng với 2P pattern nhị phân biểu diễn bởi P 
điểm ảnh trong tập các điểm ảnh lân cận. Từ đó có thể 
thấy mỗi đặc trưng LBP có thể mang rất nhiều thông 
tin, hoàn toàn có thể sử dụng một tập con trong 2P 
pattern để có thể mô tả thông tin về các ảnh. Tuy nhiên 
do các điểm ảnh nằm gần nhau khi tính toán đặc trưng 
LBP có thể dẫn đến việc mối quan hệ giữa các điểm 
ảnh lân cận nhau được xác định lại để đưa vào thông 
tin các chuỗi thông tin, do vậy việc tối ưu hóa lượng 
thông tin này sẽ làm tăng khả năng mô tả đối tượng 
hơn. Cụ thể, chúng tôi nhận thấy với cách trích chọn 
đặc trưng LBP hiện tại khi tính toán tại hai điểm ảnh 
sát nhau thì mối quan hệ giữa chúng sẽ được tính lại 2 
lần (xem Hình 6). 
Hình 6. Quan hệ giữa 2 điểm C1, C2 được xác định 
2 lần 
Vì thế, trong nghiên cứu này chúng tôi đề xuất cải 
tiến cách thức mô tả quan hệ các điểm lân cận để trích 
chọn đặc trưng dạng LBP bằng cách vẫn lựa chọn 8 so 
sánh tương quan giữa các điểm ảnh nhưng chỉ có 4 so 
sánh với điểm ảnh trung tâm C, còn lại là quan hệ so 
sánh giữa chính các điểm lân cận của C. Việc lựa chọn 
này cần tuân theo nguyên tắc không tồn tại 2 quan hệ 
so sánh nào mà cạnh nối biểu thị quan hệ giữa các 
điểm ảnh song song với nhau. Ví dụ nếu trong hình 7 
thì quan hệ giữa C-g0 với quan hệ g1-g3 sẽ có biểu diễn 
song song với nhau, và vì thế ta chỉ chọn một trong hai 
quan hệ này. 
Hình 7. Mô tả quan hệ giữa các điểm ảnh sử dụng 
cho tính toán đặc trưng LBP 
Với cách mô tả này giá trị thay thế cho mức xám 
tại điểm ảnh được minh họa như trên Hình 8. 
Hình 8. Cải tiến cách tính giá trị điểm ảnh trong 
mô tả đặc trưng LBP 
Với việc sử dụng bộ mô tả này khi xem xét việc 
phản ánh thông tin về mối quan hệ giữa các điểm ảnh 
lân cận trên toàn bộ vùng ảnh sẽ nhận thấy không tồn 
tại các quan hệ trùng lặp và không những thế bổ sung 
thêm các quan hệ. Trong hình 9a, 9b nếu chỉ tách xem 
xét mối quan hệ giữa 9 điểm ảnh C1, C2, C9 thì trong 
mô tả 9a các quan hệ đều bị xét lại hai lần, trong khi 
đó tại 9b chỉ sử dụng 1 lần ngoài ra bổ sung thêm các 
quan hệ C1-C6; C1-C8; C1-C9; C2-C7; C3-C4; C3-C8; C4-
C9; C6-C7. 
Hình 9.a. Mối quan hệ giữa các điểm ảnh được sử 
dụng trong bộ mô tả truyền thống 
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 59 - 
Hình 9.b. Mối quan hệ giữa các điểm ảnh được sử 
dụng trong bộ mô tả cải tiến 
V. CÁC KỸ THUẬT BÁM ĐỐI TƢỢNG 
Sau khi có được bộ dò tìm đối tượng, để thống kê 
được số lượng các phương tiện tham gia giao thông 
trong một đoạn video cần thực hiện bám đối tượng và 
xác định được các trường hợp: xuất hiện đối tượng 
mới, đối tượng rời khỏi thị trường của camera, xác 
định liên hệ giữa các đối tượng của hai khung hình 
liên tiếp.Trong nghiên cứu này sử dụng thuật toán 
OpticalFlow [14] để bám chuyển động và thuật toán 
Hungarian [13] để tiến hành gán nhãn các đối tượng ở 
hai khung hình liên tiếp. Các bước tiến hành như sau: 
Bƣớc 1. Phát hiện đối tượng ở khung hình i+1 bằng 
các phương pháp nhận dạng sử dụng bộ mô tả đặc 
trưng trình bày ở mục IV. 
Bƣớc 2. Tính toán khoảng cách Euclid giữa các đối 
tượng ở khung hình i và i+1 với giả thiết chúng cùng 
nằm trong một mặt phẳng tọa độ. Sau đó, sử dụng 
thuật toán Hungarian để gán từng cặp. 
Bƣớc 3. Với các đối tượng ở khung hình i mà 
không được gán với đối tượng nào ở khung hình i+1 
thì phải dự đoán vị trí mới của chúng bằng phương 
pháp OpticalFlow. 
Bƣớc 4. Với các đối tượng ở khung hình i+1 mà 
không được gán với đối tượng nào ở khung hình I thì 
đó là các đối tượng mới xuất hiện. Thông tin của các 
đối tượng này sẽ được sử dụng để xác định tiếp vị trí 
của chúng ở các khung hình tiếp theo. 
Hình 10. Mô tả quá trình bám và gán nhãn đối tượng 
V. KẾT QUẢ THỰC NGHIỆM 
Để đánh giá hiệu năng của thuật toán đề xuất nhóm 
nghiên cứu đã tiến hành thử nghiệm với cả hai loại đối 
tượng là xe máy và xe ô tô trong cả điều kiện ánh sáng 
ban ngày và ban đêm, đồng thời với mỗi phương tiện 
giao thông chúng tôi tiếp tục phân loại theo hướng 
chuyển động và xây dựng bộ đặc trưng cho từng loại 
riêng biệt. 
Các mẫu huấn luyện được thu thập theo nhóm 
phương tiện: xe máy, xe ô tô (gồm cả con, xe buýt và 
xe bán tải), thời gian (ban ngày, tối) và hướng di 
chuyển (ngang, dọc), mỗi nhóm khoảng 6000 mẫu 
(xem Hình 11, 12). Hình ảnh được thu từ các camera 
đặt trực tiếp trên đường, các camera đều thuộc dòng IP 
và sử dụng đồng nhất loại Messoa Model: NCR878-
HP5-MES, tốc độ thu nhận hình ảnh 30 hình/giây. Đối 
với các loại xe ô tô chúng tôi cùng lựa chọn vùng đầu 
xe để huấn luyện chung cho một bộ nhận dạng. 
Sau đó tiến hành huấn luyện bằng thuật toán 
Adaboost sử dụng bộ công cụ OpenCV 2.4.6. 
Để đánh giá kết quả của việc nhận dạng đối tượng 
thì có hai tiêu chí được sử dụng là độ chính xác và độ 
nhạy. Độ chính xác được xác định bởi tỷ lệ nhận dạng 
đúng trong tổng số những đối tượng đã nhận dạng 
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 60 - 
được, trong khi đó độ nhạy liên quan đến tỷ lệ nhận 
dạng đúng trong tổng số đối tượng thực tế. 
Hình 11. Mẫu huấn luyện xe máy 
Hình 12. Mẫu huấn luyện xe ô tô 
Kết quả thực nghiệm trên tập ảnh tĩnh (là ảnh được 
tách ra từ các video thu được từ các camera tại các 
thời điểm khác nhau) gồm 1249 ảnh chụp buổi sáng; 
1076 ảnh chụp buổi trưa; 3063 ảnh tối, với ba loại đặc 
trưng: đặc trưng Haar như được sử dụng trong [7], đặc 
trưng LBP nguyên bản [9], và đặc trưng LBP cải tiến 
được tóm tắt trong Bảng 1. 
Bảng 1. Kết quả phát hiện đối tượng trên tập ảnh tĩnh 
Kết quả trong Bảng 1 cho thấy đặc trưng LBP cải 
tiến cho kết quả với độ nhạy gần tương đương với các 
đặc trưng Haar, LBP truyền thống, nhưng có độ chính 
xác vượt trội trong đa số trường hợp. Chẳng hạn, độ 
chính xác khi phát hiện ô tô vào buổi sáng khi dùng 
Haar, LBP, và LBP cải tiến lần lượt là 87.39, 89.66, và 
94.11. Tức là cải tiến đề xuất cho phép tăng độ chính 
xác tới gần 5%. 
Kết quả trong Bảng 1 cũng cho thấy, trong khi độ 
chính xác đạt trên 90% thì độ nhạy tương đối thấp, 
nhiều trường hợp xuống dưới 60%. Điều này dẫn tới 
việc thống kê lưu lượng giao thông sẽ thiếu chính xác, 
ví dụ, với độ nhạy khoảng 70%, độ chính xác 90% 
(trên 70% tìm được) ta chỉ có thể đếm được đúng 
khoảng 63% (0.63=0.7x0.9) số lượng phương tiện 
thực tế (kể cả trong trường hợp không có nhầm lẫn vị 
trí giữa các đối tượng ở các khung hình khác nhau). 
Tuy nhiên, để tăng độ nhạy đa phần chúng ta sẽ cần 
điều chỉnh tham số huấn luyện và phải giảm độ chính 
xác. Do đó chúng tôi kết hợp thêm giải pháp bám đối 
tượng như đã đề xuất ở mục V để tăng độ tin cậy của 
hệ thống khi thống kê phương tiện giao thông. Về thực 
chất, việc bám đối tượng cho phép kết hợp kết quả 
phát hiện đối tượng từ nhiều khung hình để bổ sung 
thêm thông tin còn thiếu. Trong trường hợp phương 
tiện bị bỏ sót trong một khung hình thì vẫn có khả 
năng được phát hiện bổ sung nhờ bám từ các khung 
hình lân cận. 
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 61 - 
Chúng tôi cũng tiếp tục áp dụng đặc trưng LBP cải 
tiến cho bài toán thống kê phương tiện bằng cách so 
sánh kết quả đếm của người với kết quả của máy tính, 
dữ liệu sử dụng trong nghiên cứu này được trích ra từ 
các video thu nhận ngày 23/5/2014 là ngày thứ 6 có 
mật độ giao thông tương đối đông so với các ngày 
khác. Kết quả cụ thể được tóm tắt trong Bảng 2, trong 
đó chúng tôi sử dụng khái niệm độ tin cậy, xác định 
dựa trên phần trăm sai lệch giữa kết quả thống kê do 
máy tính đưa ra và kết quả khảo sát trực tiếp bởi con 
người. 
Kết quả cho thấy việc thống kê lưu lượng xe ô tô 
tương đối tốt, với xe máy do quá trình gán nhãn và 
bám đối tượng đặc biệt khi các xe di chuyển cạnh nhau 
đôi lúc còn gặp khó khăn. Kết quả tại Bảng 2 cũng cho 
thấy việc thống kê xe máy vào ban ngày có xu hướng 
tốt hơn ban đêm, nhưng ô tô thì ngược lại, điều này 
nảy sinh bởi lý do vào buổi tối việc bám chuyển động 
của xe máy gặp nhiều khó khăn hơn do đặc điểm thuật 
toán OpticalFlow sử dụng nhiều thông tin về cường độ 
sáng các điểm keypoint ở đầu xe máy, trong khi đó, ô 
tô có hai đèn pha nên khoảng sáng giữa hai đèn khá 
thuận tiện cho việc lựa chọn keypoint. Trong các 
nghiên cứu tiếp theo chúng tôi sẽ tìm cách cải tiến vấn 
đề này. 
Bảng 2. Thống kê số lượng phương tiện trên video 
LỜI CẢM ƠN 
Kết quả nghiên cứu được tài trợ bởi Công ty FPT 
Software JSC trong khuôn khổ chương trình nghiên 
cứu “Xây dựng Hệ thống thị giác máy tính hỗ trợ 
thống kê phương tiện giao thông theo thời gian thực”. 
Ngoài việc thử nghiệm tại ngã tư Pasteur-Lý Tự 
Trọng, tuyến đường 2 chiều Cộng Hòa, hệ thống cũng 
đang được thử nghiệm tại một số ngã tư tại Bangkok 
Thái Lan, trong tương lai nhóm nghiên cứu sẽ tổng 
hợp các kết quả thống kê bằng hình ảnh với các kết 
quả thu được do hệ thống định vị GPS và thông tin di 
chuyển gắn trên các phương tiện giao thông như xe 
Bus, Taxi để hình thành bản đồ lưu lượng giao thông, 
ngoài ra tiếp tục bổ sung tập dữ liệu huấn luyện cũng 
như hiệu chỉnh thuật toán để đảm bảo tính bền vững 
của hệ thống trong các điều kiện thời tiết khác nhau. 
TÀI LIỆU THAM KHẢO 
[1] LÊ HÙNG LÂN, “ Nghiên cứu thiết kế, chế tạo các 
thiết bị, phương tiện và hệ thống tự động kiểm tra, giám 
sát, điều hành phục vụ cho an toàn giao thông đường 
bộ”, Báo cáo Đề tài Nghiên cứu Khoa học và Phát 
triển công nghệ cấp nhà nước (2008) mã số: 
KC.03.05/06-10. 
[2] N. BUCH, S. VELASTIN, AND J. ORWELL, “A 
review of computer vision techniques for the analysis of 
urban traffic” Intell. Transp. Syst. IEEoE Trans., vol. 
12, no. 3, pp. 920–939, 2011. 
[3] J D. GANGODKAR, P. KUMAR, AND A. MITTAL, 
“Robust Segmentation of Moving Vehicles Under 
Complex Outdoor Conditions”, Intell. Transp. Syst. 
IEEE Trans., vol. 13, no. 4, pp. 1738–1752, Dec. 2012. 
[4] N. BUCH, J. ORWELL, AND S. A. VELASTIN, 
“Detection and classification of vehicles for urban 
traffic scenes”, 5th Int. Conf. Vis. Inf. Eng. (VIE 2008), 
pp. 182–187, 2008. 
[5] Z. CHEN, T. ELLIS, AND S. A. VELASTIN, “Vehicle 
detection, tracking and classification in urban traffic,” 
in Intelligent Transportation Systems (ITSC), 2012 
15th International IEEE Conference on, 2012, pp. 951–
956.. 
[6] Y. LI, B. LI, B. TIAN, AND Q. YAO, “Vehicle 
Detection Based on the and - or Graph for Congested 
Traffic Conditions,” Intell. Transp. Syst. IEEE Trans., 
vol. 14, no. 2, pp. 984–993, Jun. 2013. 
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016 
- 62 - 
[7] MESSELODI, C. MODENA, AND M. ZANIN, “A 
computer vision system for the detection and 
classification of vehicles at urban road intersections,” 
Pattern Anal. Appl., vol. 8, pp. 17–31, 2005. 
[8] P. VIOLA AND M. JONES, “Robust Real-time Object 
Detection,” in International Journal of Computer 
Vision, 2001. 
[9] M. HEIKKILA AND M. PIETIKAINEN, “A texture-
based method for modeling the background and 
detecting moving objects,” Pattern Anal. Mach. Intell. 
IEEE Trans., vol. 28, no. 4, pp. 657–662, Apr. 2006. 
[10] ZHANG, LUN, ET AL. "Face detection based on 
multi-block lbp representation”. Advances in 
Biometrics. Springer Berlin Heidelberg, 2007. 11-18. 
[11] T. OJALA, M. PIETIKAINEN, AND T. MAENPAA, 
"Multiresolution gray-scale and rotation invariant 
texture classification with local binary patterns", IEEE 
Transactions on Pattern Analysis and Machine 
Intelligence, vol. 24, pp. 971-987, 2002. 
[12] N. DALAL AND B. TRIGGS, “Histograms of oriented 
gradients for human detection,” in Proc IEEE Int. 
Conf. on Computer Vision and Pattern Recognition, 
2005, vol. 1, pp. 886-893. 
[13] H.W. KUHN, “On the origin of the Hungarian 
Method”, History of mathematical programming; a 
collection of personal reminiscences, North Holland, 
Amsterdam, pp. 77–81, 1991. 
[14] C. TOMASI AND T. KANADE, "Detection and 
Tracking of Point Features". Pattern 
Recognition 37, pp. 165–168, 2004. 
 Nhận bài ngày: 05/05/2015 
SƠ LƢỢC VỀ TÁC GIẢ 
TRẦN NGUYÊN NGỌC 
Tốt nghiệp ĐH năm 2005, bảo vệ 
luận án tiến sỹ về “Phân tích hệ 
thống, điều khiển và xử lý thông 
tin” năm 2007 tại Rostov – LB 
Nga. 
Hiện công tác tại khoa CNTT 
Học viện Kỹ thuật Quân sự. 
Hướng nghiên cứu: xử lý ảnh, học máy, an toàn thông 
tin. Email: ngoctn@mta.edu.vn 
HOÀNG ANH TUẤN 
Tốt nghiệp Trường ĐH Bách 
khoa Hà Nội năm 2007 chuyên 
ngành Toán-Tin ứng dụng. 
Hiện đang công tác tại TT nghiên 
cứu và Phát triển sản phẩm của 
công ty FPT- Software. 
Hướng nghiên cứu: Học máy 
và xử lý ảnh. Email: tuanha2@fsoft.com.vn. 
TỪ MINH PHƢƠNG 
Tốt nghiệp ĐH tại trường Bách 
khoa Taskent năm 1993, bảo vệ 
tiến sỹ tại Viện hàn lâm khoa học 
Uzbekistant, Taskent, năm 1995. 
Được phong chức danh Phó giáo 
sư năm 2007. 
Từ năm 2000 đến nay công 
tác tại khoa CNTT, Học viện 
Công nghệ Bưu chính Viễn thông. Hiện là Trưởng 
khoa, khoa CNTT Học viện Công nghệ Bưu chính 
Viễn thông. 
Hướng nghiên cứu: các ứng dụng của học máy, tin 
sinh học. E-mail: phuong.tu@gmail.com 

File đính kèm:

  • pdfgiai_phap_thong_ke_phuong_tien_giao_thong_su_dung_camera.pdf