Giải pháp thống kê phương tiện giao thông sử dụng camera

Abstract: This paper proposes a solution for

vehicle counting using camera as a sensor. We also

present a novel texture feature that is a modified

version of the well-known Local Binary Pattern (LBP)

feature. The experimental results are evaluated on a

data set collected in the intersection of Ly Tu Trong –

Pasteur, Ho Chi Minh City at various times. The

proposed solution achived an accuracy of car

counting from 90% to 97%, and accuracy of

motorcycle counting over 75% during the day and

over 50 % at night.

8 trang phuongnguyen 18240

Download

Bạn đang xem tài liệu "Giải pháp thống kê phương tiện giao thông sử dụng camera", để tải tài liệu gốc về máy hãy click vào nút Download ở trên

Tóm tắt nội dung tài liệu: Giải pháp thống kê phương tiện giao thông sử dụng camera

Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 55 -
Giải pháp thống kê phƣơng tiện giao thông sử
dụng camera
Vehicle Counting Solution using Video Camera
Trần Nguyên Ngọc, Hoàng Anh Tuấn, Từ Minh Phƣơng
Abstract: This paper proposes a solution for
vehicle counting using camera as a sensor. We also
present a novel texture feature that is a modiﬁed
version of the well-known Local Binary Pattern (LBP)
feature. The experimental results are evaluated on a
data set collected in the intersection of Ly Tu Trong –
Pasteur, Ho Chi Minh City at various times. The
proposed solution achived an accuracy of car
counting from 90% to 97%, and accuracy of
motorcycle counting over 75% during the day and
over 50 % at night.
Keywords: Local Binary Pattern; Object
detection; Vehicle Counting; Computer vision.
I. ĐẶT VẤN ĐỀ
Thống kê và phân loại phương tiện giao thông như
ô tô, xe máy lưu thông trên đường là bài toán có ứng
dụng quan trọng trong quản lý giao thông, giúp giám
sát tình hình, thực hiện điều hành giao thông theo thời
gian thực, cũng như cung cấp thông tin phục vụ quy
hoạch hạ tầng giao thông trong ngắn và dài hạn.
Có ba cách tiếp cận chính cho thống kê phương
tiện giao thông trên đường theo thời gian thực. Cách
thứ nhất sử dụng các cảm biến áp suất chôn dưới mặt
đường cho phép phát hiện xe nhờ áp suất của xe lên
cảm biến. Phương pháp này có độ ổn định cao, có thể
hoạt động trong nhiều điều kiện thời tiết. Tuy nhiên,
phương pháp này chỉ chính xác trong trường hợp xe đi
đúng làn đường, khó áp dụng cho giao thông tại Việt
Nam. Cách thứ hai sử dụng cảm biến siêu âm [1] do
động cơ ô tô, xe máy tạo ra dựa theo tần số đặc trưng
cho từng loại xe. Phương pháp này đã được nhóm các
nhà nghiên cứu Đại học Giao thông vận tải thực hiện,
mặc dù vậy cũng cho độ chính xác không cao nếu mật
độ giao thông lớn, hướng nghiên cứu này cũng tìm
cách kết hợp với đếm xe bằng hồng ngoại, tuy nhiên
hệ thống tương đối phức tạp. Cách tiếp cận thứ ba sử
dụng kỹ thuật xử lý ảnh và nhận dạng để phát hiện
phương tiện giao thông từ camera lắp đặt trên đường
hoặc tại các giao lộ. Phương pháp này phụ thuộc nhiều
vào điều kiện thời tiết, ánh sáng, song dễ lắp đặt và có
thể giải quyết cả ba vấn đề: phát hiện, phân loại, cũng
như bám chuyển động để xác định quỹ đạo phương
tiện, nhờ vậy cung cấp thêm thông tin bổ sung so với
hai nhóm phương pháp trên [2]. Yếu tố chủ yếu quyết
định sự thành công của giải pháp loại này là phát triển
được giải thuật xử lý ảnh cho phép phát hiện và bám
chính xác, ít phụ thuộc vào điều kiện thời tiết [3].
Trong bài báo này, chúng tôi sẽ tập trung vào giải
pháp thuộc nhóm thứ ba. Cụ thể, camera được đặt tại
ngã ba, ngã tư hoặc trên đường và được nối với máy
tính. Từ video thu được cần phát hiện phương tiện
giao thông, phân loại thành ôtô, xe máy, bám được
chuyển động của phương tiện, từ đây tính số lượng và
quỹ đạo của luồng giao thông. Các thao tác này phải
thực hiện trong thời gian thực trên một CPU thông
dụng, trong điều kiện ánh sáng ban ngày và ban đêm
khi có đèn đường, với mật độ giao thông thực tế dầy
đặc tại Tp. Hồ Chí Minh hoặc Hà Nội.
Khác với những giải pháp phát hiện và bám xe đã
có, theo đó vùng ảnh chứa phương tiện được xác định
dựa trên vùng chuyển động [4-7], phương pháp của
chúng tôi coi phát hiện ô tô, xe máy như bài toán phát
hiện đối tượng từ ảnh tĩnh (object detection), và sử
dụng các khung hình liên tiếp trong video để bám đối
tượng nhằm tăng độ chính xác. Phương tiện giao thông
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 56 -
được phát hiện dựa trên việc phân loại vùng ảnh nằm
trong cửa sổ trượt thành các loại phương tiện hoặc là
vùng nền và biểu diễn đối tượng trong cửa sổ bằng đặc
trưng phù hợp [8]. Đóng góp chính trong nghiên cứu
của chúng tôi là đề xuất cải tiến đặc trưng LBP (Local
Binary Pattern) [11], qua đó tăng độ chính xác khi sử
dụng với bộ phân loại cho cửa sổ trượt. Đóng góp
quan trọng khác là xác lập các bước xử lý kết hợp để
bám chuyển động và gán nhãn đối tượng.
II. CÁC NGHIÊN CỨU LIÊN QUAN
Bài toán phát hiện và bám phương tiện giao thông
từ camera đặt trên đường đã được nghiên cứu từ nhiều
năm với một số hệ thống được sử dụng thực tế [2].
Tính năng chung của các hệ thống dạng này là phát
hiện phương tiện giao thông. Một số hệ thống có thêm
khả năng phân loại phương tiện, chẳng hạn thành xe
máy, xe đạp, ô tô con, ô tô tải v.v., cũng như bám
phương tiện để xác định chuyển động đi thẳng hay rẽ
[4,7]. Trong các hệ thống dạng này, phần quan trọng
nhất là phần phát hiện phương tiện giao thông. Cách
tiếp cận chung cho phát hiện phương tiện giao thông là
phát hiện vùng chuyển động, kết hợp với phân loại
vùng chuyển động thành các loại phương tiện khác
nhau. Nhiều phương pháp phát hiện vùng chuyển động
được sử dụng như dùng moving map [7], sử dụng mô
hình Gausian Mixture Model (GMM) để sinh hình nền
[4], hay kết hợp GMM sinh hình nền với xóa bóng cho
trường hợp trời nắng [5]. Vấn đề lớn nhất khi phát
hiện vùng chuyển động là giảm ảnh hưởng của điều
kiện chiếu sáng và nhiễu vùng nền. Một số giải pháp
đã được đề xuất cho vấn đề này như sử dụng ngưỡng
động có khả năng thay đổi theo ánh sáng [3]. Sau khi
tách được vùng chuyển động, bước tiếp theo là phân
loại vùng chuyển động thành các loại phương tiện giao
thông hoặc không phải phương tiện (do nhiễu).
Phương pháp thường được dùng cho bước này là sử
dụng mô hình 3D dựng sẵn của các loại xe sau đó so
khớp với hình viền vùng chuyển động đã phát hiện
trong bước trước [4,7]. Một phương pháp khác cũng
được sử dụng là dùng các dạng đặc trưng ảnh thông
dụng như HOG kết hợp với thuật toán phân loại như
SVM [5]. Khó khăn khi sử dụng những phương pháp
này là không thể phân biệt các phương tiện giao thông
đi theo nhóm gần nhau. Giải pháp cho vấn đề này
được giải quyết trong [6] bằng cách sử dụng đồ thị
AND-OR. Giải pháp được chọn trong phương pháp
của chúng tôi cho phép tránh các khó khăn thường gặp
trong giải pháp phát hiện vùng chuyển động do các
phương tiện di chuyển gần nhau gây chồng lấn trong
các khung hình, do vậy thích hợp hơn với điều kiện tại
Việt Nam.
Nội dung nghiên cứu được trình bày lần lượt theo
trình tự sau: mục 3 trình bày đặc điểm bố trí hệ thống
camera thu nhận hình ảnh và yêu cầu cụ thể của bài
toán; mục 4 đề xuất giải pháp cải tiến đặc trưng mô tả
đối tượng hình ảnh cần phát hiện; mục 5 mô tả giải
pháp bám và gán nhãn đối tượng; mục 6 tổng hợp một
số kết quả thực nghiệm và đánh giá.
III. ĐẶC ĐIỂM HÌNH ẢNH ĐỐI TƢỢNG
Xuất phát từ nhu cầu thực tế, nghiên cứu của chúng
tôi được xây dựng trên cơ sở hạ tầng hệ thống camera
gắn tại các nút giao thông tại Tp. Hồ Chí Minh. Các
camera được bố trí ở độ cao 618 cm so với mặt đường,
các ngã tư là những vị trí ưu tiên tập trung thống kê
lưu lượng giao thông. Tại đó, có 1 hoặc 2 camera đặt ở
một góc của ngã tư, đảm bảo cho phép quan sát toàn
bộ các hướng di chuyển tới phía camera, các camera
đặt nghiêng góc 20 độ so với phương ngang.
Hình 1. Bố trí camera trên đường Cộng hòa
Bài toán đặt ra cho nhóm nghiên cứu là thống kê
các phương tiện giao thông di chuyển theo các hướng
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 57 -
khác nhau, từ đó tổng hợp làm cơ sở dự báo vận tốc,
lưu lượng giao thông trong thành phố.
Hình 2. Hình ảnh thu được từ camera tại ngã tư
Pasteur - Lý Tự Trọng
Do đặc điểm bố trí thiết bị đã có, hình ảnh các đối
tượng sẽ gồm 2 dạng cơ bản: dạng đi thẳng trực diện
với camera và dạng đi hướng tới camera nhưng lệch
về bên sườn trái.
IV. XÂY DỰNG BỘ MÔ TẢ ĐỐI TƢỢNG
Trong các dạng mô tả đặc trưng đối tượng phục vụ
cho các giải pháp phát hiện nhanh đối tượng trong ảnh
hiện đa phần hướng tới các bộ mô tả đặc trưng
(Descriptor) phục vụ cho kỹ thuật cửa sổ trượt như
Haar-like [8], HOG [12], LBP [11]Để đảm bảo các
tính toán không quá phức tạp và cho phép chạy đồng
thời nhiều bộ tìm kiếm (Detector) trên cùng một ảnh
tĩnh, nhóm nghiên cứu đã cải tiến bộ mô tả đặc trưng
LBP.
Trong đó, bộ mô tả đặc trưng LBP phản ảnh mối
tương quan về mức xám giữa mỗi điểm ảnh (hoặc một
vùng ảnh) với các điểm ảnh (hoặc vùng ảnh) lân cận.
Thực chất việc áp dụng bộ mô tả này cho phép ánh xạ
ảnh đối tượng sang một ảnh khác có khả năng bất biến
cao hơn trước các thay đổi về mức sáng, cũng như một
số biến dạng hình học [11].
Trong nghiên cứu [10] việc áp dụng LBP cho việc
nhận dạng một đối tượng hình ảnh được tiến hành theo
trình tự sau:
Bƣớc 1. Chia cửa sổ vùng ảnh cần xem xét thành
các ô vuông.
Bƣớc 2. Tại mỗi ô, so sánh từng điểm ảnh với 8
điểm ảnh khác xung quanh nó (số lượng điểm ảnh lân
cận có thể thay như trên Hình 3).
Hình 3. LBP và 3 kiểu sử dụng điểm ảnh lân cận
Bƣớc 3. Quy đổi kết quả so sánh thành chuỗi bit
thông tin đại diện (xem Hình 4).
Hình 4. Quy đổi kết quả thành chuỗi bit
Bƣớc 4. Tính lược đồ histogram các giá trị đại diện
vừa tính được ở bước 3.
Bƣớc 5. Chuẩn hóa histogram về khoảng giá trị
quy định trước.
Bƣớc 6. Tập hợp tất cả histogram của tất cả các ô
trong cửa sổ tạo thành một vector đặc trưng của cửa sổ
đó.
Hình 5. Cách xác định Vector đặc trưng LBP
Bƣớc 7. Sử dụng cho các thuật toán học máy, mô
hình cascade với thuật toán huấn luyện AdaBoost để
phân biệt kết quả thu được ở bước 6. Chi tiết của bước
này được mô tả trong [8].
Trong toàn bộ các bước thực hiện trên, việc xác
định chuỗi bit quy đổi dựa trên lựa chọn các so sánh
chênh lệch mức xám của các điểm ảnh ở bước 2,3 có ý
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 58 -
nghĩa hết sức quan trọng. Lưu ý rằng, đặc trưng LBP
này có thể được mở rộng ra về kích thước cũng như số
lượng các điểm ảnh lân cận. Ví dụ như đặc trưng
LBP4,1 sử dụng 4 điểm ảnh lân cận, đặc trưng
LBP16,2 sử dụng 16 điểm ảnh lân cận với bán kính là
2. Tổng quát hóa thì đặc trưng LBPP,R sẽ sử dụng P
điểm ảnh lân cận tương đương với vùng không gian có
bán kính điểm ảnh là R, vùng không gian đó bao gồm
tập các điểm ảnh lân cận tạo thành một hình tròn. Từ
đặc trưng LBPP,R có thể tạo ra được 2P giá trị đầu ra,
tương ứng với 2P pattern nhị phân biểu diễn bởi P
điểm ảnh trong tập các điểm ảnh lân cận. Từ đó có thể
thấy mỗi đặc trưng LBP có thể mang rất nhiều thông
tin, hoàn toàn có thể sử dụng một tập con trong 2P
pattern để có thể mô tả thông tin về các ảnh. Tuy nhiên
do các điểm ảnh nằm gần nhau khi tính toán đặc trưng
LBP có thể dẫn đến việc mối quan hệ giữa các điểm
ảnh lân cận nhau được xác định lại để đưa vào thông
tin các chuỗi thông tin, do vậy việc tối ưu hóa lượng
thông tin này sẽ làm tăng khả năng mô tả đối tượng
hơn. Cụ thể, chúng tôi nhận thấy với cách trích chọn
đặc trưng LBP hiện tại khi tính toán tại hai điểm ảnh
sát nhau thì mối quan hệ giữa chúng sẽ được tính lại 2
lần (xem Hình 6).
Hình 6. Quan hệ giữa 2 điểm C1, C2 được xác định
2 lần
Vì thế, trong nghiên cứu này chúng tôi đề xuất cải
tiến cách thức mô tả quan hệ các điểm lân cận để trích
chọn đặc trưng dạng LBP bằng cách vẫn lựa chọn 8 so
sánh tương quan giữa các điểm ảnh nhưng chỉ có 4 so
sánh với điểm ảnh trung tâm C, còn lại là quan hệ so
sánh giữa chính các điểm lân cận của C. Việc lựa chọn
này cần tuân theo nguyên tắc không tồn tại 2 quan hệ
so sánh nào mà cạnh nối biểu thị quan hệ giữa các
điểm ảnh song song với nhau. Ví dụ nếu trong hình 7
thì quan hệ giữa C-g0 với quan hệ g1-g3 sẽ có biểu diễn
song song với nhau, và vì thế ta chỉ chọn một trong hai
quan hệ này.
Hình 7. Mô tả quan hệ giữa các điểm ảnh sử dụng
cho tính toán đặc trưng LBP
Với cách mô tả này giá trị thay thế cho mức xám
tại điểm ảnh được minh họa như trên Hình 8.
Hình 8. Cải tiến cách tính giá trị điểm ảnh trong
mô tả đặc trưng LBP
Với việc sử dụng bộ mô tả này khi xem xét việc
phản ánh thông tin về mối quan hệ giữa các điểm ảnh
lân cận trên toàn bộ vùng ảnh sẽ nhận thấy không tồn
tại các quan hệ trùng lặp và không những thế bổ sung
thêm các quan hệ. Trong hình 9a, 9b nếu chỉ tách xem
xét mối quan hệ giữa 9 điểm ảnh C1, C2, C9 thì trong
mô tả 9a các quan hệ đều bị xét lại hai lần, trong khi
đó tại 9b chỉ sử dụng 1 lần ngoài ra bổ sung thêm các
quan hệ C1-C6; C1-C8; C1-C9; C2-C7; C3-C4; C3-C8; C4-
C9; C6-C7.
Hình 9.a. Mối quan hệ giữa các điểm ảnh được sử
dụng trong bộ mô tả truyền thống
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 59 -
Hình 9.b. Mối quan hệ giữa các điểm ảnh được sử
dụng trong bộ mô tả cải tiến
V. CÁC KỸ THUẬT BÁM ĐỐI TƢỢNG
Sau khi có được bộ dò tìm đối tượng, để thống kê
được số lượng các phương tiện tham gia giao thông
trong một đoạn video cần thực hiện bám đối tượng và
xác định được các trường hợp: xuất hiện đối tượng
mới, đối tượng rời khỏi thị trường của camera, xác
định liên hệ giữa các đối tượng của hai khung hình
liên tiếp.Trong nghiên cứu này sử dụng thuật toán
OpticalFlow [14] để bám chuyển động và thuật toán
Hungarian [13] để tiến hành gán nhãn các đối tượng ở
hai khung hình liên tiếp. Các bước tiến hành như sau:
Bƣớc 1. Phát hiện đối tượng ở khung hình i+1 bằng
các phương pháp nhận dạng sử dụng bộ mô tả đặc
trưng trình bày ở mục IV.
Bƣớc 2. Tính toán khoảng cách Euclid giữa các đối
tượng ở khung hình i và i+1 với giả thiết chúng cùng
nằm trong một mặt phẳng tọa độ. Sau đó, sử dụng
thuật toán Hungarian để gán từng cặp.
Bƣớc 3. Với các đối tượng ở khung hình i mà
không được gán với đối tượng nào ở khung hình i+1
thì phải dự đoán vị trí mới của chúng bằng phương
pháp OpticalFlow.
Bƣớc 4. Với các đối tượng ở khung hình i+1 mà
không được gán với đối tượng nào ở khung hình I thì
đó là các đối tượng mới xuất hiện. Thông tin của các
đối tượng này sẽ được sử dụng để xác định tiếp vị trí
của chúng ở các khung hình tiếp theo.
Hình 10. Mô tả quá trình bám và gán nhãn đối tượng
V. KẾT QUẢ THỰC NGHIỆM
Để đánh giá hiệu năng của thuật toán đề xuất nhóm
nghiên cứu đã tiến hành thử nghiệm với cả hai loại đối
tượng là xe máy và xe ô tô trong cả điều kiện ánh sáng
ban ngày và ban đêm, đồng thời với mỗi phương tiện
giao thông chúng tôi tiếp tục phân loại theo hướng
chuyển động và xây dựng bộ đặc trưng cho từng loại
riêng biệt.
Các mẫu huấn luyện được thu thập theo nhóm
phương tiện: xe máy, xe ô tô (gồm cả con, xe buýt và
xe bán tải), thời gian (ban ngày, tối) và hướng di
chuyển (ngang, dọc), mỗi nhóm khoảng 6000 mẫu
(xem Hình 11, 12). Hình ảnh được thu từ các camera
đặt trực tiếp trên đường, các camera đều thuộc dòng IP
và sử dụng đồng nhất loại Messoa Model: NCR878-
HP5-MES, tốc độ thu nhận hình ảnh 30 hình/giây. Đối
với các loại xe ô tô chúng tôi cùng lựa chọn vùng đầu
xe để huấn luyện chung cho một bộ nhận dạng.
Sau đó tiến hành huấn luyện bằng thuật toán
Adaboost sử dụng bộ công cụ OpenCV 2.4.6.
Để đánh giá kết quả của việc nhận dạng đối tượng
thì có hai tiêu chí được sử dụng là độ chính xác và độ
nhạy. Độ chính xác được xác định bởi tỷ lệ nhận dạng
đúng trong tổng số những đối tượng đã nhận dạng
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 60 -
được, trong khi đó độ nhạy liên quan đến tỷ lệ nhận
dạng đúng trong tổng số đối tượng thực tế.
Hình 11. Mẫu huấn luyện xe máy
Hình 12. Mẫu huấn luyện xe ô tô
Kết quả thực nghiệm trên tập ảnh tĩnh (là ảnh được
tách ra từ các video thu được từ các camera tại các
thời điểm khác nhau) gồm 1249 ảnh chụp buổi sáng;
1076 ảnh chụp buổi trưa; 3063 ảnh tối, với ba loại đặc
trưng: đặc trưng Haar như được sử dụng trong [7], đặc
trưng LBP nguyên bản [9], và đặc trưng LBP cải tiến
được tóm tắt trong Bảng 1.
Bảng 1. Kết quả phát hiện đối tượng trên tập ảnh tĩnh
Kết quả trong Bảng 1 cho thấy đặc trưng LBP cải
tiến cho kết quả với độ nhạy gần tương đương với các
đặc trưng Haar, LBP truyền thống, nhưng có độ chính
xác vượt trội trong đa số trường hợp. Chẳng hạn, độ
chính xác khi phát hiện ô tô vào buổi sáng khi dùng
Haar, LBP, và LBP cải tiến lần lượt là 87.39, 89.66, và
94.11. Tức là cải tiến đề xuất cho phép tăng độ chính
xác tới gần 5%.
Kết quả trong Bảng 1 cũng cho thấy, trong khi độ
chính xác đạt trên 90% thì độ nhạy tương đối thấp,
nhiều trường hợp xuống dưới 60%. Điều này dẫn tới
việc thống kê lưu lượng giao thông sẽ thiếu chính xác,
ví dụ, với độ nhạy khoảng 70%, độ chính xác 90%
(trên 70% tìm được) ta chỉ có thể đếm được đúng
khoảng 63% (0.63=0.7x0.9) số lượng phương tiện
thực tế (kể cả trong trường hợp không có nhầm lẫn vị
trí giữa các đối tượng ở các khung hình khác nhau).
Tuy nhiên, để tăng độ nhạy đa phần chúng ta sẽ cần
điều chỉnh tham số huấn luyện và phải giảm độ chính
xác. Do đó chúng tôi kết hợp thêm giải pháp bám đối
tượng như đã đề xuất ở mục V để tăng độ tin cậy của
hệ thống khi thống kê phương tiện giao thông. Về thực
chất, việc bám đối tượng cho phép kết hợp kết quả
phát hiện đối tượng từ nhiều khung hình để bổ sung
thêm thông tin còn thiếu. Trong trường hợp phương
tiện bị bỏ sót trong một khung hình thì vẫn có khả
năng được phát hiện bổ sung nhờ bám từ các khung
hình lân cận.
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 61 -
Chúng tôi cũng tiếp tục áp dụng đặc trưng LBP cải
tiến cho bài toán thống kê phương tiện bằng cách so
sánh kết quả đếm của người với kết quả của máy tính,
dữ liệu sử dụng trong nghiên cứu này được trích ra từ
các video thu nhận ngày 23/5/2014 là ngày thứ 6 có
mật độ giao thông tương đối đông so với các ngày
khác. Kết quả cụ thể được tóm tắt trong Bảng 2, trong
đó chúng tôi sử dụng khái niệm độ tin cậy, xác định
dựa trên phần trăm sai lệch giữa kết quả thống kê do
máy tính đưa ra và kết quả khảo sát trực tiếp bởi con
người.
Kết quả cho thấy việc thống kê lưu lượng xe ô tô
tương đối tốt, với xe máy do quá trình gán nhãn và
bám đối tượng đặc biệt khi các xe di chuyển cạnh nhau
đôi lúc còn gặp khó khăn. Kết quả tại Bảng 2 cũng cho
thấy việc thống kê xe máy vào ban ngày có xu hướng
tốt hơn ban đêm, nhưng ô tô thì ngược lại, điều này
nảy sinh bởi lý do vào buổi tối việc bám chuyển động
của xe máy gặp nhiều khó khăn hơn do đặc điểm thuật
toán OpticalFlow sử dụng nhiều thông tin về cường độ
sáng các điểm keypoint ở đầu xe máy, trong khi đó, ô
tô có hai đèn pha nên khoảng sáng giữa hai đèn khá
thuận tiện cho việc lựa chọn keypoint. Trong các
nghiên cứu tiếp theo chúng tôi sẽ tìm cách cải tiến vấn
đề này.
Bảng 2. Thống kê số lượng phương tiện trên video
LỜI CẢM ƠN
Kết quả nghiên cứu được tài trợ bởi Công ty FPT
Software JSC trong khuôn khổ chương trình nghiên
cứu “Xây dựng Hệ thống thị giác máy tính hỗ trợ
thống kê phương tiện giao thông theo thời gian thực”.
Ngoài việc thử nghiệm tại ngã tư Pasteur-Lý Tự
Trọng, tuyến đường 2 chiều Cộng Hòa, hệ thống cũng
đang được thử nghiệm tại một số ngã tư tại Bangkok
Thái Lan, trong tương lai nhóm nghiên cứu sẽ tổng
hợp các kết quả thống kê bằng hình ảnh với các kết
quả thu được do hệ thống định vị GPS và thông tin di
chuyển gắn trên các phương tiện giao thông như xe
Bus, Taxi để hình thành bản đồ lưu lượng giao thông,
ngoài ra tiếp tục bổ sung tập dữ liệu huấn luyện cũng
như hiệu chỉnh thuật toán để đảm bảo tính bền vững
của hệ thống trong các điều kiện thời tiết khác nhau.
TÀI LIỆU THAM KHẢO
[1] LÊ HÙNG LÂN, “ Nghiên cứu thiết kế, chế tạo các
thiết bị, phương tiện và hệ thống tự động kiểm tra, giám
sát, điều hành phục vụ cho an toàn giao thông đường
bộ”, Báo cáo Đề tài Nghiên cứu Khoa học và Phát
triển công nghệ cấp nhà nước (2008) mã số:
KC.03.05/06-10.
[2] N. BUCH, S. VELASTIN, AND J. ORWELL, “A
review of computer vision techniques for the analysis of
urban traffic” Intell. Transp. Syst. IEEoE Trans., vol.
12, no. 3, pp. 920–939, 2011.
[3] J D. GANGODKAR, P. KUMAR, AND A. MITTAL,
“Robust Segmentation of Moving Vehicles Under
Complex Outdoor Conditions”, Intell. Transp. Syst.
IEEE Trans., vol. 13, no. 4, pp. 1738–1752, Dec. 2012.
[4] N. BUCH, J. ORWELL, AND S. A. VELASTIN,
“Detection and classification of vehicles for urban
traffic scenes”, 5th Int. Conf. Vis. Inf. Eng. (VIE 2008),
pp. 182–187, 2008.
[5] Z. CHEN, T. ELLIS, AND S. A. VELASTIN, “Vehicle
detection, tracking and classification in urban traffic,”
in Intelligent Transportation Systems (ITSC), 2012
15th International IEEE Conference on, 2012, pp. 951–
956..
[6] Y. LI, B. LI, B. TIAN, AND Q. YAO, “Vehicle
Detection Based on the and - or Graph for Congested
Traffic Conditions,” Intell. Transp. Syst. IEEE Trans.,
vol. 14, no. 2, pp. 984–993, Jun. 2013.
Các công trình nghiên cứu, phát triển và ứng dụng CNTT-TT Tập V-1, Số 15 (35), tháng 6/2016
- 62 -
[7] MESSELODI, C. MODENA, AND M. ZANIN, “A
computer vision system for the detection and
classification of vehicles at urban road intersections,”
Pattern Anal. Appl., vol. 8, pp. 17–31, 2005.
[8] P. VIOLA AND M. JONES, “Robust Real-time Object
Detection,” in International Journal of Computer
Vision, 2001.
[9] M. HEIKKILA AND M. PIETIKAINEN, “A texture-
based method for modeling the background and
detecting moving objects,” Pattern Anal. Mach. Intell.
IEEE Trans., vol. 28, no. 4, pp. 657–662, Apr. 2006.
[10] ZHANG, LUN, ET AL. "Face detection based on
multi-block lbp representation”. Advances in
Biometrics. Springer Berlin Heidelberg, 2007. 11-18.
[11] T. OJALA, M. PIETIKAINEN, AND T. MAENPAA,
"Multiresolution gray-scale and rotation invariant
texture classification with local binary patterns", IEEE
Transactions on Pattern Analysis and Machine
Intelligence, vol. 24, pp. 971-987, 2002.
[12] N. DALAL AND B. TRIGGS, “Histograms of oriented
gradients for human detection,” in Proc IEEE Int.
Conf. on Computer Vision and Pattern Recognition,
2005, vol. 1, pp. 886-893.
[13] H.W. KUHN, “On the origin of the Hungarian
Method”, History of mathematical programming; a
collection of personal reminiscences, North Holland,
Amsterdam, pp. 77–81, 1991.
[14] C. TOMASI AND T. KANADE, "Detection and
Tracking of Point Features". Pattern
Recognition 37, pp. 165–168, 2004.
Nhận bài ngày: 05/05/2015
SƠ LƢỢC VỀ TÁC GIẢ
TRẦN NGUYÊN NGỌC
Tốt nghiệp ĐH năm 2005, bảo vệ
luận án tiến sỹ về “Phân tích hệ
thống, điều khiển và xử lý thông
tin” năm 2007 tại Rostov – LB
Nga.
Hiện công tác tại khoa CNTT
Học viện Kỹ thuật Quân sự.
Hướng nghiên cứu: xử lý ảnh, học máy, an toàn thông
tin. Email: [email protected]
HOÀNG ANH TUẤN
Tốt nghiệp Trường ĐH Bách
khoa Hà Nội năm 2007 chuyên
ngành Toán-Tin ứng dụng.
Hiện đang công tác tại TT nghiên
cứu và Phát triển sản phẩm của
công ty FPT- Software.
Hướng nghiên cứu: Học máy
và xử lý ảnh. Email: [email protected].
TỪ MINH PHƢƠNG
Tốt nghiệp ĐH tại trường Bách
khoa Taskent năm 1993, bảo vệ
tiến sỹ tại Viện hàn lâm khoa học
Uzbekistant, Taskent, năm 1995.
Được phong chức danh Phó giáo
sư năm 2007.
Từ năm 2000 đến nay công
tác tại khoa CNTT, Học viện
Công nghệ Bưu chính Viễn thông. Hiện là Trưởng
khoa, khoa CNTT Học viện Công nghệ Bưu chính
Viễn thông.
Hướng nghiên cứu: các ứng dụng của học máy, tin
sinh học. E-mail: [email protected]

File đính kèm:

giai_phap_thong_ke_phuong_tien_giao_thong_su_dung_camera.pdf