Ngày nay, sự phát triển của công nghệ thông tin đã xâm nhập vào hầu
hết các mặt của đời sống xã hội với những ứng dụng rộng rãi hỗ trợ con người
trên nhiều lĩnh vực, trong đó có lĩnh vực về an toàn an ninh, chống xâm nhập.
Có nhiều phương pháp nhằm đảm bảo an ninh sao cho hiệu quả cao, trong đó
có phương pháp áp dụng các hệ thống camera để quan sát sự chuyển động của
các đối tượng trong khu vực. Ngày nay với sự tiến bộ vượt bậc của khoa học,
ta có thể xây dựng một hệ thống cảnh bảo tự động phát hiện đối tượng mà
không cần có người phải trực tiếp theo dõi camera, điều này giúp cho con người
giảm thiểu được thời gian và sức lực đồng thời vẫn cho một kết quả chính xác.
Có nhiều phương pháp phát hiện đối tượng trong vùng quan sát của camera như
dựa vào phần cứng và dựa vào các kỹ thuật xử lý ảnh.
Mục tiêu của đề tài tìm hiểu và hệ thống hóa một số kỹ thuật phát hiện
bất thường dựa vào camera. Đồng thời nghiên cứu và thực nghiệm chương trình
dựa vào một trong những kỹ thuật đã hệ thống hóa.
Nội dung luận văn bao gồm phần mở đầu, phần kết luận và ba chương
với bố cục nội dung như sau:
Chương 1. Khái quát về xử lý ảnh, xử lý video và bài toán phát hiện
bất thường
Trình bày khái quá về xử lý ảnh và bài toán phát hiện bất thường dựa vào
sự sai khác trong vùng quan sát được của camera.
Chương 2. Một số kỹ thuật trừ ảnh trong phát hiện bất thường
Chương này hệ thống hóa một số kỹ thuật trừ ảnh, kỹ thuật trừ nền dùng
cho việc phát hiện vùng khác biệt hay bất thường.
Chương 3. Chương trình thử nghiệm
Phần mềm đầu vào ảnh, trích xuất từ video quan sát được trong vùng giới
nghiêm.
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN VIỆT BẮC
NGHIÊN CỨU MỘT SỐ KỸ THUẬT
PHÁT HIỆN BẤT THƯỜNG PHỤC VỤ CHO GIÁM SÁT
KHU VỰC GIỚI NGHIÊM CỦA TRƯỜNG VĂN HÓA I
Chuyên ngành: Khoa học máy tính
Mã số: 8 48 01 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Giáo viên hướng dẫn: PGS. TS Đỗ Năng Toàn
THÁI NGUYÊN - 2020
i
LỜI CAM ĐOAN
Tôi xin cam đoan: Luận văn này là công trình nghiên cứu thật sự của cá
nhân, được thực hiện dưới sự hướng dẫn khoa học của PGS.TS. Đỗ Năng Toàn.
Các số liệu và thông tin thứ cấp sử dụng trong luận văn được trích dẫn rõ ràng.
Tôi hoàn toàn chịu trách nhiệm về tính xác thực và nguyên bản của luận văn.
Học viên
Nguyễn Việt Bắc
ii
MỤC LỤC
LỜI CAM ĐOAN ............................................................................................... i
MỤC LỤC .......................................................................................................... ii
DANH MỤC CÁC BẢNG................................................................................ iv
DANH MỤC CÁC HÌNH .................................................................................. v
PHẦN MỞ ĐẦU ............................................................................................... 1
Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH, XỬ LÝ VIDEO VÀ BÀI TOÁN
PHÁT HIỆN BẤT THƯỜNG ......................................................................... 2
1.1. Khái quát về xử lý ảnh ................................................................................ 2
1.1.1. Các khái niệm cơ bản ............................................................................... 2
1.1.2. Các bước xử lý ảnh số .............................................................................. 4
1.2. Khái quát về Video.................................................................................... 17
1.2.1. Giới thiệu ................................................................................................ 17
1.2.2. Một số thuộc tính đặc trưng của video ................................................... 18
1.2.3 Các dạng chuẩn và kiến trúc của Video .................................................. 20
1.3. Bài toán phát hiện bất thường ................................................................... 26
1.4. Phân tích yêu cầu bài toán ......................................................................... 27
Kết luận chương 1 ............................................................................................ 28
Chương 2: MỘT SỐ KỸ THUẬT PHÁT HIỆN BẤT THƯỜNG............. 29
2.1. Phát hiện bất thường dựa vào kỹ thuật trừ ảnh ......................................... 29
2.1.1. Kỹ thuật trừ ảnh dựa vào điểm ảnh ........................................................ 30
2.1.2. Trừ ảnh phân khối .................................................................................. 31
2.1.3. Phương pháp biểu đồ.............................................................................. 33
2.1.4. Phương pháp thống kê............................................................................ 37
2.1.5. Trừ ảnh dựa vào đặc trưng ..................................................................... 38
2.2. Phát hiện bất thường dựa vào kỹ thuật trừ nền ......................................... 39
2.2.1. Không gian màu (Color space) .............................................................. 39
2.2.2 Mô hình nền (Background modeling) ..................................................... 40
2.2.3. Lựa chọn ngưỡng (Threshold selection) ................................................ 41
2.2.4. Thao tác trừ (Subtraction operation) ...................................................... 43
iii
Kết luận chương 2 ............................................................................................ 45
Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM .......................................... 46
3.1. Phân tích lựa chọn công cụ ....................................................................... 46
3.3. Một số kết quả của chương trình ............................................................... 50
PHẦN KẾT LUẬN ......................................................................................... 53
TÀI LIỆU THAM KHẢO ............................................................................. 54
iv
DANH MỤC CÁC BẢNG
Bảng 1.1.
Các tiêu chuẩn của Video số ....................................................... 20
Bảng 1.2.
Mô tả kiểu CIF và QCIF ............................................................. 21
Bảng 1.3.
Một số ràng buộc của MPEG-1 .................................................. 23
Bảng 1.4.
Các tham số có trong MB cơ sở.................................................. 25
v
DANH MỤC CÁC HÌNH
Hình 1.1. Quá trình xử lý ảnh................................................................. 2
Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh ..................... 4
Hình 1.3. Ảnh thu nhận và ảnh mong muốn .......................................... 5
Hình 1.4. Dãn độ tương phản ............................................................... 10
Hình 1.5. Quá trình hiển thị và chỉnh sửa, lưu trữ ảnh thông qua DIB 16
Hình 1.6. Sự chuyển đổi giữa các mô hình biểu diễn ảnh ................... 17
Hình 1.7: Cấu trúc phân cấp của video ................................................ 17
Hình 1.8: Minh họa về việc chuyển đổi giữa các lia ............................ 18
Hình 1.9: Các ảnh khác nhau nhưng có cùng biểu đồ màu .................. 18
Hình 1.10: Các ảnh khác nhau nhưng có cùng biểu đồ màu .................. 19
Hình 1.11. MacroBlock .......................................................................... 21
Hình 1.12. Chuỗi các khung của H. 261 ................................................ 22
Hình 1.13. Nhóm ảnh trong MPEG-1 .................................................... 24
Hình 2.1: Các cửa sổ cơ sở trong thuật toán so sánh thực ................... 33
Hình 2.2: So sánh biểu đồ giữa hai ảnh ................................................ 34
Hình 2.3: Mẫu vector cho các di chuyển camera. ................................ 38
Hình 2.4: Các không gian màu và phân lớp điểm ảnh của nó (a) hệ tọa
độ RGB, (b) hệ tọa độ RGB chuẩn hóa ................................ 40
Hình 2.5: Sơ đồ thuật giải kỹ thuật trừ nền ......................................... 43
Hình 2.6: Sự biến đổi của điểm ảnh i trong mỗi không gian màu (a) hệ
tọa độ RGB, (b) hệ tọa độ RGB chuẩn hóa .......................... 45
Hình 3.1: Sơ đồ thuật giải..................................................................... 47
Hình 3.2: Sơ đồ hoạt động của chương trình ....................................... 50
1
PHẦN MỞ ĐẦU
Ngày nay, sự phát triển của công nghệ thông tin đã xâm nhập vào hầu
hết các mặt của đời sống xã hội với những ứng dụng rộng rãi hỗ trợ con người
trên nhiều lĩnh vực, trong đó có lĩnh vực về an toàn an ninh, chống xâm nhập.
Có nhiều phương pháp nhằm đảm bảo an ninh sao cho hiệu quả cao, trong đó
có phương pháp áp dụng các hệ thống camera để quan sát sự chuyển động của
các đối tượng trong khu vực. Ngày nay với sự tiến bộ vượt bậc của khoa học,
ta có thể xây dựng một hệ thống cảnh bảo tự động phát hiện đối tượng mà
không cần có người phải trực tiếp theo dõi camera, điều này giúp cho con người
giảm thiểu được thời gian và sức lực đồng thời vẫn cho một kết quả chính xác.
Có nhiều phương pháp phát hiện đối tượng trong vùng quan sát của camera như
dựa vào phần cứng và dựa vào các kỹ thuật xử lý ảnh.
Mục tiêu của đề tài tìm hiểu và hệ thống hóa một số kỹ thuật phát hiện
bất thường dựa vào camera. Đồng thời nghiên cứu và thực nghiệm chương trình
dựa vào một trong những kỹ thuật đã hệ thống hóa.
Nội dung luận văn bao gồm phần mở đầu, phần kết luận và ba chương
với bố cục nội dung như sau:
Chương 1. Khái quát về xử lý ảnh, xử lý video và bài toán phát hiện
bất thường
Trình bày khái quá về xử lý ảnh và bài toán phát hiện bất thường dựa vào
sự sai khác trong vùng quan sát được của camera.
Chương 2. Một số kỹ thuật trừ ảnh trong phát hiện bất thường
Chương này hệ thống hóa một số kỹ thuật trừ ảnh, kỹ thuật trừ nền dùng
cho việc phát hiện vùng khác biệt hay bất thường.
Chương 3. Chương trình thử nghiệm
Phần mềm đầu vào ảnh, trích xuất từ video quan sát được trong vùng giới
nghiêm.
2
Chương 1
KHÁI QUÁT VỀ XỬ LÝ ẢNH, XỬ LÝ VIDEO VÀ BÀI TOÁN
PHÁT HIỆN BẤT THƯỜNG
1.1. Khái quát về xử lý ảnh
1.1.1. Các khái niệm cơ bản
1.1.1.1. Xử lý ảnh
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Tuy là một
ngành khoa học mới mẻ so với nhiều ngành khoa học khác, nhưng tốc độ phát
triển rất nhanh, được rất nhiều các viện nghiên cứu, ứng dụng.
Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý
ảnh và đồ hoạ đã phát triển một cách mạnh mẽ và có nhiều ứng dụng được áp
dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan trọng trong
tương tác người - máy.
Mục đích của xử lý ảnh là nâng cao chất lượng ảnh phục vụ con người
và xử lý ảnh dữ liệu dạng hình ảnh để máy tính có thể hiểu được từ đó đưa ra
những quyết định cần thiết.
Ảnh
XỬ LÝ
ẢNH
Ảnh
“Tốt hơn”
Kết luận
Hình 1.1. Quá trình xử lý ảnh
Xử lý ảnh có nhiều ứng dụng trong đời sống như: nhận dạng ảnh, vệ tinh
dự báo thời tiết, viễn thám, ảnh y tế, khoa học hình sự, điện ảnh…
1.1.1.2. Điểm ảnh
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám
hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
3
xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được
gọi là một phần tử ảnh.
1.1.1.3. Ảnh
Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô tả ảnh
gần giống với ảnh thật.
Ảnh được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ
- được coi là những nhân tố của bức ảnh và thường được biết dưới tên gọi là
điểm ảnh. Máy tính hay máy in sử dụng những ô vuông nhỏ này để hiển thị hay
in ra bức ảnh. Để làm được điều đó máy tính hay máy in chia màn hình, trang
giấy thành một mạng lưới chứa các ô vuông, sau đó sử dụng các giá trị chứa
trong file ảnh để định ra mầu sắc, độ sáng tối của từng pixel trong mạng lưới
đó, đó là cơ sở để ảnh số được hình thành. Việc kiểm soát, định ra địa chỉ theo
mạng lưới như trên được gọi là bit mapping và ảnh số còn được gọi là ảnh
bitmap.
1.1.1.4. Mức xám của ảnh
Định nghĩa: Mức xám (grey level) của điểm ảnh là cường độ sáng của
nó được gán bằng giá trị số tại điểm đó.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức
256 là mức phổ dụng bởi vì trong kỹ thuật máy tính dùng 1 byte (8 bit) để biểu
diễn mức xám: Mức xám dùng một byte biểu diễn: 28=256 mức, tức là từ giá
trị 0 đến 255).
Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với
mức xám ở các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có hai mức đen trắng phân biệt tức dùng một bit
mô tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ
có thể là 0 hoặc 1.
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo
nên thế giới màu, người ta thường dùng ba byte để mô tả mức màu, khi đó các
giá trị màu: 28*3 = 224 ≈ 16,7 triệu màu.
4
1.1.1.5. Độ phân giải của ảnh
Định nghĩa: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được
ấn định trên một ảnh số được hiển thị.
Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được chọn sao cho
mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích
hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và được phân bố theo
trục x và y trong không gian hai chiều.
Ví dụ: Độ phân giải của ảnh trên màn hình CGA (Color Graphic
Adapter) là một lưới điểm theo chiều ngang màn hình: 320 điểm chiều dọc ×
200 điểm ảnh (320×200). Rõ ràng, cùng màn hình CGA 12” ta nhận thấy mịn
hơn màn hình CGA 17” độ phân giải 320×200. Lý do: cùng một mật độ (độ
phân giải) nhưng diện tích màn hình rộng hơn thì độ mịn (liên tục của các điểm)
kém hơn.
1.1.2. Các bước xử lý ảnh số
Một hệ thống xử lý ảnh có sơ đồ tổng quát như sau:
Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
Sau đây sẽ trình bày một số kỹ thuật xử lý ảnh cần thiết phục vụ cho việc
cài đặt chương trình thử nghiệm (theo các bước trong hình 1. 2), còn các thành
phần khác sẽ được giới thiệu ở mức cơ bản.
1.1.2.1. Thu nhận ảnh
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận
này có thể cho ảnh đen trắng.
5
Các thiết bị thu nhận ảnh có hai loại chính ứng với hai loại ảnh thông
dụng Raster, Vector.
Các thiết bị thu nhận ảnh Raster thông thường là camera, các thiết bị thu
nhận ảnh thông thường Vector là sensor hoặc bàn số hoá Digitalizer hoặc được
chuyển đổi từ ảnh Raster.
Nhìn chung các hệ thống thu nhận ảnh thực hiện 1 quá trình:
Cảm biến: biến đổi năng lượng quang học thành năng lượng điện
Tổng hợp năng lượng điện thành ảnh
1.1.2.2. Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu và độ tương phản thấp nên cần đưa
vào bộ tiền xử lý (Image Processing) để nâng cao chất lượng. Chức năng chính
của bộ tiền xử lý là nắn chỉnh biến dạng, lọc nhiễu, chỉnh mức xám, nâng độ
tương phản để làm ảnh rõ hơn, nét hơn.
Các thuật toán triển khai việc nâng cao chất lượng ảnh hầu hết dựa trên
các kỹ thuật trong miền điểm, không gian và tần số. Toán tử điểm là phép biến
đổi đối với từng điểm ảnh đang xét, không liên quan đến các điểm lân cận khác,
trong khi đó, toán tử không gian sử dụng các điểm lân cận để quy chiếu tới
điểm ảnh đang xét. Một số phép biến đổi có tính toán phức tạp được chuyển
sang miền tần số để thực hiện, kết quả cuối cùng được chuyển trở lại miền
không gian nhờ các biến đổi ngược.
a) Nắn chỉnh biến dạng
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.
Ảnh thu nhận
Ảnh mong muốn
Hình 1.3. Ảnh thu nhận và ảnh mong muốn
6
Các nguyên nhân biến dạng do:
- Do camera, đầu thu ảnh chất lượng kém.
- Do môi trường, ánh sáng, hiện trường (scene), khí quyển, nhiễu xung.
- Do chất lượng.
Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường
được xây dựng trên tập các điểm điều khiển.
Giả sử (Pi, Pi’) với i = 1, n có n các tập điều khiển Tìm hàm f: Pi a f (Pi)
sao cho:
(1.1)
Giả sử ảnh bị biến đổi chỉ bao gồm: Tịnh tiến, quay, tỷ lệ, biến dạng bậc
nhất tuyến tính. Khi đó hàm f có dạng:
f (x, y) = (a1x + b1y + c1, a2x + b2y + c2)
(1.2)
Ta có:
Để cho φ → min
Giải hệ phương trình tuyến tính tìm được a1, b1, c1, tương tự tìm được a2,
b2, c; từ đó ta xác định được hàm f.
b) Lọc nhiễu
Thường ảnh thu nhận được có nhiễu nên cần phải loại bỏ nhiễu. Để tách
nhiễu (hay làm trơn nhiễu), người ta sử dụng các bộ lọc tuyến tính (lọc trung
bình, thông thấp) hay lọc phi tuyến (trung vị, giả trung vị, lọc đồng hình). Từ
bản chất của nhiễu (thường tương ứng với tần số cao) và từ cơ sở lý thuyết lọc
7
là: bộ lọc chỉ cho tín hiệu có tần số nào đó thông qua do đó, để lọc nhiễu người
ta thường dùng lọc thông thấp (theo quan điểm tần số không gian) hay lấy tổ
hợp tuyến tính để san bằng (lọc trung bình).
Trước khi xem xét chi tiết các kỹ thuật áp dụng, cần phân biệt các loại
nhiễu hay can thiệp trong quá trình xử lý ảnh. Trên thực tế tồn tại nhiều loại
nhiễu; tuy nhiên người ta thường xem xét ba loại nhiễu chính: nhiễu cộng, nhiễu
nhân và nhiễu xung:
Nhiễu cộng: Nhiễu cộng thường phân bố khắp ảnh. Nếu gọi ảnh quan
sát (ảnh thu được) là Xqs, ảnh gốc là Xgốc, nhiễu là η, ảnh thu được có thể biểu
diễn bởi: Xqs = Xgốc + η
Nhiễu nhân: Nhiễu nhân thường phân bố khắp ảnh và ảnh thu được sẽ
biểu diễn với công thức: Xqs = Xgốc * η
Nhiễu xung: Nhiễu xung thường gây đột biến tại một số điểm ảnh.
* Làm trơn nhiễu bằng lọc tuyến tính: lọc trung bình và lọc dải thông
thấp
Do có nhiều loại nhiễu can thiệp vào quá trình xử lý ảnh nên cần có nhiều
bộ lọc thích hợp. Với nhiễu cộng và nhiễu nhân ta dùng các bộ lọc thông thấp,
trung bình và lọc đồng hình (Homomorphie); với nhiễu xung ta dùng lọc trung
bị, giả trung vị, lọc ngoài (Outlier).
* Lọc trung bình không gian
Với lọc trung bình, mỗi điểm ảnh được thay thế bằng trung bình trọng số
của các điểm lân cận và được định nghĩa như sau:
(1.3)
Nếu trong kỹ thuật lọc trên, ta dùng các trọng số như nhau, phương trình
trên sẽ trở thành:
với: y(m, n): ảnh đầu vào, v(m, n): ảnh đầu ra; a(k, l): là cửa sổ lọc.
8
Với
và Nw là số điểm ảnh trong cửa sổ lọc W.
Lọc trung bình có trọng số chính là thực hiện chập ảnh đầu vào với nhân
chập H. Nhân chập H trong trường hợp này có dạng:
Trong lọc trung bình, thường người ta ưu tiên cho các hướng để bảo vệ
biên của ảnh khỏi bị mờ khi làm trơn ảnh. Các kiểu mặt nạ được sử dụng tùy
theo các trường hợp khác nhau. Các bộ lọc trên là bộ lọc tuyến tính theo nghĩa
là điểm ảnh ở tâm cửa sổ sẽ được thay bởi tổ hợp các điểm lân cận chập với
mặt nạ.
Giả sử đầu vào biểu diễn bởi ma trận I:
Ảnh số thu được bởi lọc trung bình Y=H⊗ I có dạng:
Một bộ lọc trung bình không gian khác cũng hay được sử dụng. Phương
trình của bộ lọc đó có dạng:
Y[m,n]= [X[m,n]+ {X[m,n]+X[m-1,n]+X[m+1,n]+
X[m,n-1]+X[m,n+1]}]
Ở đây, nhân chập H có kích thước 2x2 và mỗi điểm ảnh kết quả có giá
trị bằng trung bình cộng của nó với trung bình cộng của bốn lân cận gần nhất.
9
Lọc trung bình trọng số là một trường hợp riêng của lọc thông thấp.
* Lọc thông thấp
Lọc thông thấp thường được sử dụng để làm trơn nhiễu. Về nguyên lý
của bộ lọc thông thấp giống như đã trình bày trên. Trong kỹ thuật này người ta
hay dùng một số nhân chập có dạng sau:
Ta dễ dàng nhận thấy khi b =1, Hb chính là nhân chập Ht1 (lọc trung
bình). Để hiểu rõ hơn bản chát khử nhiễu cộng của các bộ lọc này, ta viết lại
phương trình thu nhận ảnh dưới dạng:
(1.4)
Trong đó η[m, n] là nhiễu cộng có phương sai σ 2n. Như vậy, theo cách
tính của lọc trung bình ta có:
Như vậy, nhiễu cộng trong ảnh đã giảm đi Nw lần.
c) Tăng độ tương phản
Trước tiên cần làm rõ khái niệm độ tương phản. Ảnh số là tập hợp các
điểm ảnh, mà mỗi điểm ảnh có giá trị độ sáng khác nhau. Ở đây, độ sáng để
mắt người dễ cảm nhận ảnh, song không phải là quyết định. Thực tế chỉ ra rằng
hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm
nhận khác nhau. Như vậy, độ tương phản biểu diễn sự thay đổi độ sáng của đối
tượng so với nền. Như vậy có thể hiểu rằng, độ tương phản là độ nổi của điểm
10
ảnh hay vùng ảnh so với nền. Với định nghĩa này, nếu ảnh có độ tương phản
kém, ta có thể thay đổi tuỳ ý theo ý muốn.
Ảnh với độ tương phản thấp có thể do điều kiện sáng không đủ hay không
đều, hoặc do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh.
Để điều chỉnh lại độ tương phản của ảnh, ta điều chỉnh lại biên độ trên toàn dải
hay trên dải có giới hạn bằng cách biến đổi tuyến tính biên độ đầu vào (dùng
hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm lôgarít). Khi
dùng hàm tuyến tính các độ dốc α, β , γ phải chọn lớn hơn một trong miền cần
dãn. Các tham số a và b (các cận) có thể chọn khi xem xét lược đồ xám của
ảnh.
Hình 1.4. Dãn độ tương phản
Hàm mũ hay dùng trong dãn độ tương phản có dạng: f = (X[m,n])p
Giả mã
Giả sử ta có ảnh I có kích thước m × n và số nguyên c. Khi đó, kỹ thuật
tăng, giảm độ c sáng được thể hiện:
for (i = 0; i < m; i + +)
for (j = 0; j < n; j + +)
I [i, j] = I [i, j] + c;
Nếu c > 0: ảnh sáng lên
Nếu c < 0: ảnh tối đi
d) Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường
có hai hướng tiếp cận:
11
Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có hai mức xám thì chính là chuyển về ảnh đen
trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.
Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.1.2.3. Phân vùng ảnh
Phân vùng ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm
phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên
hay các vùng liên thông. Tiêu chuẩn để xác định các vùng liên thông có thể là
cùng mức xám, cùng màu hay cùng độ nhám.... Trước hết cần làm rõ khái niệm
"vùng ảnh" (Segment) và đặc điểm vật lý của vùng.
Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh. Nó là một tập
hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức màu,
độ nhám… Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng ảnh là
nói đến tính chất bề mặt. Đường bao quanh một vùng ảnh (Boundary) là biên
ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối
đồng đều hay tính kết cấu tương đồng.
Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng:
phân vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất
hay miền kề; phân vùng dựa vào biên gọi là phân vùng biên. Ngoài ra còn có các
kỹ thuật phân vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào
công đoạn này.
1.1.2.4. Trích chọn đặc trưng
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã phân
đoạn) cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này
thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn
các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng (hay trích chọn đặc
12
điểm - Feature Selection) gắn với việc tách các đặc tính của ảnh dưới dạng các
thông tin định lượng hoặc làm cơ sở để phân biệt lớp đối tượng này với đối
tượng khác trong phạm vi ảnh nhận được. Ví dụ: trong nhận dạng ký tự trên
phong bì thư, chúng ta miêu tả các đặc trưng của từng ký tự giúp phân biệt ký
tự này với ký tự khác.
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng
trong quá trình xử lý ảnh. Có thể nêu ra vài đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn...
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (Zonal Filtering). Các bộ vùng được gọi là “mặt nạ đặc
điểm” (Feature Mask) thường là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn. . .)
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng
và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được dùng
khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử
gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (Zero Crossing).
..
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng bộ nhớ lưu trữ
giảm xuống.
1.1.2.5. Nhận dạng và nội suy ảnh
Đây là giai đoạn cuối của các hệ thống xử lý ảnh. Nhận dạng ảnh (Image
Recognition) là quá trình phân loại các đối tượng được biểu diễn theo một mô
hình nào đó và gán chúng một tên (gán cho đối tượng một tên gọi, tức là một
dạng) dựa theo những quy luật và mẫu chuẩn. Quá trình nhận dạng dựa vào
những mẫu chuẩn được học (hoặc lưu) từ trước gọi là nhận dạng có thầy hay
học có thầy, trong những trường hợp ngược lại gọi là học không có thầy.
13
Nội suy (Interpretation) là phán đoán theo ý nghĩa trên cơ sở nhận dạng.
Ví dụ: một loạt chữ số và nét gạch ngang trên phong bì thư có thể được nội suy
thành mã điện thoại.
Có nhiều cách phân loai ảnh khác nhau. Trong lý thuyết về nhận dạng
nói chung và nhận dạng ảnh nói riêng, các mô hình toán học về ảnh được phân
theo hai loại nhận dạng ảnh cơ bản:
Nhận dạng theo tham số.
Nhận dạng theo cấu trúc.
Hay có ba cách tiếp cận khác nhau:
Nhận dạng dựa vào phân hoạch không gian.
Nhận dạng dựa vào cấu trúc.
Nhận dạng dựa vào kỹ thuật mạng nơron.
Hai cách tiếp cận đầu là những cách tiếp cận kinh điển, đã được nghiên
cứu và áp dụng rất nhiều trong thực tế. Các đối tượng ảnh quan sát và thu nhận
được phải trải qua giai đoạn tiền xử lý nhằm tăng cường chất lượng, làm nổi
các chi tiết, tiếp theo là trích chọn và biểu diễn các đặc trưng, cuối cùng mới là
giai đoạn nhận dạng.
Cách tiếp cận thứ ba hoàn toàn khác. Nó dựa vào cơ chế đoán nhận, lưu
trữ và phân biệt đối tượng mô phỏng theo hoạt động của hệ thần kinh con người.
Do cơ chế đặc biệt, các đối tượng thu nhận bởi thị giác người không cần qua
giai đoạn cải thiện mà chuyển ngay sang giai đoạn tổng hợp, đối sánh với các
mẫu đã lưu trữ để nhận dạng. Đây là cách tiếp cận đầy hứa hẹn được trình bày
cụ thể trong các phần dưới đây.
Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là: nhận dạng ký tự (chữ in, chữ viết tay, chữ ký
điện tử), nhận dạng văn bản (Text), nhận dạng vân tay, nhận dạng mã vạch,
nhận dạng đối tượng chuyển động, nhận dạng mặt người, nhận dạng nụ cười,
nhận dạng mống mắt,…
14
1.1.2.6. Hậu xử lý
a) Nén ảnh
Ảnh dù ở dạng nào vẫn chiếm không gian nhớ rất lớn. Nhằm giảm thiểu
không gian lưu trữ, khi mô tả ảnh, người ta đã đưa kỹ thuật nén ảnh vào.
Thông thường được tiến hành theo cả hai cách khuynh hướng là nén có
bảo toàn và nén không bảo toàn thông tin. Nén không bảo toàn thì thường có
khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn. Trên cơ sở hai
khuynh hướng, có bốn cách tiếp cận cơ bản trong nén ảnh:
Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.
Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm
ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng
nén không bảo toàn và do vậy, kỹ thuật thường hiệu quả hơn. *.JPG tiếp cận
theo kỹ thuật nén này.
Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần
gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
Các phương pháp nén ảnh:
Nén thế hệ thứ nhất:
- Phương pháp mã hóa loạt dài RLC (Run Length Coding)
- Phương pháp mã hóa Huffman
- Phương pháp LZW (Lempel Ziv-Wench)
- Phương pháp mã hóa khối (Block Coding)
- Phương pháp thích nghi
- Xem thêm -