ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
PHẠM THỊ THÙY
NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN
BIÊN ẢNH MẦU BẰNG WAVELET
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2012
ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
PHẠM THỊ THÙY
NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN
BIÊN ẢNH MẦU BẰNG WAVELET
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS.TS. NGÔ QUỐC TẠO
THÁI NGUYÊN - 2012
i
BẢN CAM ĐOAN
Tên tôi là: Phạm Thị Thùy
Lớp: Cao học Công nghệ thông tin K9A
Khoá học: 2010 - 2012
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01
Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông Thái
Nguyên
Giáo viên hướng dẫn: PGS.TS Ngô Quốc Tạo
Cơ quan công tác: Trường Đại học Sư phạm – Đại học Thái Nguyên.
Tôi xin cam đoan toàn bộ nội dung được trình bày trong bản luận văn
này là kết quả tìm hiểu và nghiên cứu của riêng tôi, trong quá trình nghiên
cứu luận văn “Nghiên cứu phương pháp phát hiện biên ảnh màu bằng
wavelet” các kết quả và dữ liệu được nêu ra là hoàn toàn trung thực. Mọi
thông tin trích dẫn đều được tuân theo luật sở hữu trí tuệ, có liệt kê rõ ràng
các tài liệu tham khảo.
Tôi xin chịu hoàn toàn trách nhiệm với những nội dung được viết trong
luận văn này.
Thái Nguyên, ngày 10 tháng 09 năm 2012
HỌC VIÊN
PHẠM THỊ THÙY
ii
LỜI CẢM ƠN
Luận văn được thực hiện tại Trường Đại học Công nghệ Thông tin và
Truyền Thông – Đại học Thái Nguyên dưới sự hướng dẫn của thầy PGS. TS
Ngô Quốc Tạo.
Trước hết em xin bày tỏ lòng biết ơn sâu sắc tới thầy PGS. TS Ngô
Quốc Tạo - Viện Công nghệ thông tin, người đã tận tình hướng dẫn giúp đỡ
để em hoàn thành tốt luận văn của mình.
Em xin gửi lời cảm ơn chân thành đến các thầy cô giáo Trường Đại học
Công nghệ Thông tin và Truyền Thông - Đại học Thái Nguyên, cùng các thầy
cô giáo đã nhiệt tình giảng dạy, truyền đạt kiến thức cho em trong suốt quá
trình học tập tại trường cũng như quá trình làm luận văn này .
Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè, các đồng nghiệp
những người đã động viên, giúp đỡ và tạo điều kiện cho em trong quá trình
học tập và hoàn thành luận văn.
Thái Nguyên, ngày 10 tháng 9 năm 2012
HỌC VIÊN
PHẠM THỊ THÙY
iii
MỤC LỤC
Bản cam đoan....................................................................................................i
Lời cảm ơn........................................................................................................ii
Mục lục............................................................................................................iii
Danh mục các chữ viết tắt..............................................................................vi
Danh mục các hình vẽ...................................................................................vii
MỞ ĐẦU...........................................................................................................1
1. Lý do lựa chọn đề tài...................................................................................1
2. Mục tiêu nghiên cứu....................................................................................1
3. Phạm vi nghiên cứu.....................................................................................1
4. Phương pháp nghiên cứu............................................................................2
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài.....................................2
6. Cấu trúc của luận văn..................................................................................2
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHƯƠNG PHÁP
PHÁT HIỆN BIÊN CHO ẢNH MÀU............................................................3
1.1. Tổng quan về xử lý ảnh............................................................................3
1.1.1. Khái niệm xử lý ảnh...............................................................................3
1.1.2. Các giai đoạn trong quá trình xử lý ảnh..............................................3
1.1.3. Một số vấn đề cơ bản trong xử lý ảnh..................................................5
1.1.3.1. Các khái niệm......................................................................................5
1.1.3.2. Biểu diễn ảnh.......................................................................................8
1.1.3.3. Phân tích ảnh.......................................................................................9
1.1.3.4. Nhận dạng ảnh..................................................................................10
1.1.3.5. Nén ảnh..............................................................................................10
1.2. Biên ảnh và vai trò của biên trong phân tích ảnh................................11
1.2.1. Vị trí của biên trong phân tích ảnh....................................................11
1.2.2. Biên và các kiểu biên đơn giản............................................................11
iv
1.2.2.1. Biên lý tưởng.....................................................................................12
1.2.2.2. Biên dốc..............................................................................................13
1.2.2.3. Biên không trơn.................................................................................14
1.3. Các hệ màu và biểu diễn ảnh màu.........................................................15
1.3.1. Cơ sở của màu sắc................................................................................15
1.3.2. Các hệ màu...........................................................................................16
1.3.2.1. Biểu đồ màu CIE...............................................................................16
1.3.2.2. Mô hình màu RGB............................................................................18
1.3.2.3. Mô hình màu CMY...........................................................................19
1.3.2.4. Mô hình màu CMYK........................................................................20
1.3.2.5. Mô hình màu HSV............................................................................20
1.4. Các phương pháp phát hiện biên ảnh màu..........................................21
1.4.1. Tách biên ảnh màu dùng phương pháp Gradient............................21
1.4.2. Tách biên ảnh màu dùng phương pháp trường Vector Field..........24
1.4.3. Tách biên ảnh màu dùng bộ dò biên Vector Order-Statistic...........25
1.5. Kết luận chương 1...................................................................................26
CHƯƠNG 2: PHƯƠNG PHÁP PHÁT HIỆN BIÊN THEO WAVELET. 27
2.1. Giới thiệu.................................................................................................27
2.2. Xây dựng một Wavelet...........................................................................28
2.3. Biến đổi wavelet rời rạc (DWT – Discrete wavelet transform)...........29
2.4. Phương pháp phát hiện biên bởi biến đổi wavelet rời rạc (DWT).....32
2.5. Wavelet Haar...........................................................................................34
2.5.1. Hàm tỉ lệ Haar......................................................................................34
2.5.2. Xây dựng Wavelet Haar......................................................................35
2.5.3. Biến đổi Haar rời rạc (DHT - Discrete Haar transform).................36
2.5.4. DHT hai chiều (2D – Dimention)........................................................37
2.5.5. Phát hiện cạnh sử dụng wavelet Haar................................................39
v
2.6. Wavelet Daubechies................................................................................40
2.6.1. Xây dựng Daublets...............................................................................40
2.6.2. Biến đổi Wavelet Daubechies 2-D (Dimention).................................43
2.6.3. Phát hiện cạnh sử dụng Daublets.......................................................44
2.7. Wavelets Coifman...................................................................................44
2.8. Wavelets biorthogonal............................................................................48
2.8.1. Xây dựng wavelets Biorthogonal........................................................48
2.8.2. Tính chất của wavelets Biorthogonal.................................................49
2.8.3. Phát hiện cạnh sử dụng Wavelets Biorthogonal................................49
2.9. Kết luận chương 2...................................................................................50
CHƯƠNG 3: CHƯƠNG TRÌNH PHÁP HIỆN BIÊN ẢNH BẰNG
PHƯƠNG PHÁP WAVELET VÀ NHẬN XÉT ĐÁNH GIÁ CÁC
PHƯƠNG PHÁP............................................................................................51
3.1. Cài đặt thử nghiệm chương trình Wavelet transform........................51
3.2. So sánh các phương pháp phát hiện biên.............................................57
3.3. Kết luận chương 3...................................................................................59
KẾT LUẬN.....................................................................................................60
TÀI LIỆU THAM KHẢO.............................................................................61
PHỤ LỤC.........................................................................................................62
vi
DANH MỤC CÁC CHỮ VIẾT TẮT
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
CHỮ VIẾT TẮT
CMY
CMYK
CIE
DHT
D
DWT
DHT
GVDD
HSV
MVDD
STFT
RGB
VDD
VRD
TÊN TIẾNG ANH
Cyan magenta yellow
Cyan magenta yellow black
Commission international d’E clairage
Discrete Haar transform
Dimention
Discrete Wavelet Transform
Discrete Haar transform
Generalized vector dispersion detector
Hue, Saturation, Intensity
Minimin vector dispersion detector
Short time fourier Transform
Red green blue
Vector dispersion detectior
Vector range detector
vii
DANH MỤC CÁC HÌNH VẼ
Hình1.1. Các giai đoạn chính trong xử lý ảnh...................................................4
Hình 1.2. Hình chóp màu..................................................................................7
Hình 1.3. Hai loại lân cận của điểm ảnh...........................................................9
Hình 1.4. Biên khép kín..................................................................................12
Hình1.5. Đường biên lý tưởng........................................................................13
Hình 1.6. Biên dốc...........................................................................................13
Hình1.7. Biên không trơn................................................................................14
Hình1.8. Dải sóng của các ánh sáng nhìn thấy được.......................................15
Hình 1.9. Biểu đồ màu CIE.............................................................................17
Hình 1.10. Mô hình không gian màu RGB.....................................................18
Hình 1.11. Mô hình không gian màu CMY....................................................19
Hình 1.12. Phương pháp pha trộn màu trong cuộc sống.................................19
Hình 1.13. Mô hình màu HSV........................................................................20
Hình 2.1. Sơ đồ kim tự tháp Laplace phát triển bởi Burt và Adelson.............30
Hình 2.2. DWT của hai chiều tín hiệu.............................................................31
Hình 2.3. Biểu đồ ( x ) ...................................................................................34
Hình 2.4. Wavelet Haar...................................................................................36
Hình 2.5. Xấp xỉ của wavelet Daubechies lặp lại 1 đến 5 lần.........................42
Hình 2.6. Những xấp xỉ của wavelet Daubechies và hàm tỉ lệ........................43
Hình 2.7. Các bộ lọc tách và tái tạo của Daubechies......................................44
Hình 2.8. Xấp xỉ của wavelet coiflets lặp lại 1 đến 5 lần................................46
Hình 2.9. Các xấp xỉ wavelet coiflets và hàm tỉ lệ..........................................47
Hình 2.10. Các bộ lọc tách và tái tạo của coiflets...........................................47
Hình 2.11. Xấp xỉ của wavelet bior lặp lại 1 đến 5 lần...................................48
Hình 2.12. Các bộ lọc tách và tái tạo của biorthogonal..................................50
Hình 3.1. Biến đổi ảnh với tỉ lệ 1 và bộ lọc daub1..........................................51
viii
Hình 3.2. DWT hai chiều tín hiệu...................................................................52
Hình 3.3. Loại bỏ thành phần tần số thấp........................................................52
Hình 3.4. Ảnh biến đổi sau khi xây dựng lại...................................................54
Hình 3.5. Ảnh sau khi được làm nổi biên.......................................................55
Hình 3.6. Biên ảnh sau khi được khuếch đại...................................................56
Hình 3.7. Biên ảnh theo Gadient, Laplace, Canny..........................................57
Hình 3.8. Ảnh sau khi được làm nổi biên với wavelet....................................58
1
MỞ ĐẦU
1. Lý do lựa chọn đề tài
Có thể khẳng định CNTT đang giữ một vai trò quan trọng trong sự phát
triển của loài người nói chung và sự phát triển kinh tế, chính trị xã hội của
một đất nước nói riêng, Việt Nam cũng không là một ngoại lệ. Với những
bước tiến như vũ bão những thập kỉ cuối của thế kỉ XX, CNTT đã tạo nên một
diện mạo mới cho cuộc sống con người và mở ra cho nhân loại một kỉ nguyên
mới – kỉ nguyên công nghệ thông tin.
Có nhiều tài liệu nói về phương pháp phát hiện biên ảnh. Mục đích của
việc dò biên sẽ đánh dấu những điểm trong một ảnh số mà có sự thay đổi đột
ngột về độ xám, tập hợp nhiều điểm biên tạo thành biên hay đường biên bao
quanh ảnh. Các phương pháp phát hiện biên ảnh như: Gradient, Laplace,
Canny, wavelet. Trong đó phương pháp phát hiện biên theo wavelet ngày
càng được sử dụng nhiều ở trong nước cũng như trên thế giới. Vì vậy, tôi thấy
cần phải đi sâu vào nghiên cứu phương pháp phát hiện biên ảnh bằng wavelet
nhằm hoàn thiện, nâng cao hiệu quả và chất lượng việc phát hiện biên cho ảnh
màu trong xử lý ảnh số.
Trong khuôn khổ luận văn thạc sĩ, tôi chọn đề tài nghiên cứu:
“Nghiên cứu phương pháp phát hiện biên ảnh màu bằng wavelet”
2. Mục tiêu nghiên cứu
Luận văn nghiên cứu hệ thống lý thuyết liên quan đến viê êc phát hiê ên
biên trong ảnh. Cụ thể trong luận văn là nghiên cứu về phát hiê ên biên cho
ảnh màu bằng wavelet.
3. Phạm vi nghiên cứu
- Giới thiệu tổng quan về xử lý ảnh và biên.
- Phương pháp phát hiện biên cho ảnh màu.
- Phương pháp phát hiện biên theo wavelet và thử nghiệm.
2
4. Phương pháp nghiên cứu
Trong luận văn sử dụng phương pháp nghiên cứu tài liệu liên quan đến
việc phát hiê ên biên ảnh và kế thừa kết quả nghiên cứu của một số luận văn,
đề tài nghiên cứu khoa học.
Trên cơ sở nghiên cứu lý thuyết cơ bản xử lý ảnh và các phương pháp
phát hiê ên biên ảnh, đă cê biê êt dùng phương pháp wavelet tiến hành cài đặt
chương trình.
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
Xử lý ảnh được áp dụng trong nhiều lĩnh vực khác nhau như y học, vật
lý, hóa học, tìm kiếm tội phạm, trong quân sự và trong một số lĩnh vực
khác… Vì vậy việc nghiên cứu phương pháp wavelet để phát hiện biên cho
ảnh màu là rất cần thiết.
Dùng wavelet để phát hiê ên biên ảnh là phương pháp đã và đang được
nghiên cứu và ứng dụng rất mạnh mẽ ở nhiều nước trên thế giới.
6. Cấu trúc của luận văn
Ngoài phần mở đầu và phần kết luận, luận văn được trình bày thành
ba chương:
Chương 1: Tổng quan về xử lý ảnh và phương pháp phát hiện biên cho
ảnh màu.
Chương 2: Các phương pháp phát hiện biên theo wavelet
Chương 3: Chương trình phát hiện biên ảnh bằng phương pháp wavelet
và nhận xét đánh giá các phương pháp
3
CHƯƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHƯƠNG PHÁP PHÁT HIỆN
BIÊN CHO ẢNH MÀU
1.1. Tổng quan về xử lý ảnh
1.1.1. Khái niệm xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Trong những năm trở lại đây cùng với sự phát triển
của phần cứng máy tính, xử lý ảnh và đồ họa phát triển một cách mạnh mẽ,
ngày càng có nhiều ứng dụng trong cuộc sống và nó đóng một vai trò quan
trọng trong tương tác người máy [2].
Quá trình xử lý nhận dạng ảnh là một quá trình thao tác nhằm biến đổi
một ảnh đầu vào để cho ra một kết quả mong muốn. Kết quả đầu ra của một
quá trình xử lý ảnh có thể là một ảnh "tốt hơn" ảnh ban đầu hoặc một kết luận.
Như vậy mục tiêu của xử lý ảnh có thể chia làm ba hướng như sau:
- Xử lý ảnh ban đầu để cho ra một ảnh mới tốt hơn theo một mong muốn
của người dùng (ví dụ: ảnh mờ cần xử lý để được rõ hơn).
- Phân tích ảnh để thu được thông tin nào đó giúp cho việc phân loại và nhận
biết ảnh (ví dụ: phân tích ảnh vân tay để trích chọn các đặc trưng vân tay).
- Từ ảnh đầu vào mà có những nhận xét, kết luận ở mức cao hơn, sâu
hơn (ví dụ: ảnh một tai nạn giao thông phác họa hiện trường tai nạn).
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tượng trong không gian và nó có thể xem như một hàm n biến P(c 1, c2,...,
cn). Do đó, ảnh trong xử lý ảnh có thể xem như một ảnh n chiều.
1.1.2. Các giai đoạn trong quá trình xử lý ảnh
Quá trình xử lý một ảnh đầu vào nhằm thu được một ảnh đầu ra mong
muốn thường phải trải qua rất nhiều bước khác nhau. Các bước cơ bản của
một quá trình xử lý ảnh được thể hiện thông qua hình sau:
4
Hình1.1. Các giai đoạn chính trong xử lý ảnh
- Quá trình thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh. Ảnh có thể được thu
nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay tranh ảnh được quét trên
máy scan hay ảnh thu nhận được từ camera,… Gốc của ảnh là ảnh liên tục về
không gian và độ sáng. Để xử lý bằng máy tính, ảnh cần phải được số hoá.
Số hóa ảnh là quá trình rời rạc hoá về không gian và lượng tử hoá về giá
trị. Quá trình rời rạc hoá về không gian là quá trình thu nhận những điểm rời
rạc từ một ảnh liên tục. Quá trình này cũng chính là việc tìm cách biểu diễn cả
một ảnh lớn có vô số điểm, bởi một số hữu hạn điểm, sao cho không làm mất
đi hay thay đổi tính chất của ảnh, để việc lưu trữ và xử lý ảnh được dễ dàng.
Còn quá trình lượng tử hoá về giá trị là quá trình rời rạc hoá về mặt giá
trị để có thể đơn giản hoá việc tính toán và đưa vào máy để xử lý. Tuỳ theo
từng loại ảnh, độ chính xác yêu cầu và khả năng xử lý của máy tính mà ta có
các mức lượng tử thích hợp.
- Quá trình phân tích ảnh: thực chất bao gồm một số công đoạn cơ bản
sau đây:
5
Tăng cường chất lượng ảnh: việc này là cần thiết do một số nguyên nhân
nào đó (nguồn sáng kém, ảnh bị nhiễu,...) dẫn tới việc chất lượng thu nhận
ảnh kém. Việc tăng cường và khôi phục ảnh để làm nổi bật một số đặc trưng
chính của ảnh.
Phát hiện đặc tính như biên, phân vùng, trích chọn các đặc tính của
ảnh,...
- Cuối cùng, tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,
phân lớp hoặc hỗ trợ ra quyết định cho một hệ thống cụ thể nào đó.
1.1.3. Một số vấn đề cơ bản trong xử lý ảnh
1.1.3.1. Các khái niệm
- Điểm ảnh (Picture Element)
Ảnh trong thực tế là ảnh liên tục về không gian và về giá trị độ sáng [3].
Quá trình số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập
điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám).
Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không
phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh
(PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều,
mỗi pixel ứng với cặp tọa độ (x, y).
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám
hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được
gọi là một phần tử ảnh.
- Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên
một ảnh số được hiển thị. Khoảng cách giữa các điểm ảnh phải được chọn sao
cho mắt người vẫn thấy được sự liên tục của ảnh. Khoảng cách đó, hay chính
6
là độ phân giải phân bố theo trục x và y trong không gian hai chiều.
- Mức xám của ảnh
Mức xám của điểm ảnh là kết quả sự mã hóa tương ứng cường độ sáng
của mỗi điểm ảnh bởi một giá trị số tại điểm đó. Đó là kết quả của quá trình
lượng tử hóa.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (mức 256
là mức phổ dụng). Lý do từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn
mức xám. Mức xám dùng 1 byte biểu diễn: 28=256 mức (tức là từ 0 đến 255).
- Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô
tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có
thể là 0 hoặc 1.
- Ảnh đen trắng: Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu
trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau.
Người ta phân mức đen trắng đó thành L mức, nếu sử dụng số bit B=8 bít để
mã hóa mức đen trắng (hay mức xám) thì L được xác định :
L = 2B (trong ví dụ của ta L = 28 = 256 mức)
Nếu L = 2, B = 1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh
nhị phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn
hơn 2 ta có ảnh đa cấp xám.
Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit,
còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit. Như vậy, với ảnh
đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có
thể biểu diễn được là 256. Mỗi mức xám được biểu diễn dưới dạng là một số
nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường
độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất.
7
Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử
logic. Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối
tượng ảnh với nền hay để phân biệt điểm biên với điểm khác.
- Ảnh màu: Trong hệ màu RGB (Red, Green, Blue) để tạo nên thế giới
màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
28*3=224≈ 16,7 triệu màu.
Nếu bạn kiểm tra màn hình của một tivi khi nó được bật lên, bạn sẽ chú
ý thấy tại tất cả các điểm ảnh màu được tạo nên bằng ba vòng tròn nhỏ hoặc
tam giác có màu đỏ, lục, lam. Sự thay đổi độ sáng của ba phần tử màu này tạo
nên màu sắc của điểm ảnh. Trong ảnh số thì các điểm ảnh được biểu diễn
bằng một số từ có cùng một số bit cho các màu đỏ, lục, lam. Ví dụ như ảnh
màu được biểu diễn bằng 16 bit thì đều có 5 bit để biểu diễn cho mỗi màu, bit
cuối cùng dùng cho một vài chức năng đặc biệt như ngăn xếp. Trong một
khung số thì bit cuối cùng thông thường để chỉ ra điểm ảnh này được lấy từ
bộ đệm khung (bộ nhớ ngăn xếp) hay là từ tín hiệu video bên ngoài (ngăn xếp
trực tiếp). Trong hệ thống 16 bít 32,768 màu có thể được biểu diễn với ba
màu riêng có khả năng thể hiện 32 trạng thái.
G
Bóng
Độ chói
W
R
xám
Đen
B
Hình 1.2. Hình chóp màu
8
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ
(R), lục (G), lơ (B) là thường thu nhận trên các dải băng tần khác nhau. Với
ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các
số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red),
lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24 bit. 24
bit này được chia thành ba khoảng 8 bit. Mỗi màu cũng phân thành L cấp màu
khác nhau (thường L = 256). Mỗi khoảng này biểu diễn cho cường độ sáng
của một trong các màu chính.
Do đó, để lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt,
mỗi màu lưu trữ như một ảnh đa cấp xám. Do đó, không gian nhớ dành cho
một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ.
1.1.3.2. Biểu diễn ảnh
Sau quá trình số hoá sẽ thu được một ma trận tương ứng với ảnh cần xét,
mỗi phần tử của ma trận tương ứng với một điểm ảnh. Ảnh thường được biểu
diễn bởi một mảng hai chiều I(n,p) gồm n dòng và p cột. Như vậy, ảnh gồm n
x p pixels và người ta thường kí hiệu I(x,y) để chỉ một pixel cụ thể trong ảnh.
Về mặt toán học có thể xem ảnh là một hàm hai biến f(x,y) với x,y là các
biến tọa độ. Giá trị số ở điểm (x,y) tương ứng với giá trị xám hoặc độ sáng
của ảnh (x là các cột còn y là các hàng). Giá trị của hàm ảnh f(x,y) được hạn
chế trong phạm vi của các số nguyên dương 0 f ( x, y) f max
Thông thường đối với ảnh xám, giá trị f max là 255 (28 =256) và mỗi phần
tử ảnh được mã hóa bởi một byte. Ảnh có thể được biểu diễn theo một trong
hai mô hình: mô hình Vector hoặc mô hình Raster.
Mô hình Raster: là mô hình biểu diễn ảnh thông dụng nhất hiện nay.
Ảnh được biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu
thực tế mà mỗi điểm ảnh có thể được biểu diễn bởi một hay nhiều bit. Mô
hình Raster thuận lợi cho việc thu nhận, hiển thị và in ấn.
9
Mô hình Vector: Bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ
dàng hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ưu điểm
cho phép dễ dàng lựa chọn, sao chép, di chuyển, tìm kiếm,…Theo những yêu
cầu này thì kỹ thuật biểu diễn vector tỏ ra ưu việt hơn.
Trong mô hình này, người ta sử dụng hướng vector của các điểm ảnh lân
cận để mã hóa và tái tạo lại hình ảnh ban đầu. Các ảnh vector được thu nhận
trực tiếp từ các thiết bị số hóa hoặc được chuyển đổi từ các ảnh Raster thông
qua các chương trình vector hóa.
Khi xử lý các ảnh Raster chúng ta có thể quan tâm đến mối quan hệ
trong vùng lân cận của các điểm ảnh. Có hai loại lân cận của điểm ảnh được
quan tâm nhiều nhất: điểm 4 láng giềng và 8 láng giềng.
Hình 1.3. Hai loại lân cận của điểm ảnh
1.1.3.3. Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của một
ảnh để đưa ra một mô tả đầy đủ về ảnh. Các kỹ thuật được sử dụng ở đây
nhằm mục đích xác định biên của ảnh. Có nhiều kỹ thuật khác nhau như lọc
vi phân hay dò theo quy hoạch động.
Người ta cũng dùng các kỹ thuật phân tích ảnh để phân vùng ảnh. Từ
ảnh thu được, người ta tiến hành kỹ thuật tách (split) hay hợp (merge) dựa
10
theo các tiêu chuẩn đánh giá như: màu sắc, cường độ, v...v. Các phương pháp
được biết đến như Quad-Tree, mảnh hoá biên, nhị phân hoá đường biên và
các kỹ thuật phân lớp dựa theo cấu trúc.
1.1.3.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người
ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn
các đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ
cái, chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hoá quá trình
đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, v...v) phục vụ cho nhiều lĩnh vực.
Ngoài 2 kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơ ron đang được áp dụng và cho kết quả khả quan
trong nhận dạng ký tự.
1.1.3.5. Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi
trên mạng. Như đã nói ở trên, lượng thông tin để biểu diễn cho một ảnh là rất
lớn. Ví dụ, một ảnh đen trắng cỡ 512 x 512 với 256 mức xám chiếm 256K
bytes. Do đó làm giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần
thiết. Nhiều phương pháp nén dữ liệu đã được nghiên cứu và áp dụng cho loại
dữ liệu đặc biệt này.
1.2. Biên ảnh và vai trò của biên trong phân tích ảnh
- Xem thêm -