I HỌC TH I NGU
TRƢỜNG
I HỌC
N
THUẬT C NG NGHI P
T MINH LONG
XỬ LÝ ẢNH VÀ ỨNG DỤNG IỀU KHIỂN
QUÁ TRÌNH LÊN MEN TRONG CÔNG NGH SẢN XUẤT CHÈ EN
LUẬN VĂN TH C SĨ
HOA HỌC
MÃ NGÀNH: 6520203
NGÀNH K THUẬT I N TỬ
HOA I N TỬ
NGƢỜI HƢỚNG DẪN KHOA HỌC:
PGS.TS L I KHẮC LÃI
PGS.TS ào Huy Du
T
N uy n – Năm 2020
i
CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
ộc lập – Tự do – Hạnh phúc
BẢN XÁC NHẬN CHỈNH SỬA LUẬN VĂN TH C SĨ
Họ và tên tác giả luận văn: Tạ Minh Long
ề tài luận văn: Xử lý ảnh và ứng dụn đ ều khiển quá trình lên men
trong công nghệ sản xuất c è đen
Chuyên ngành: Kỹ thuật
ện tử
Mã số: ................................................................................................................... ……………
Tác giả, Cán bộ hƣớng dẫn khoa học và Hội đồng chấm luận văn xác nhận
tác giả đã sửa chữa, bổ sung luận văn theo biên bản họp Hội đồng ngày 25/12/2020
với các nội dung sau:
- Bổ xung thêm về ứng dụng điều khiển trong công nghệ sản xuất chè đen chƣơng 3
- Sửa lại các lỗi chế bản
- Bổ sung kết luận các chƣơng
............................................................................................................................................... ……………
............................................................................................................................................... ……………
Thái Nguyên, ngày
tháng
G o v n ƣớng dẫn
Tác giả luận văn
PGS.TS Lại Khắc Lãi
Tạ Minh Long
CHỦ TỊCH HỘI ỒNG
PGS.TS Nguyễn Thanh Hà
năm 2020
ii
LỜI CAM OAN
Tên tôi là: Tạ M n Lon
Sinh ngày: 08 tháng 12 năm 1992
Học viên Cao học Khoá 20 – Lớp Kỹ thuật Điện tử - Trƣờng Đại học Kỹ thuật
Công nghiệp – Đại học Thái Nguyên.
Xin cam đoan luận văn “Xử lý ảnh và ứng dụn đ ều khiển quá trình lên
men trong công nghệ sản xuất c è đen” do thầy giáo PGS.TS. Lạ
ắc Lã
hƣớng dẫn là công trình nghiên cứu của riêng tôi. Tất cả các tài liệu tham khảo đều
có nguồn gốc, xuất xứ rõ ràng.
Tôi xin cam đoan tất cả những nội dung trong luận văn đúng nhƣ nội dung
trong đề cƣơng và yêu cầu của thầy giáo hƣớng dẫn. Nếu có vấn đề gì trong nội
dung của luận văn, tôi xin hoàn toàn chịu trách nhiệm với lời cam đoan của mình.
Thái Nguyên, ngày
tháng
Học v n
Tạ M n Lon
năm 2020
iii
LỜI CẢM ƠN
Sau thời gian nghiên cứu, đƣợc sự hƣớng dẫn tận tình giúp đỡ của thầy giáo
PGS.TS. Lạ
ắc Lã , luận văn với đề tài “Xử lý ảnh và ứng dụn đ ều khiển
quá trình lên men trong công nghệ sản xuất chè đen” đã đƣợc hoàn thành.
Tôi xin bày tỏ lòng biết ơn sâu sắc tới:
Thầy giáo hƣớng dẫn PGS.TS. Lạ
ắc Lã đã tận tình chỉ dẫn, giúp
đỡ tôi hoàn thành luận văn.
Các thầy cô giáo Trƣờng Đại học kỹ thuật công nghiệp - Đại học Thái
Nguyên và các bạn bè đồng nghiệp, đã quan tâm động viên, giúp đỡ tôi trong
suốt quá trình học tập để hoàn thành luận văn này.
Mặc dù đã cố gắng hết sức, song do điều kiện thời gian và kinh nghiệm
thực tế của bản thân còn ít, cho nên đề tài không thể tránh khỏi thiếu sót. Vì
vậy, tôi mong nhận đƣợc sự đóng góp ý kiến của các thầy giáo,cô giáo và các
bạn bè đồng nghiệp.
Tô x n c ân t àn cảm ơn!
Thái Nguyên, ngày
tháng
Học v n
Tạ M n Lon
năm 2020
iv
MỤC LỤC
LỜI CAM ĐOAN ...................................................................................................... ii
LỜI CẢM ƠN ........................................................................................................... iii
MỤC LỤC ................................................................................................................. iv
DANH MỤC CÁC CHỮ VIẾT TẮT ....................................................................... vi
DANH MỤC CÁC HÌNH VẼ.................................................................................. vii
LỜI NÓI ĐẦU ............................................................................................................1
1. Tính cấp thiết của luận văn ...............................................................................1
2. Mục tiêu nghiên cứu .........................................................................................1
3. Đối tƣợng và phạm vi nghiên cứu.....................................................................2
4. Ý nghĩa của luận văn.........................................................................................3
5. Nội dung nghiên cứu .........................................................................................3
6. Phƣơng pháp và phƣơng pháp luận...................................................................3
CHƢƠNG 1: LÊN MEN CHÈ ĐEN VÀ ẢNH SỐ ....................................................4
1.1. Chè đen và lên men chè đen .............................................................................4
1.1.1. Chè đen .......................................................................................................4
1.1.2. Quá trình lên men chè đen..........................................................................5
1.2. Ảnh số ...............................................................................................................6
1.2.1. Định nghĩa ảnh số .......................................................................................6
1.2.2. Thuộc tính của hình ảnh số hóa ..................................................................7
1.2.3. Các loại hình ảnh ........................................................................................8
1.2.4. Không gian màu RGB, HSV, LAB ............................................................9
1.3. Phƣơng pháp nghiên cứu ................................................................................13
1.4. Kết luận chƣơng ..............................................................................................13
CHƢƠNG 2: CÁC THUẬT TOÁN SỬ DỤNG ......................................................14
2.1. ANOVA, Z – Score, Correlation coefficients ................................................14
2.1.1. ANOVA một yếu tố (one-way ANOVA) ................................................14
2.1.2. Z – Score ..................................................................................................16
2.1.3. Correlation coefficients ............................................................................16
2.2. Phân loại mẫu đào tạo và kiểm tra SPXY ......................................................18
v
2.2.1. Kennard-Stone ..........................................................................................18
2.2.2. SPXY ........................................................................................................19
2.3. Phân tích thành phần chính .............................................................................20
2.3.1. Ý tƣởng .....................................................................................................20
2.3.2. Hàm mất mát ............................................................................................22
2.3.3. Tối ƣu hóa hàm mất mát...........................................................................23
2.3.4. Các bƣớc thực hiện phân tích thành phần chính ......................................24
2.4. Thuật toán Cây quyết định và Rừng ngẫu nhiên ............................................26
2.4.1. Khái niện chung........................................................................................26
2.4.2. Thuật toán Rừng ngẫu nhiên(Random Forest) .........................................28
2.5. Kết luận chƣơng ..............................................................................................38
CHƢƠNG 3: DỰ ĐOÁN CÁC CHỈ SỐ CHẤT LƢỢNG VÀ ỨNG DỤNG ..........39
3.1. Tiền xử lý dữ liệu và phân chia bộ mẫu .........................................................39
3.1.1. Trích xuất tính năng màu .........................................................................40
3.1.2. Phân tích sự khác biệt về chỉ số chất lƣợng và đặc điểm màu sắc ...........41
3.1.3. Tƣơng quan giữa đặc điểm màu sắc và chỉ số chất lƣợng .......................42
3.1.4. Tiền xử lý dữ liệu và phân chia bộ mẫu ...................................................43
3.2. Phân chia tập huấn luyện và thử nghiệm (train/test) ......................................44
3.3. Phân tích thành phần chính .............................................................................45
3.4. Thiết lập mô hình phi tuyến RF cho từng chỉ số chất lƣợng ..........................47
3.5. Ứng dụng ........................................................................................................50
3.5.1. Lƣu đồ thuật toán đề xuất .........................................................................50
3.5.2. Thiết bị điều khiển đề xuất .......................................................................51
3.6. Kết luận chƣơng ..............................................................................................52
KẾT LUẬN VÀ KIẾN NGHỊ...................................................................................53
TÀI LIỆU THAM KHẢO .........................................................................................54
Phụ lục 1: Chƣơng trình tối ƣu hóa số thành phần chính và số cây trong RF(đại diện
TFs) ...........................................................................................................................56
vi
DANH MỤC C C CHỮ VIẾT TẮT
Từ Viết Tắt
Tên tiếng anh
Tên tiếng việt
TFs
Theaflavins
Chất sắc tố 1
TRs
Thearubigins
Chất sắc tố 2
TBs
Theabrownin
Chất sắc tố 3
SS
Sensory Score
Điểm cảm quan
RGB
Red Green Blue
Đỏ Xanh lục Xanh lam
HSV
Hue Saturation Value
Màu, độ bão hoà, giá trị
Lab
L(Black ÷ White), a(Green ÷ Red),
b(Blue ÷ Yellow)
Mức độ các màu thành phần
ANOVA
Analysis of variance
Phân tích phƣơng sai
PCA
Principal Components Analysis
Phân tích thành phần chính
KS
Kennard-Stone
Tên thuật toán
SPXY
Sample set Partitioning based on
joint X–Y distance
Phân vùng tập hợp mẫu dựa
trên khớp khoảng cách x-y
RF
Random Forest
Rừng ngẫu nhiên
OBB
Out-of-bag
RMSEC
RMSEP
Mẫu không tham gia xây
dựng cây trong RF
Root-mean-square-error-Calibration Lỗi-trung bình-bình phƣơng
set
gốc của bộ hiệu chuẩn
Root-mean-square-error- Prediction Lỗi-trung bình-bình phƣơng
set
gốc của bộ dự đoán
CV
Coefficient of variation
Hệ số biến thiên
SEP
Standard Error of Prediction
Sai số chuẩn của dự đoán
RPD
Ratio of standard error of
Performance to standard Deviation
Tỷ lệ sai số chuẩn của Hiệu
suất so với Độ lệch chuẩn
vii
DANH MỤC C C HÌNH VẼ
Hình 1.1: Chè đen .......................................................................................................4
Hình 1.2: Màu sắc tăng cƣờng trung bình trƣớc và sau khi lên men(S×3,H×2) ........5
Hình 1.3: Máy lên men chè đen liên tục thực tế .........................................................6
Hình 1.4: Nguyên lý cấu tạo máy lên men liên tục .....................................................6
Hình 1.5: Tham chiếu không gian của Pixel (0, 0) .....................................................7
Hình 1.6: Không gian màu RGB ...............................................................................10
Hình 1.7: Không gian màu HSV ...............................................................................11
Hình 1.8: Không gian màu Lab .................................................................................12
Hình 1.9: Lƣu đồ của thuật toán đƣợc sử dụng để đo màu sắc của các mẫu trà .......13
Hình 2.1: Sự ảnh hƣởng của kết quả với yếu tố đang xét .........................................15
Hình 2.2: Đồ thị thể hiện giá trị Z-score ...................................................................16
Hình 2.3: Mô tả thuật toán KS ..................................................................................19
Hình 2.4: Ví dụ về phƣơng sai của dữ liệu trong không gian hai chiều ...................21
Hình 2.5: Ý tƣởng chính của PCA ............................................................................21
Hình 2.6: Minh họa các thành phần chính với dữ liệu hai chiều. .............................24
Hình 2.7: Các bƣớc thực hiện PCA...........................................................................25
Hình 2.8: Mô hình hoạt động của Bagging ...............................................................29
Hình 2.9: Sơ đồ kết hợp các bộ phân loại nhờ bỏ phiếu ...........................................32
Hình 2.10: Sơ đồ học tập thể các bộ học...................................................................32
Hình 2.11: Thuật toán Random Forest ......................................................................34
Hình 3.1: Bảng dữ liệu và đồ thị thể hiện sự thay đổi về giá trị RGB trung bình theo
thời gian .....................................................................................................................39
Hình 3.2: Đồ thị thể hiện sự thay đổi về giá trị a, H; b, S; c, V; d, L; e, a; f, b ........39
trung bình theo thời gian ...........................................................................................39
Hình 3.3: Đồ thị thể hiện sự thay đổi giá trị các chỉ số chất lƣợng...........................40
Hình 3.4: Biểu đồ điểm PCA với 2 thành phần chính đầu tiên .................................44
Hình 3.5: Đồ thị thể hiện mối quan hệ giữa trị riêng và số thành phần chính ..........45
viii
Hình 3.6: Các quan sát và véc tơ riêng trên hai thành phần chính thứ nhất và thứ hai
...................................................................................................................................46
Hình 3.7: Lƣu đồ thuật toán tối ƣu PCs và N............................................................47
Hình 3.8: Giá trị RMSEC của mỗi chỉ số chất lƣợng cho mô hình RF từ các PC và
N khác nhau...............................................................................................................48
Hình 3.9: Lƣu đồ thuật toán điều khiển lên men đề xuất ..........................................50
Hình 3.10: Cài đặt chế độ hoạt động thông qua màn hình HMI ...............................52
1
LỜI NÓI ẦU
1. Tín cấp t ết của luận văn
Trong quá trình sản xuất chè đen, lên men là giai đoạn rất quan trọng, nó tạo
ra những biến đổi sinh hóa để có hƣơng vị, màu sắc cho chè thành phẩm. Tuy nhiên
ngoài thực tế, quá trình này đƣợc thực hiện chủ yếu nhờ vào cảm quan của con
ngƣời để xem chè đã lên men đạt tiêu chuẩn hay chƣa. Để đảm bảo sự nhanh chóng
và chính xác trong quá trình lên men với phƣơng pháp lên men liên tục (dạng băng
tải) ta sẽ dựa trên quá trình biến đổi lý, hóa, cảm quan theo thời gian thông qua các
chỉ số chất lƣợng tiêu chuẩn. Xử lý hình ảnh sẽ thay thế cảm quan của con ngƣời để
đảm bảo sản phảm đạt chất lƣợng nhất.
Dựa vào hình ảnh phân tích đƣợc, ta điều khiển nhiệt độ, lƣu lƣợng khí, tốc độ
băng tải để đảm bảo các chỉ tiêu chất lƣợng tại các thời điểm đạt tiêu chuẩn. Khi
đảm bảo điều kiện, sẽ chuyển sang giai đoạn tiếp theo.
Trong những năm gần đây, thuật toán RF(Random Forest) đã đƣợc áp dụng
rộng rãi cho nhiều ngành khác nhau. Nhƣng không có tài liệu nào liên quan đến lá
trà và dự đoán giám sát hình ảnh.
Xuất phát từ những yêu cầu và sự cấp thiết đã nêu trên, em đã chọn đề tài cho luận
văn của mình là:
“Xử lý ảnh và ứng dụn đ ều khiển quá trình lên men trong công nghệ
sản xuất c è đen”
2. Mục t u n
n cứu
Công nghệ thị giác máy đƣợc áp dụng để phát hiện sự thay đổi không gian
màu của màu trà đen trong RGB, Lab và HSV, đồng thời tìm hiểu sự liên quan của
nó với chất lƣợng lên men của trà đen. Và sau đó, thông số đặc trƣng màu sắc đƣợc
sử dụng làm đầu vào để thiết lập các chỉ số hóa lý (TFs, TRs và TBs) và mô hình
đánh giá định lƣợng tuyến tính và phi tuyến tính của các đặc điểm cảm quan.
2
Dựa trên công nghệ thị giác máy và thuật toán mô hình phi tuyến, luận văn
này sẽ thiết lập một phƣơng pháp kiểm tra định lƣợng nhanh chóng và không phá
hủy đối với các sắc tố trà và các chỉ số chất lƣợng cảm quan trong quá trình lên men
trà đen. Thông qua chuyển đổi không gian của màu sắc hình ảnh, trích xuất 9 biến
màu (R, G, B, H, S, V, L, a * và b *) nhƣ các thông số đặc trƣng để đánh giá chất
lƣợng lên men, phân tích các quy luật thay đổi, sự khác biệt và quan hệ của màu sắc
hình ảnh và chỉ số chất lƣợng, và thiết lập các mô hình đánh giá định lƣợng tƣơng
ứng thông qua các phƣơng pháp hồi quy phi tuyến rừng ngẫu nhiên (Random Forest
Regression).
3.
ố tƣợn và p ạm v n
n cứu
Về lý thuyết:
+ Nghiên cứu về dây chuyền lên men chè đen trong thực tế, từ đó rút những điểm
hạn chế cần khắc phục hoặc phát triển.
+ Nghiên cứu tổng quan về ảnh số hóa và quy luật biến đổi của màu sắc khi lên
men chè đen từ đó rút ra các hƣớng nghiên cứu thích hợp cho luận văn.
+ Nghiên cứu các thuật toán xử lý dữ liệu, đề xuất các phƣơng pháp cải thiện
chất lƣợng cho mô hình. Xây dựng mô hình dự đoán, tối ƣu, đánh giá và đƣa ra
hƣớng phát triển về sau.
Về thực hành:
+ Chuyển đổi các thông số giữa các không gian màu khác nhau, cụ thể là các
không gian màu đang nghiên cứu, đƣa ra nhận xét.
+ Xây dựng lƣu đồ thuật toán, viết chƣơng trình cho các thuật toán xử lý dữ liệu
bằng ngôn ngữ PYTHON với công cụ JUPYTER.
+ Xây dựng mô hình dự đoán, kết hợp các thuật toán để đƣa ra mô hình dự đoán
tối ƣu.
3
4. Ý n
ĩa của luận văn
Giúp tiếp cận về học máy, xử lý dữ liệu lớn phù hợp với sự phát triển của công
nghệ ngày nay
Luận văn sẽ làm tiền đề cho hƣớng nghiên cứu, phát triển dây chuyền thực tế
và cho các giai đoạn khác với đối tƣợng chè đen.
5. Nộ dun n
n cứu
Cấu trúc luận văn bao gồm 3 chƣơng, nội dung tóm tắt của các chƣơng nhƣ
sau:
Chương 1: L n men c è đen và ản số
Trình bày về Chè đen và ảnh số hóa, các không gian màu nghiên cứu và
chuyển đổi qua lại giữa chúng
Chương 2: C c t uật to n sử dụn
Trình bày về các thuật toán đƣợc sử dụng để xây dựng mô hình dự đoán
Chương 3: Dự đo n c c c ỉ số chất lƣợng
Trình bày về các bƣớc tiến hành phân tích dữ liệu và kết quả phân tích. Đƣa ra
kết quả tối ƣu hóa và nhận xét, hƣớng phát triển về sau
6. P ƣơn p
p và p ƣơn p
p luận
- Nghiên cứu lý thuyết để thu thập dữ liệu và lựa chọn thuật toán
- Tiến hành xử lý dữ liệu, tối ƣu hóa mô hình nghiên cứu
- Đánh giá chất lƣợng của mô hình nghiên cứu
Thái Nguyên, ngày
tháng năm 2020
Học v n
Tạ M n Long
4
CHƢƠNG 1: L N MEN CHÈ EN VÀ ẢNH SỐ
1.1. C è đen và l n men c è đen
1.1.1. C è đen
Chè đen là một trong những đồ uống chức năng phổ biến nhất trên thế giới; dựa trên
hình dạng, nó có thể đƣợc phân thành hai loại: chè đen vỡ và chè hình thanh. Chè
đen là một loại chè lên men hoàn toàn.
Hình 1.1: Chè đen
Màu sắc và mùi là sự thay đổi cảm quan quan trọng trong quá trình lên men
chè đen. Trong quá trình lên men, đƣợc xúc tác bởi polyphenol oxyase (PPO) và
peroxidase, polyphenol trong Chè (đặc biệt là thành phần catechin) sẽ dần dần tạo ra
các sản phẩm oxy hóa màu, trong đó các chất sắc tố hòa tan trong nƣớc có ảnh
hƣởng mạnh đến chất lƣợng cảm quan của Chè đen . Các chất sắc tố hòa tan trong
nƣớc này chủ yếu bao gồm theaflavin (TF), thearubigins (TRs) và theabrownin
(TB) [12] . Màu sắc và độ bóng của chè sẽ đƣợc hình thành khi các chất sắc tố trên
hòa tan trong nƣớc; sự hòa tan của các chất sắc tố cũng sẽ ảnh hƣởng đến hƣơng vị
và hƣơng vị của chè, chẳng hạn nhƣ vị ngọt, vị mặn, cƣờng độ, nồng độ… lá chè
đen sẽ có sự thay đổi màu sắc rõ rệt trong quá trình lên men, thay đổi từ màu ngọc
lam sang màu vàng lục, sau đó chuyển sang màu vàng đỏ, nâu vàng và cuối cùng
sang màu nâu sẫm. Sự thay đổi màu sắc này có thể đƣợc quan sát và phân biệt bởi
hệ thống thị giác của con ngƣời, nhƣng rất khó để xác định thang đo cụ thể.
5
Hình 1.2: Màu sắc tăng cƣờng trung bình trƣớc và sau khi lên men(S×3,H×2)
Các mô tả cảm giác của con ngƣời để màu sắc là định tính. Tuy nhiên, trong
sản xuất chè đen quy mô lớn, mức độ lên men và chất lƣợng cảm quan có thể đƣợc
dự đoán thông qua kinh nghiệm sản xuất phong phú và quan sát sự thay đổi màu sắc
ở trên. Vì lý do này, quá trình lên men có thể không đủ hoặc quá mức, và màu sắc
của lá Chè có thể bị trộn lẫn và không đồng đều; Bên cạnh đó, hƣơng vị của chè có
thể không thể đoán trƣớc.
Màu sắc là một thuộc tính quan trọng và tính năng nhận thức của hình ảnh
máy tính. Thông tin màu của lá chè đen có thể đƣợc định lƣợng và mô tả chính xác
bằng cách chụp ảnh mẫu bằng hệ thống thu nhận thị giác máy và trích xuất các tính
năng màu với số hóa . Các hình ảnh ánh sáng nhìn thấy, phổ và công nghệ cận hồng
ngoại đã đƣợc các nhà nghiên cứu sử dụng để xác định danh mục, chất lƣợng, hình
dạng và nơi xuất xứ của chè . Tuy nhiên, có rất ít nghiên cứu về công nghệ phát
hiện chất lƣợng cho quá trình lên men của Chè đen.
1.1.2. Qu trìn l n men c è đen
Chè đen có thể lên men bằng phƣơng pháp gián đoạn và lên men liên tục trên băng
tải, trong phần này tôi chỉ trình bày phƣơng pháp lên men liên tục.
Lá chè sau khi phá vỡ tế bào và định hình đƣợc giải đều trên băng tải với độ dầy từ
15 đến 20cm. Băng tải chuyển động liên tục với tố độ phù hợp, thời gian lên men từ
2 giờ phút đến 4 giờ [17] đủ để hoàn thiện chất lƣợng cho chè đen.Trong quá trình
lên men khối chè sẽ đƣợc tác động liên tục bởi các yếu tố nhiệt độ và độ ẩm phù
hợp. Phƣơng pháp này đƣợc sản xuất phổ biến ở Nga để lên men chè liên tục trong
sản xuất chè OTD. Nguyên lý cấu tạo thiết bị lên men nhƣ sau: Băng tải lên men
bao gồm nhiều tấm vỉ bẳng thép không gỉ và ghép lại. Chuyển động nhờ hệ thống
6
xích và bánh xích. Các thiết bị lên men liên tục có nhiều ƣu điểm, đó là cơ giới hóa
hoàn toàn quá trình lên men, năng suất cao, chất lƣợng chè khá ổn định.
Hình 1.3: Máy lên men chè đen liên tục thực tế
Hình 1.4: Nguyên lý cấu tạo máy lên men liên tục
1.2. Ản số
1.2.1. ịn n
ĩa ản số
Một hình ảnh là một mảng 2D (2 chiều) của các giá trị đại diện cho cƣờng độ
ánh sáng. Với mục đích xử lý hình ảnh, thuật ngữ hình ảnh đề cập đến một hình ảnh
kỹ thuật số.
Một hình ảnh là một hàm của cƣờng độ ánh sáng:
f (x, y)
Trong đó f là độ sáng của điểm (x, y) và x và y đại diện cho không gian tọa độ
của một yếu tố hình ảnh, hoặc pixel. Theo quy ƣớc, tham chiếu không gian của
pixel với tọa độ (0, 0) nằm ở trên cùng, góc trái của hình ảnh. Lƣu ý trong hình 2.1
7
rằng giá trị của x tăng khi di chuyển từ trái sang phải và giá trị của y tăng từ trên
xuống dƣới.
Hình 1.5: Tham chiếu không gian của Pixel (0, 0)
Trong xử lý hình ảnh kỹ thuật số, một cảm biến hình ảnh chuyển đổi một hình
ảnh thành một số lƣợng pixel rời rạc. Cảm biến hình ảnh gán cho từng pixel một vị
trí số và mức màu xám hoặc giá trị màu chỉ định độ sáng hoặc màu của pixel.
1.2.2. T uộc tín của ìn ản số óa
Một hình ảnh số hóa có ba thuộc tính cơ bản: độ phân giải (resolution), định
nghĩa (definition) và số lƣợng mặt phẳng (number of planes).
1.2.2.1. Độ phân giải
Độ phân giải không gian của hình ảnh đƣợc xác định bởi số lƣợng hàng của nó và
các cột pixel. Một hình ảnh bao gồm m cột và n hàng có độ phân giải của m × n.
Hình ảnh này có m pixel dọc theo trục ngang của nó và n pixel dọc theo trục dọc
của nó.
1.2.2.2. Định nghĩa
Định nghĩa của một hình ảnh cho biết số lƣợng sắc thái mà ta có thể thấy trong
hình ảnh. Độ sâu bit của hình ảnh là số bit đƣợc sử dụng để mã hóa giá trị của một
pixel. Đối với độ sâu bit đã cho của n, hình ảnh có định nghĩa 2n, nghĩa là một pixel
có thể có 2n giá trị khác nhau. Ví dụ, nếu n bằng 8 bit, một pixel có thể có 256 giá
trị khác nhau từ 0 đến 255. Nếu n bằng 16 bit, một pixel có thể có 65.536 giá trị
khác nhau trong khoảng từ 0 đến 65.535 hoặc từ Nhận -32.768 đến 32.767.
8
1.2.2.3. Số lƣợng mặt phẳng màu
Số lƣợng mặt phẳng trong một hình ảnh tƣơng ứng với số lƣợng mảng pixel
tạo thành hình ảnh. Một hình ảnh thang độ xám hoặc giả màu gồm một mặt phẳng.
Một hình ảnh màu sắc thật bao gồm ba mặt phẳng: một cho mỗi thành phần màu đỏ,
thành phần màu xanh lục và thành phần xanh dƣơng. Trong ảnh màu trung thực,
cƣờng độ thành phần màu của pixel đƣợc mã hóa thành ba giá trị khác nhau. Một
hình ảnh màu là sự kết hợp của ba mảng pixel tƣơng ứng với các thành phần màu
đỏ, xanh lục và xanh lam trong hình ảnh RGB. Hình ảnh HSL đƣợc xác định bởi
màu sắc, độ bão hòa và độ chói của chúng.
1.2.3. C c loạ
ìn ản
1.2.3.1. Hình ảnh thang độ xám
Một hình ảnh thang độ xám bao gồm một mặt phẳng các pixel. Mỗi pixel là
đƣợc mã hóa bằng một trong các kiểu sau: Số nguyên không dấu 8 bit biểu thị các
giá trị thang độ xám giữa 0 và 255 Số nguyên có chữ ký 16 bit biểu thị các giá trị
thang độ xám giữa -32.768 và +32.767. Số dấu phẩy động đƣợc mã hóa bằng bốn
byte, đại diện cho các giá trị thang độ xám từ phạm vi -∞ đến ∞.
1.2.3.2. Ảnh màu
Một hình ảnh màu đƣợc mã hóa trong bộ nhớ dƣới dạng đỏ, lục và lam (RGB)
hoặc hình ảnh chứa màu sắc, độ bão hòa và độ chói (HSL). Pixel hình ảnh màu là
tổng hợp của bốn giá trị. Hình ảnh RGB lƣu trữ thông tin màu bằng cách sử dụng
Mỗi bit 8 bit cho các mặt phẳng đỏ, lục và lam. Màu sắc lƣu trữ hình ảnh HSL
thông tin sử dụng mỗi 8 bit cho màu sắc, độ bão hòa và độ chói. Hình ảnh RGB
U64 lƣu trữ thông tin màu bằng cách sử dụng 16 bit cho mỗi màu đỏ, xanh lá cây,
và các mặt phẳng màu xanh. Trong các mô hình màu RGB và HSL, thêm 8 bit giá
trị không đƣợc sử dụng. Đại diện này đƣợc gọi là 4 × 8 bit hoặc 32 bit mã hóa.
Trong mô hình màu RGB U64, giá trị 16 bit bổ sung sẽ tang không sử dụng Đại
diện này đƣợc gọi là mã hóa 4 × 16 bit hoặc 64 bit.
1.2.3.3. Hình ảnh phức tạp
9
Một hình ảnh phức tạp chứa thông tin tần số của hình ảnh thang độ xám. ta có
thể tạo một hình ảnh phức tạp bằng cách áp dụng biến đổi Fast Fourier (FFT) đến
một hình ảnh thang độ xám. Sau khi ta chuyển đổi hình ảnh thang độ xám thành
một hình ảnh phức tạp, ta có thể thực hiện các hoạt động miền tần số trên hình ảnh.
Mỗi pixel trong một hình ảnh phức tạp đƣợc mã hóa thành hai độ chính xác co giá
trị kiểu dấu phẩy động, đại diện cho các thành phần thực và ảo của pixel phức tạp.
ta có thể trích xuất bốn thành phần sau từ một hình ảnh phức tạp: phần thực, phần
ảo, cƣờng độ và pha.
1.2.3.4. File ảnh
Một tệp hình ảnh bao gồm một tiêu đề theo sau là các giá trị pixel. Tùy trên
định dạng tệp, tiêu đề chứa thông tin hình ảnh về độ phân giải ngang và dọc, định
nghĩa pixel và bảng màu gốc. Tệp hình ảnh cũng có thể lƣu trữ thông tin về hiệu
chuẩn, khớp mẫu mẫu và lớp phủ. Sau đây là các định dạng tệp hình ảnh phổ biến:
• Bitmap (BMP)
• Định dạng tệp hình ảnh đƣợc gắn thẻ (TIFF)
• Đồ họa mạng di động (PNG) cung cấp khả năng lƣu trữ thông tin hình ảnh
về hiệu chuẩn không gian, khớp mẫu mẫu và lớp phủ
• Định dạng nhóm ảnh chụp chung (JPEG)
• Định dạng tệp hình ảnh bên trong của National (AIPD) lƣu hình ảnh dấu
phẩy động, phức tạp và HSL .
Các định dạng tiêu chuẩn cho hình ảnh màu xám 8 bit và RGB là BMP, TIFF, PNG,
JPEG và AIPD. Các định dạng chuẩn cho thang độ xám 16 bit, 64 bit RGB và hình
ảnh phức tạp là PNG và AIPD.
1.2.4. Không gian màu RGB, HSV, LAB
1.2.4.1. Không gian màu RGB
Hầu hết các hình ảnh kỹ thuật số đƣợc lƣu trữ dƣới dạng hình ảnh RGB và phải
đƣợc chuyển đổi sang không gian màu khác. Một màu trong không gian RGB đƣợc
chỉ định với một tọa độ đỏ(R), lục(G) và lam(B) và mỗi kênh là 8 bit, nghĩa là nó
có giá trị có thể. Để đơn giản, chúng ta có thể ràng buộc mỗi kênh này trong khoảng
10
từ 0 đến 1, với 0 là không có đóng góp nào từ kênh màu đó và 1 là tối đa. Ví dụ,
màu xanh lam thuần khiết có bộ ba RGB là đỏ = 0, xanh lục = 0 và xanh lam = 1
hoặc [0, 0, 1]. Màu vàng là [1, 1, 0], có nghĩa là màu xanh lam và màu vàng nằm ở
hai đầu đối diện của không gian màu RGB:28= 256
Hình 1.6: Không gian màu RGB
Mô hình màu RGB đƣợc thực hiện theo nhiều cách khác nhau, tùy thuộc vào khả
năng của hệ thống đƣợc sử dụng. Cho đến nay, hiện thân phổ biến nhất đƣợc sử
dụng phổ biến nhất vào năm 2006 là triển khai 24 bit , với 8 bit hoặc 256 mức màu
riêng biệt trên mỗi kênh . Do đó, bất kỳ không gian màu nào dựa trên mô hình RGB
24 bit nhƣ vậy đều bị giới hạn trong phạm vi 256 × 256 × 256 ≈ 16,7 triệu
màu. Một số triển khai sử dụng 16 bit cho mỗi thành phần với tổng số 48 bit, dẫn
đến cùng một gam màu với số lƣợng lớn hơn các màu riêng biệt. Điều này đặc
biệt quan trọng khi làm việc với không gian màu có gam rộng (nơi hầu hết các
màu phổ biến hơn nằm tƣơng đối gần nhau) hoặc khi một số lƣợng lớn các thuật
toán lọc kỹ thuật số đƣợc sử dụng liên tiếp. Nguyên tắc tƣơng tự áp dụng cho bất
kỳ không gian màu nào dựa trên cùng một mô hình màu, nhƣng đƣợc thực hiện ở
các độ sâu bit khác nhau .
1.2.4.2. Không gian màu HSV
Không gian của nó tạo thành một hình nón duy nhất:
Hue: Màu cơ bản trong bánh xe màu, nằm trong khoảng từ 0 đến 360 độ trong đó
cả 0 và 360 độ đều là màu đỏ.
ộ bão hòa: Màu sắc tinh khiết (so với xỉn màu) nhƣ thế nào, nằm trong khoảng từ
0 đến 100, trong đó 100 là bão hòa hoàn toàn và 0 là màu xám.
11
Giá trị: Thể hiện độ sáng màu, nằm trong khoảng từ 0 đến 100, trong đó 100 càng
sáng và 0 càng tối .
Hình 1.7: Không gian màu HSV
1.2.4.3. Không gian màu Lab
Không gian CIELAB màu (còn gọi là CIE L* a* b* hoặc đôi khi không chính
thức viết tắt là "phòng thí nghiệm") là một không gian màu đƣợc xác định bởi
các ủy ban quốc tế về chiếu sáng (viết tắt là CIE) vào năm 1976. Nó thể hiện màu
sắc nhƣ ba giá trị: L* cho độ đậm nhạt từ đen (0) sang trắng (100), a* từ xanh lục(-)
sang đỏ (+), và b* từ xanh lam (-) sang vàng (+). CIELAB đƣợc thiết kế sao cho
cùng một lƣợng thay đổi bằng số trong các giá trị này tƣơng ứng với gần nhƣ cùng
một lƣợng thay đổi trực quan.
Vì ba tham số đƣợc đo nên bản thân không gian là một không gian số thực ba
chiều , cho phép có vô số màu có thể. Trong thực tế, không gian thƣờng đƣợc ánh
xạ vào một không gian số nguyên ba chiều để biểu diễn kỹ thuật số, và do đó các
giá trị L*, a* và b* thƣờng là tuyệt đối, với một phạm vi đƣợc xác định trƣớc. Giá
trị độ đậm nhạt , L* , biểu thị màu đen đậm nhất ở L* = 0 và màu trắng sáng nhất
ở L* = 100. Các kênh màu, a* và b* , biểu thị các giá trị xám trung tính thực
tại a* = 0 và b* = 0. Dấu *trục đại diện cho thành phần màu xanh lá cây-đỏ, với
màu xanh lá cây theo hƣớng âm và màu đỏ theo hƣớng dƣơng. Các b* trục đại diện
cho thành phần màu xanh-vàng, với màu xanh theo hƣớng tiêu cực và vàng theo
hƣớng tích cực. Tỷ lệ và giới hạn của trục a* và b* sẽ phụ thuộc vào cách triển khai
cụ thể, nhƣ đƣợc mô tả bên dƣới, nhƣng chúng thƣờng chạy trong phạm vi ± 100
hoặc −128 đến +127 (số nguyên 8 bit có dấu).
- Xem thêm -