Tài liệu Nhận dạng thức ăn rau quả tươi bằng hình ảnh

.PDF

635

116

nganguyen Báo vi phạm

Tải xuống 116

Mô tả:

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG --------------------------------------- Nguyễn Thị Hồng NHẬN DẠNG THỨC ĂN RAU QUẢ TƢƠI BẰNG HÌNH ẢNH Chuyên ngành: Khoa học máy tinh Mã số: 604801 TÓM TẮT LUẬN VĂN THẠC SĨ HÀ NỘI – 2013 Luận văn đƣợc hoàn thành tại: HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG Ngƣời hƣớng dẫn khoa học: Tiến sĩ Phạm Văn Cƣờng Phản biện 1: …………………………………………………………………………… Phản biện 2: ………………………………………………………………………….. Luận văn sẽ đƣợc bảo vệ trƣớc Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bƣu chính Viễn thông Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ............... Có thể tìm hiểu luận văn tại: - Thƣ viện của Học viện Công nghệ Bƣu chính Viễn thông MỞ ĐẦU 1. Lý do chọn đề tài Thức ăn hàng ngày là một phần tất yếu của cuộc sống. Thức ăn với chế độ dinh dƣỡng hợp lý sẽ đem lại sức khỏe tốt cho con ngƣời. Ngƣợc lại, chế độ dinh dƣỡng không hợp lý có thể dẫn tới bệnh tật. Một trong số những bệnh thƣờng gặp là bệnh tiểu đƣờng. Nó liên quan mật thiết tới chế độ ăn hàng ngày. Trong những năm gần đây, bệnh tiểu đƣờng (hay còn gọi là đái tháo đƣờng) đang trở thành vấn đề lo ngại lớn đối với giới y khoa và cả cộng đồng. Một nghiên cứu cho thấy khoảng 73 triệu ngƣời ở Hoa Kỳ, hoặc bị bệnh hoặc đang có nguy cơ mắc bệnh. Hơn nữa, tổng chi phí trực tiếp và gián tiếp liên quan đến bệnh tiểu đƣờng khoảng 132 tỷ đồng ở Hoa Kỳ [8]. Ở Việt Nam, theo tính toán của Hội ngƣời giáo dục bệnh đái tháo đƣờng Việt Nam cho thấy: Tỷ lệ ngƣời mắc bệnh đái tháo đƣờng năm 2002 chiếm 2,7%, đến 2008 đã tăng lên 5,7% dân số. Tỷ lệ ngƣời mắc bệnh đái tháo đƣờng ở các thành phố lớn chiếm tỷ lệ 7,2% dân số. Theo dự kiến ngƣời mắc tiểu đƣờng sẽ tăng lên khoảng 7-8 triệu ngƣời vào năm 2025. Đây chính là con số đáng báo động cho thấy tốc độ ra tăng rất nhanh về số lƣợng ngƣời bệnh. Nghiêm trọng hơn thực trạng bệnh tiểu đƣờng đang bị trẻ hóa do béo phì gây ra nhiều biến chứng khó lƣờng. Điều này cho thấy cần có một chế độ dinh dƣỡng khoa học riêng cho từng cá nhân đảm bảo cuộc sống mà vẫn duy trì đƣợc trọng lƣợng cơ thể ở mức cần thiết. Một hệ thống nhận dạng thức ăn hàng ngày dựa trên điện thoại di động với một chi phí thấp, tự động, mang tính cá nhân là cần thiết. 2. Mục đích nghiên cứu Hệ thống nhận dạng thức ăn hàng ngày dựa trên điện thoại di động giúp cho ngƣời dùng quản lý và theo dõi chế độ dinh dƣỡng hàng ngày hiệu quả và thuận tiện hơn trong việc giữ gìn sức khỏe và giảm cân liên quan đến ứng dụng. Đối với ngƣời bệnh tiểu đƣờng thì những dữ liệu đƣợc ghi và hiển thị cũng sẽ hỗ trợ ngƣời chăm sóc và chuyên gia y tế của họ cung cấp các hình thức điều trị chính xác hơn. 3. Đối tượng và phạm vi nghiên cứu Tuy nhiên, trên thực tế thức ăn hàng ngày rất đa dạng phong phú và rất khó nhận dạng vì đặc điểm bên ngoài của chúng có thể khá giống nhau ví dụ nhƣ thịt lợn và thịt bò. Nên trong khuôn khổ luận văn này em xin đƣợc tập trung vào nhận dạng thức ăn rau quả tƣơi trong giai đoạn tiền chế biến. Đóng góp chính của luận văn này là phát triển một hệ thống nhận dạng rau quả tƣơi trên điện thoại di động bằng việc phân loại hình ảnh của chúng. 4. Phương pháp nghiên cứu Luận văn sử dụng thuật toán phân cụm K-means để phân đoạn ảnh rau quả, và thuật toán hỗ trợ máy vector (SVM) để phân loại thực phẩm rau quả. Dữ liệu về hình ảnh rau quả (khoảng 3000 – 4000 ảnh từ 10 loại rau, quả khác nhau) sẽ đƣợc thu thập bằng điện thoại di động với độ phân giải thấp và thuật toán nhận dạng sẽ đƣợc đánh giá trên tập dữ liệu này. CHƢƠNG 1 TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG THỰC PHẨM Chƣơng này nói về sự cần thiết phải xây dựng bài toán nhận dạng thực phẩm. Một số hạn chế của những bài toán nhận dạng thực phẩm trƣớc đó. Cách tiếp cận với bài toán nhận dạng rau quả tƣơi thông qua hình ảnh chụp từ điện thoại di động. Một số vấn đề có thể gặp phải khi xử lý ảnh. 1.1 Đặt vấn đề Hiện nay, chất lƣợng sống của ngƣời dân đƣợc nâng cao, những đáp ứng về nhu cầu thực phẩm của mỗi ngƣời đôi khi trở nên dƣ thừa. Đây chính là những nguyên nhân gây béo phì từ đó phát sinh nhiều bệnh là điều khó tránh. Bệnh phổ biến thƣờng gặp là bệnh tiểu đƣờng. Từ năm 2006 bệnh tiểu đƣờng đã đƣợc Liên hiệp quốc công nhận là căn bệnh mãn tính nguy hiểm gây ảnh hƣởng tới cuộc sống toàn nhân loại. Theo Tổ chức Y tế thế giới (WHO) và Liên đoàn Đái tháo đƣờng thế giới (IDF) Việt Nam không phải là quốc gia có tỷ lệ đái tháo đƣờng lớn nhất thế giới, nhƣng bệnh đái tháo đƣờng ở Việt Nam phát triển nhanh nhất thế giới. Đối tƣợng mắc bệnh đái tháo đƣờng thƣờng ở độ tuổi từ 30-65, tuy nhiên hiện nay có những bệnh nhân đái tháo đƣờng mới chỉ 9-10 tuổi, điều này phản ánh sự trẻ hóa về bệnh này ở nƣớc ta Vấn đề kiểm soát ăn uống trở nên vô cùng hệ trọng cho từng trƣờng hợp cá biệt. Ngƣời bệnh tiểu đƣờng cần có chế độ ăn uống hợp lý và rau quả là nguồn dinh dƣỡng tốt nhất. Chính vì vậy mà áp dụng một chƣơng trình dinh dƣỡng hợp lý là một trong những biện pháp điều trị căn bản và quan trọng không chỉ giúp phòng ngừa bệnh tiểu đƣờng mà còn giúp phòng ngừa hàng loạt các bệnh mãn tính khác nhƣ tim mạch, cao huyết áp, ung thƣ,… Nhờ đó mà cuộc sống của những thành viên trong cộng đồng xã hội đƣợc cải thiện. Với thực phẩm cho mỗi bữa ăn rất đa dạng cần lựa chọn thực phẩm thế nào cho phù hợp đang là những băn khoăn cho nhiều bà nội trợ. Họ cần rất nhiều hiểu biệt về vấn đề này cũng nhƣ cần có những hỗ trợ riêng để ƣớc tính lƣợng calo từ thực phẩm cung cấp cho các bữa ăn hàng ngày. Nhu cầu năng lƣợng cho ngƣời già, ngƣời lao động, ngƣời trẻ, trẻ em, ngƣời bệnh,…. Để có đƣợc tƣ vấn thƣờng xuyên của các chuyên gia Y tế là một hạn chế và tốn kém. Do đó, một hệ thống nhận dạng thức ăn trên mobile trợ giúp cho ngƣời bình thƣờng ăn kiêng, giảm cân...và đặc biệt không chỉ cho ngƣơi bệnh tiểu đƣờng mà những ngƣời bệnh khác một chế độ dinh dƣỡng hợp lý là băt buộc và cần thiết. 1.2 Nghiên cứu trước đây Một hệ thống quản lý chế độ dinh dƣỡng của ngƣời bệnh tiểu đƣờng tại Đại học Carnegie Mellon dựa trên thực đơn ghi lại thực phẩm tiêu thụ hàng ngày[8]. Hệ thống làm giảm thời gian tƣơng tác ngƣời dùng với thiết bị, là một kỹ thuật nhận dạng tự động thực phẩm để theo dõi lƣợng calo. Wellness Nokia Diary là một thiết bị dựa trên ứng dụng di động cũng cho phép theo dõi sức khỏe hàng ngày của ngƣời sử dụng[11], yêu cầu ngƣời dùng nhập thông tin về thói quen ăn uống của họ. Nhận dạng thực phẩm tự động dựa trên hình ảnh là rất khó khăn. Trƣớc đây, những nghiên cứu bị giới hạn trong một số loại thực phẩm cụ thể nhƣ cá, thịt, hoặc trái cây họ cam quýt ngành công nghiệp [2] [3] [4]. Phƣơng pháp phân loại thực phẩm dựa trên màu sắc cho thực phẩm đã chế biến nhƣ thịt và cá đƣợc phát hiện với một bộ lọc để tách thực phẩm với nền hình ảnh. Những thuật toán SFBB (Safer Food, Better Business), hay thuật toán SVM đã đƣợc sử dụng để phân loại thực phẩm cũng rất hiệu quả[3]. Sự nhận dạng thực phẩm còn dựa trên sự sắp xếp thức ăn trên đĩa hay đƣợc quy định bởi các ngăn chia [6] [7]. Không có phƣơng pháp nào đáp ứng đƣợc yêu cầu dinh dƣỡng hàng ngày cho ngƣời bệnh.Việc sử dụng điện thoại di động hỗ trợ chế độ dinh dƣỡng hợp lý thông qua hình ảnh là một phƣơng pháp đáng kể. Nó kết nối nhanh khoảng cách giữa sức khỏe cá nhân và công nghệ, ngƣời dùng và thông tin dinh dƣỡng của họ,bằng cách giám sát thực phẩm dựa trên thiết bị tính toán cầm tay cá nhân. Cho phép họ theo dõi tình trạng sức khỏe hàng ngày để giảm chi phí y tế tổng thể. 1.3 Cách tiếp cận Do đó, việc xây dựng một hệ thống nhận dạng thức ăn rau quả tƣơi bằng hình ảnh là cần thiết, nó mang tính cá nhân với chi phí thấp, rất tiện lợi cho ngƣời dùng. Từ thực phẩm đƣợc nhận dạng sẽ ƣớc tính lƣợng calo tƣơng ứng cho mỗi loại. Đây cũng là giải pháp cho vấn đề quản lý dinh dƣỡng đã đƣợc đề cập ở trên. Hình ảnh thức ăn rau củ quả có đƣợc từ ngƣời dùng chụp với điện di động có độ phân giải thấp. Từ những hình ảnh này hệ thống sẽ thực hiện phân loại thực phẩm qua hai bƣớc: phân đoạn và làm mịn ảnh. Mỗi hình ảnh có đƣợc là từ bề mặt của các loại rau, quả, củ, số lƣợng màu sắc chƣa xác định, một phƣơng thức không có giám sát là cần thiết để phân vùng ảnh. Và thuật toán phân cụm K-mean đƣợc thực hiện cho việc phân đoạn màu sắc thực của ảnh. Khi chụp hình trong khung cảnh thực những hình ảnh chứa đựng những đối tƣợng xung quanh đầy ý nghĩa, làm phát sinh một số cụm (nhỏ) không có liên quan đến đối tƣợng quan tâm. Để loại bỏ những đối tƣợng này, ta áp dụng các toán tử hình thái [13] (mathematical morphology) bao gồm open và close để làm mịn hình ảnh phân đoạn. Vùng chính cần quan tâm có thức ăn sẽ đƣợc trích xuất bằng việc sử dụng các thuộc tính màu sắc và SURF cho việc xác nhận thức ăn. Cuối cùng thực hiện sự phân lớp ảnh cho việc xác nhận từng loại thức ăn dựa trên đặc trƣng SURF và thuộc tính màu sắc thông qua thuật toán máy hỗ trợ vector (SVM) Hình ảnh của Rau, quả, củ,… Hình ảnh từng loại thực phẩm Ảnh đã phân đoạn Phân đoạn (K-mean) Vectơ đặc trƣng Phân loại (SVM) 1.4 Một số vấn đề 1.4.1 Những hưóng công nhận hình ảnh chung Hình ảnh thực phẩm chụp đƣợc từ ngƣời dùng đƣợc thu nhận từ rất nhiều hƣớng khác nhau. Để xác định rõ từng loại đối tƣợng thực phẩm là rất phức tạp và có nhiều khía cạnh cần đƣợc xem xét hoặc bị bỏ qua. Ta có thể xem xét một số trƣờng hợp cụ thể nhƣ sau: Sự co giãn của hình ảnh: Hình ảnh thực phẩm có thể đƣợc chụp từ những khoảng cách khác nhau: sự chụp hình xa, gần, nghiêng, thẳng, trên xuống…Những khoảng cách hay góc chụp này tạo cho ngƣời xem một cảm nhận chƣa chính xác về kích thƣớc thực của các thực phẩm trong hình. Và khó phân biệt lƣợng thực phẩm đủ dùng, nhỏ, hay lớn. Hướng chụp hình: Hình ảnh của các thực phẩm có thể chụp từ nhiều hƣớng khác nhau: Chụp chính diện thực phẩm này nhƣng lại chụp đƣợc góc của thực phẩm kia... Nhƣ trong hình 1.1 có thể thấy ở góc chụp này quả ớt ngọt, quả táo xanh có kích thƣớc lớn hơn, quả táo tàu trông lại nhỏ đi. Hay các phạm vi về màu sắc, kết cấu, hình dạng thực phẩm trong bức ảnh có thể thay đổi đáng kể ở mỗi góc chụp khác nhau. Phụ thuộc chất lượng mỗi máy ảnh: Và không phải tất cả các máy điện thoại di động đều cho cùng một chất lƣợng ảnh nhƣ nhau. Với mỗi máy điện thoại di động sẽ có những thiết lập về độ sáng, độ phân giải, độ co giãn khung hình đƣợc thực hiện khác nhau. Cũng với cùng một máy ảnh nhƣng mỗi ngƣời chụp lại cho hình ảnh khác nhau. Điều này sẽ làm thay đổi chất lƣợng của hình ảnh thực phẩm. Điều kiện ánh sáng môi trường: Đây là yếu tố bên ngoài nhƣng lại ảnh hƣởng rất lớn tới độ sáng của khung hình. Không phải tất cả các hình ảnh sẽ đƣợc thực hiện trong cùng một điều kiện ánh sáng nhƣ nhau. Mỗi sự thay đổi nhỏ trong ánh sáng cũng tạo ra những hình ảnh khác nhau đáng kể. Điều này tạo nên sự biến dạng trong nhiều đặc trƣng trích chọn của các mẫu thực phẩm. 1.4.2 Những vấn đề có thể gặp trong quá trình xử lý ảnh Khi xử lý ảnh cho bƣớc đầu tiên trong phân đoạn ảnh ta sẽ gặp một số trƣờng hợp nhƣ: Vị trí thực phẩm trong hình: Thứ tự hình ảnh đứng trƣớc, đứng sau, hay chỉ thấy đƣợc một góc của thực phẩm. Việc này làm tăng tính phức tạp trong việc xác nhận hình ảnh thực của mỗi loại thực phẩm có trong hình. Sự đa dạng về hình dạng: Không phải tất cả các loại thực phẩm sẽ có hình dạng giống nhau cho mỗi lần chụp. Mỗi bức ảnh tuy chụp cùng một khung cảnh nhƣng sẽ cho các hình dạng khác nhau với mỗi loại thực phẩm. Sự thay đổi trong kết cấu hình ảnh: điều kiện ánh sáng khác nhau và điều kiện kết hợp các thành phần thực phẩm trong mỗi hình cũng khác nhau, cũng nhƣ việc tạo một phông nền lộn xộn gây khó khăn cho việc phát hiện đối tƣợng cần quan tâm 1.5 Phạm vi nghiên cứu Thực phẩm xung quanh chúng ta rất đa dạng và cực kỳ phong phú. Có rất nhiều loại với hình dạng bên ngoài của chúng có thể rất giống nhau về màu sắc, hình dạng và kích thƣớc nhƣ các loại trứng gà và trứng vịt, thịt bê và thịt bò, quả bí và quả mƣớp, …. Để có một hệ thống phát hiện chính xác và trực tiếp nhiều nguồn thực phẩm nhƣ vậy cần rất nhiều các trích chọn đặc trƣng riêng cho từng loại về màu sắc, hình dạng, kích thƣớc của mỗi loại đƣợc sử dụng cho quá trình nhận dạng. Việc làm này đòi hỏi rất nhiều thời gian cho quá trình thu thập dữ liệu. Tuy nhiên luận văn chỉ dừng lại ở việc nhận dạng rau quả tƣơi trong giai đoạn tiền chế biến hỗ trợ dinh dƣỡng cho mỗi ngƣời. 1.6 Các giả định Để hình ảnh đƣợc rõ nét, dễ phân loại thực phẩm. Ta có thể xem xét hình ảnh theo các giả định sau: Không chạm vào các đối tượng: Để hạn chế khả năng bị che đi của các đối tƣợng, dễ dàng hơn cho việc phân cụm ảnh. Chụp được đối tượng tổng thể: Chụp đƣợc hình ảnh tổng thể sẽ dễ dàng hơn trong nhận biết đối tƣợng dựa trên hình dạng, màu sắc, kích thƣớc thực của chúng. Có một màu nền chung: Thuận tiện hơn cho việc phân đoạn ảnh chỉ cẩn tập trung vào những đối tƣợng phát hiện đƣợc nhƣ trên nền trắng của khay đựng đồ Nền nhẹ hơn các đối tượng: Để cho phép cho một kỹ thuật đơn giản hóa thích nghi cho loại bỏ nền Tối thiểu bóng tối và ánh sáng không có đèn flash: Để tránh trƣờng hợp các đặc trƣng hàng thực phẩm bị tổn hại do phát hiện không đúng của bóng hoặc các điểm đèn flash. 1.7 Kết luận Nhƣ vậy, tuỳ chọn sử dụng tĩnh nhƣ là một bối cảnh áp dụng cho việc lọc ra các mẫu đặc trƣng để phân loại thực phẩm từ hình ảnh có đƣợc. Một số lƣợng lớn bệnh nhân tiểu đƣờng rơi vào ngƣời mù và ngƣời già trong cộng đồng. Những nhóm này có thể không thoải mái sử dụng điện thoại di động và khả năng tiếp cận hệ thống với nhiều lý do khác nhau. Do đó, phần mềm cũng cần mang lại tính tự động hóa hơn nữa trong việc giám sát thực phẩm bằng các menu, thông qua việc thừa nhận hình ảnh tự động của thực phẩm bằng cách tận dụng bảng thiết bị trên máy ảnh và Wifi Nghiên cứu sử dụng thêm các thiết bị di động để đạt đƣợc bối cảnh hữu ích nhƣ hệ thống thời gian và sở thích của ngƣời sử dụng dựa trên các bộ lọc theo ngữ cảnh để áp dụng vào phƣơng pháp nhận dạng hình ảnh dựa trên thực phẩm. CHƢƠNG 2 THUẬT TOÁN NHẬN DẠNG THỰC PHẨM 2.1 Giới thiệu Chƣơng này trình bày hai thuật toán chính sử dụng trong hệ thống nhận dạng thực phẩm bằng hình ảnh là thuật toán K-mean và thuật toán máy hỗ trợ vector (SVM). Cách phân đoạn ảnh đầu vào dựa trên thuật toán K-mean để trích chọn các đặc trƣng. Và sử dụng thuật toán SVM cho phân loại ảnh. 2.2 Phân đoạn ảnh và tiền xử lý 2.2.1 Phân đoạn ảnh bằng thuật toán K-MEAN K-Mean là thuật toán rất quan trọng và đƣợc sử dụng phổ biến trong kỹ thuật phân cụm. Tƣ tƣởng chính của thuật toán K-Mean là tìm cách phân nhóm các đối tƣợng đã cho vào K cụm (K là số các cụm đƣợc xác đinh trƣớc, K nguyên dƣơng) sao cho tổng bình phƣơng khoảng cách giữa các đối tƣợng đến tâm nhóm là nhỏ nhất. Bài toán phân cụm dữ liệu trong thuật toán K-mean: Cho tập các điểm D = {x1, x2,…, xn}, Trong đó xi = (xi1, xi2,…, xir) là một vector có r chiều trong không gian Rr, và r là một số thuộc tính của tập dữ liệu D. Giải thuật K-Mean phân cụm dữ liệu dựa trên khoảng cách Euclidean nhỏ nhất giữa đối tƣợng đến phần tử trung tâm của các nhóm. Khoảng cách Euclidean Ta giả sử: xi = (xi1, xi2,…, xir) - đối tƣợng thứ i cần phân phân loại, (i=1..n) cj = (cj1, cj2,…, cjr) - phần tử trung tâm nhóm j (j=1..k) Khoảng cách Euclidean từ đối tƣợng ai đến cj (phần tử trung tâm nhóm j) đƣợc tính toán dựa trên công thức:  ji  m  ( x is  x js ) 2 (2.1) s 1 Trong đó:  ji - khoảng cách Euclidean từ ai đến cj xis - thuộc tính thứ s của đối tƣợng xi x js - thuộc tính thứ s của phần tử trung tâm cj Phần tử trung tâm của nhóm đƣợc xác định bằng giá trị trung bình các phần tử trong nhóm. Phần tử trung tâm k phần tử trung tâm (k nhóm) ban đầu đƣợc chọn ngẫu nhiên, sau mỗi lần nhóm các đối tƣợng vào các nhóm, phần tử trung tâm đƣợc tính toán lại. Clusteri{x1, x2,…, xt} – Nhóm thứ i i=1..k, k số số nhóm cần phân chùm ; j= 1..r, r số thuộc tính t - số phần tử hiện có của nhóm thứ I; xsj - thuộc tính thứ j của phần tử s s=1..t cij - toạ độ thứ j của phần tử trung tâm nhóm i; t c ji   x sj s 1 (2.2) t Giải thuật K- mean: 1. Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster). Mỗi cụm đƣợc đại diện bằng các tâm của cụm. 2. Tính khoảng cách giữa các đối tƣợng (objects) đến K tâm (thƣờng dùng khoảng cách Euclidean) 3. Nhóm các đối tƣợng vào nhóm gần nhất 4. Xác định lại tâm mới cho các nhóm 5. Thực hiện lại bƣớc 2 cho đến khi không có sự thay đổi nhóm nào của các đối tƣợng Phân đoạn ảnh là bƣớc đầu tiên trong quá trình xử lý ảnh. Quá trình này thực hiện phân vùng ảnh thành các vùng rời rạc và đồng nhất với nhau, nó chính là việc xác định các biên của các vùng ảnh đó. Mỗi vùng gồm một nhóm điểm ảnh liên thông hoặc đồng nhất theo một tiêu chí lựa chọn nhƣ màu sắc, hình dạng, kết cấu, …. Sau khi phân đoạn mỗi điểm ảnh chỉ thuộc về một vùng duy nhất. Những vùng ảnh đồng nhất này thông thƣờng sẽ tƣơng ứng với toàn bộ hay từng phần của các đối tƣợng thật sự có trong ảnh. Giả sử màu sắc bề mặt của các đối tƣợng trong ảnh là một thuộc tính không đổi và màu sắc đó đƣợc ánh xạ vào một không gian 2 chiều và màu. Khi đó áp dụng giải thuật phân cụm K-mean cho việc xác định các cụm màu, mỗi cụm màu có tập các điểm ảnh tƣơng tự nhau. 2.2.2 Tiền xử lý Để việc nhận dạng ảnh chỉ tập trung vào đúng đối tƣợng quan tâm. Ta cần loại bỏ những đối tƣợng không liên quan tới nhận dạng nhƣ phông nền xung quanh đối tƣợng quan tâm, dụng cụ xử lý thực phẩm, vật đựng thực phẩm,… Nhằm tăng cƣờng chất lƣợng ảnh, mà công đoạn tiền xử lý là bƣớc đầu tiên nhằm loại bỏ nhiễu, khắc phục những khiếm khuyết do bƣớc thu nhận ảnh không tốt là việc làm quan trọng. Có nhiều phƣơng pháp cho việc nâng cao chất lƣợng ảnh nói chung và tiền xử lý nói riêng. Trong giai đoạn này, chúng tôi sử dụng các toán tử hình thái (mathematic morphology) bao gồm các toán tử mở (open) và đóng (close) ảnh [15] để loại bỏ phần nhiễu có trong ảnh thu nhập đƣợc. 2.3 Trích chọn đặc trưng 2.3 .1 Đặc trưng màu Màu sắc là một đặc trƣng nổi bật dựa trên bề mặt của các đối tƣợng trong ảnh.. Mỗi một điểm ảnh (thông tin màu sắc) có thể đƣợc biểu diễn nhƣ một điểm trong không gian màu sắc ba chiều: RGB. Rút trích đặc trƣng màu đƣợc tiến hành tính toán trong biểu đồ màu cho mỗi ảnh để xác định tỉ trọng các điểm ảnh của ảnh chứa các giá trị đặc biệt (màu sắc). 2.3 .2 Đặc trưng SURF Những đặc trƣng mạnh (SURF) [9] đƣợc biết đến nhƣ một trong những phát hiện thuộc tính mạnh mẽ nhất và đƣợc sử dụng trong rất nhiều đối tƣợng hiệu chỉnh [10,11]và xác nhận đối tƣợng các ứng dụng [12]. SURF cũng đƣợc biết đến rất nhiều để xử lý mờ. Hơn nữa, đặc trƣng SURF cũng bất biến về hƣớng và độ co giãn. Những đặc trƣng này là rất quan trọng để phân lớp các thành phần có trong thực phẩm dựa trên bề mặt, nhƣ vị trí của thực phẩm rất đa dạng và có nhiều kích thƣớc khác nhau (nhƣ củ cà rốt con chụp cận cảnh thành một củ cà rốt lớn). Trong khi một bộ nhận dạng SURF bao gồm những mô tả đặc trƣng giống nhƣ góc, cạnh và điểm, nhƣng chuẩn SURF lại không bao gồm màu sắc. Tuy nhiên, thông tin màu sặc cũng rất quan trọng cho việc mô tả giữa các thành phần thực phẩm, trong việc thêm vào các đặc tính SURF, và sử dụng chúng trong xác nhận các điểm ảnh. 2.3.3 Đặc trưng kết cấu (texture) Kết cấu là một đối tƣợng dùng để phân hoạch ảnh ra thành những vùng quan tâm để phân lớp những vùng đó. Kết cấu cung cấp thông tin về sự sắp xếp về mặt không gian của màu sắc và cƣờng độ một ảnh. Kết cấu đƣợc đặc trƣng bởi sự phân bổ không gian của những mức cƣờng độ trong một khu vực gần nhau. Kết cấu gồm các kết cấu gốc hay nhiều kết cấu gộp lại đôi khi gọi là texel. 2.3.4 Vector đặc trưng Để phân lớp thực phẩm, một bộ rút trích đặc trƣng (feature extractor -FE) đƣợc thực hiện để hoàn thành 2 thủ tục chính. Một là sự thực hiện của máy dò Fast_Hessian, và một biểu đồ màu RGB. Đầu vào của FE là một hình ảnh phân đoạn bằng cách thực hiện thuật toán phân cụm KMean, đầu ra của chúng là 2 danh sách: một danh sách chứa 64 phần tử của những điểm quan tâm SURF (đặc trƣng SURF) S = (s1, s2,. .., S64), và danh sách kia là một biểu đồ 64 màu sắc C = (c1, c2, ..., C64). Sau khi bình thƣờng hóa, các danh sách này đƣợc kết hợp thành một đặc trƣng vector trong 128-phần tử vector đặc trƣng: V = [α * s1, α * s2, .., α * S64, (1-α) * C65, (1-α) * C66, ..., (1-α) * C128] trong đó α là một trọng lƣợng bằng mà SURF và các đặc trƣng kết hợp màu sắc đƣợc xếp hạng tƣơng ứng. Trong thí nghiệm của chúng tôi, giá trị của α = 0,4 đƣợc heuristically chọn (bằng cách đánh giá giá trị khác nhau của α trong một nghiên cứu thí điểm). 2.4 Phân loại hình ảnh 2.4.1 Thuật toán máy hỗ trợ vector (SVM) 2.4.1.1 Bài toán phân lớp: Phân lớp là một tiến trình xử lý nhằm xếp các mẫu dữ liệu hay các đối tƣợng vào một trong các lớp đã đƣợc định nghĩa trƣớc. Các mẫu dữ liệu hay các đối tƣợng đƣợc xếp vào các lớp dựa vào giá trị của các thuộc tính cho một mẫu dữ liệu hay đối tƣợng. Sau khi đã xếp tất cả các đối tƣợng đã biết trƣớc vào các lớp tƣơng ứng thì mỗi lớp đƣợc đặc trƣng bởi tập các thuộc tính của các đối tƣợng chứa trong lớp đó. Quá trình phân lớp còn đƣợc gọi là quá trình gán nhãn cho các tập dữ liệu. Nhiệm vụ của bài toán phân lớp dữ liệu là cần xây dựng mô hình (bộ) phân lớp để khi có một dữ liệu mới vào thì mô hình phân lớp sẽ cho biết dữ liệu đó thuộc lớp nào. Có nhiều cách để biểu diễn một mô hình phân lớp và có rất nhiều thuật toán giải quyết nó. Các thuật toán phân lớp tiêu biểu bao gồm nhƣ mạng neural, cây quyết định, suy luận quy nạp, mạng Beyesian, Support Vector Machine (SVM),… Trong các kỹ thuật đó, SVM đƣợc coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho phân lớp dữ liệu lớn và nhiều chiều. 2.4.1.2 Thuật toán máy hỗ trợ vector (SVM) Thuật toán máy hỗ trợ vector (SVM) xây dựng một siêu phẳng hoặc một tập hợp các siêu phẳng trong một không gian nhiều chiều hoặc vô hạn chiều, có thể đƣợc sử dụng cho phân loại, hồi quy, hoặc các nhiệm vụ khác. Mục tiêu của thuật toán là xác định xem một điểm dữ liệu mới sẽ thuộc về lớp nào. Mỗi điểm dữ liệu đƣợc biểu diễn dƣới dạng một vector p -chiều, và ta muốn biết liệu có thể chia tách hai lớp dữ liệu bằng một siêu phẳng p − 1 chiều. Đây gọi là phân loại tuyến tính. 2.4.1.3 SVM cho bài toán phân lớp tuyến tính (SVMS) Hình thức đơn giản của việc phân lớp là phân lớp nhị phân: phân biệt giữa các đối tƣợng thuộc về một trong hai lớp: dƣơng (+1) hoặc âm (-1). SVMs sử dụng hai khái niệm để giải quyết vấn đề này: phân lớp biên rộng và hàm kernel. Ý tƣởng của phân lớp biên rộng có thể đƣợc minh họa bởi sự phân lớp của các điểm trong không gian hai chiều (Hình 2.1). Một cách đơn giản để phân lớp các điểm này là sử dụng một đƣờng thẳng để phân tách các điểm nằm ở một bên là dƣơng và các điểm bên kia là âm. Nếu có hai đƣờng thẳng phân chia tốt thì ta có thể phân tách khá xa hai tập dữ liệu (Hình 2.1 và 2.2). Đây là ý tƣởng về sự phân chia biên rộng. Hình 2.1: Một đường thẳng tuyến tính phân chia 2 lớp điểm (hình vuông và hình tròn) trong không gian hai chiều. Ranh giới quyết định chia không gian thành hai tập tùy thuộc vào dấu của hàm f (x) = + b. Hình 2.2: Độ rộng biên lớn nhất được tính toán bởi một SVMs tuyến tính. Khu vực giữa hai đƣờng mảnh xác định miền biên với -1 ≤ + b ≤ 1. Những điểm sáng hơn với chấm đen ở giữa gọi là các điểm support vectors, đó là những điểm gần biên quyết định nhất. Ở đây, có ba support vectors trên các cạnh của vùng biên (f(x) = -1 hoặc f (x)=1). Trong phần này, ý tƣởng về phân lớp tuyến tính sử dụng SVM đƣợc giới thiệu. Các dữ liệu bao gồm các đối tƣợng có nhãn là một trong hai nhãn. Để thuận tiện, giả định rằng các nhãn +1 (dƣơng) và -1 (âm). Lấy x biểu thị một vector với M phần tử xj, , (j = 1,. .. , M) tức là một điểm trong một không gian vector M-chiều. Các xi ký hiệu biểu thị vector thứ i trong một tập dữ liệu  xi yi ni1 trong đó yi là nhãn liên quan xi . Các đối tƣợng xi đƣợc gọi là đặc tính đầu vào. Một khái niệm quan trọng cần thiết để xác định một phân lớp tuyến tính là tích vô hƣớng giữa hai vectơ M w , x   w j x j , còn đƣợc gọi là tích trong. Phân lớp tuyến tính đƣợc dựa trên j 1 một hàm tuyến tính dạng: f ( x)  w, x  b (2.4) Hàm f(x) là hàm của đầu vào x, f(x) đƣợc sử dụng để quyết định làm thế nào để phân lớp x. Vector w đƣợc gọi là vector trọng số, và b đƣợc gọi là độ dịch. Trong không gian 2 chiều các điểm ứng với phƣơng trình = 0 tƣơng ứng với một đƣờng qua gốc tọa độ, trong không gian 3 chiều thì nó là một mặt phẳng qua gốc tọa độ. Biến b sẽ dịch chuyển mặt phẳng đi một lƣợng so với mặt phẳng qua gốc tọa độ. Mặt phẳng phân chia không gian thành hai không gian theo dấu của f(x), nếu f(x)> 0 thì quyết định cho một lớp dƣơng lớp kia là âm. Ranh giới giữa các vùng đƣợc phân lớp là dƣơng và âm đƣợc gọi là ranh giới quyết định của các phân lớp. Ranh giới quyết định đƣợc xác định bởi một mặt phẳng (phƣơng trình (2.4)) đƣợc cho là đƣợc tuyến tính bởi vì nó là tuyến tính đầu vào. Phân lớp với một ranh giới quyết định tuyến tính đƣợc gọi là phân lớp tuyến tính. Với bất kỳ một tập dữ liệu khả tách tuyến tính có tồn tại một mặt phẳng phân lớp tất cả các điểm dữ liệu. Có nhiều mặt phẳng nhƣ vậy nhƣng phải lựa chọn mặt phẳng nào để đảm bảo thời gian huấn luyện ngắn và phân lớp một cách chính xác. Thực tế quan sát cũng nhƣ lý thuyết học thống kê (Vapnik, 1999) cho thấy rằng phân lớp siêu phẳng sẽ làm việc tốt hơn nếu siêu phẳng tách biệt chính xác với một biên độ lớn. Ở đây, biên của một phân lớp tuyến tính đƣợc định nghĩa là khoảng cách gần nhất để quyết định ranh giới, nhƣ thể hiện trong hình 2.2. Có thể điều chỉnh b để siêu phẳng phân tách các điểm tƣơng ứng. Hơn nữa nếu cho phƣơng trình (2.4) các giá trị ± 1, thì biên độ sẽ là 1 / ||w|| (trong đó ||w|| là độ dài của vec tơ w) còn đƣợc gọi là chuẩn, đƣợc tính là  w, w  2.4.1.4 Thiết lập lề (biên) Để tính toán w và b tƣơng ứng với các biên cực đại, ta phải giải quyết bài toán tối ƣu sau đây: min imize 1 w w ,b 2 2 , với ràng buộc yi ( w , xi  b)  1, i  1,...., n (2.5 ) Các ràng buộc đảm bảo sự phân lớp chính xác, và cực tiểu ||w||2, tƣơng đƣơng với biên cực đại. Đây là bài toán tối ƣu bậc hai, trong đó nghiệm tối ƣu (w, b) thỏa mãn các ràng buộc yi(+b) ≥ 1, với w càng nhỏ càng tốt. Bài toán tối ƣu hóa này có thể đƣợc giải bằng cách sử dụng các công cụ tiêu chuẩn từ tối ƣu hóa lồi (Boyd và Vandenberghe, 2004). Trong thực tế, dữ liệu thƣờng không phân chia tuyến tính. Kết quả lý thuyết và thực nghiệm cho thấy với biên lớn hơn thì SVM biên mềm sẽ cho hiệu quả tốt hơn so với SVM biên cứng. Để chấp nhận một số lỗi, ngƣời ta thay thế các ràng buộc dạng bất đẳng thức (2.5) với yi ( w , xi  b)  1   i , i  1,...., n trong đó i  0 là các biến phụ không âm n C i đƣợc thêm vào hàm tối ƣu hóa: i 1 min imize n 1 2 w  C   i với ràng buộc w ,b 2 i 1 yi ( w , xi  b )  1   i ,  i  0 (2.6) Hằng số C> 0 thiết lập mức độ quan trọng của việc cực đại biên và giảm số lƣợng biến phụ ξi. Công thức này đƣợc gọi là SVM biên mềm (Cortes và Vapnik, 1995). 2.4.1.5 Hàm nhân kernel Hàm nhân Kernel: K(x,y) phù hợp với một siêu phẳng trong không gian mới đƣợc định nghĩa là tập hợp các điểm có tích vô hƣớng với một vectơ cố định trong không gian đó là một hằng số. Vectơ xác định một siêu phẳng sử dụng trong SVM là một tổ hợp tuyến tính của các vectơ dữ liệu luyện tập trong không gian mới với các hệ số . Với siêu phẳng lựa chọn nhƣ trên, các điểm x trong không gian đặc trƣng đƣợc ánh xạ vào một siêu mặt phẳng là các điểm thỏa mãn: Σi αi K(xi,x) = hằng số. Nếu K(x,y) nhận giá trị ngày càng nhỏ khi y xa dần khỏi x thì mỗi số hạng của tổng trên đƣợc dùng để đo độ tƣơng tự giữa x với điểm xi tƣơng ứng trong dữ liệu luyện tập. Nhƣ vậy, tác dụng của tổng trên chính là so sánh khoảng cách giữa điểm cần dự đoán với các điểm dữ liệu đã biết. Với tập hợp các điểm x đƣợc ánh xạ vào một siêu phẳng có thể có độ phức tạp tùy ý trong không gian ban đầu, nên có thể phân tách các tập hợp thậm chí không lồi trong không gian ban đầu. 2.4.2 Thiết lập các tham số Trong luận văn này, chúng tôi sử dụng thƣ viện libSVM [16] phát triển bởi Chih-Chung Chang and Chih-Jen Lin tại Đại học Quốc gia Taiwan. Các tham số đƣợc lựa chọn nhƣ sau cho bộ phân loại hỗ trợ máy vector (SVM). Tham số C đƣợc đặt bằng 1; chúng tôi sử dụng hàm nhân tuyến tính (linear kernel function) 2.5 Kết luận Chƣơng hai trình bày hai bƣớc chính của hệ thống nhận dạng thức ăn rau quả tƣơi bằng hình ảnh. Đây là hai bƣớc chính trong quá trính phân loại ảnh. Với bƣớc đầu tiên sử dụng thuật toán K- mean cho phân đoạn ảnh đầu vào. Từ đó rút trích đƣợc vector đặc trƣng làm cơ sở cho việc phân lớp tiếp theo dựa trên thuật toán máy hỗ trợ vector (SVM). CHƢƠNG 3 THỬ NGHIỆM VÀ ĐÁNH GIÁ 3.1 Giới thiệu Trong chƣơng này nói về quá trình thu thập dữ liệu từ điện thoại di động. Tập hình ảnh chụp đƣợc (khoảng 3000-4000 ảnh của 9 loại rau quả khác nhau) từ máy ảnh của điện thoại di động là tập dữ liệu đầu vào. Chúng đƣợc phân loại bằng tay vào hai nhóm hình ảnh: Hình đơn loại thực phẩm (mỗi hình chỉ có một loại rau, củ, quả) và hình đa loại thực phẩm (mỗi hình có từ hai loại rau, củ, quả trở lên). Tập dữ liệu này đƣợc dùng cho việc nhận dạng. 3.2 Thu thập dữ liệu Hình 3.1: Điện thoại di động Nokia C2-01 Sliver Hình ảnh thực phẩm rau quả tƣơi đƣợc chụp từ máy ảnh nokia C2-01 Sliver, với Camera 3.2MP. Tập hình ảnh chụp đƣợc gồm 3000-4000 ảnh của 9 loại rau quả khác nhau: cà chua, cam, chuối, dƣa chuột, hành, nho, ớt, rau cải, táo từ máy ảnh của điện thoại di động là tập dữ liệu đầu vào. 3.2.1 Tập dữ liệu SingleFood Trong tập hình ảnh singleFood, mỗi hình ảnh là một loại rau, quả riêng biệt. Tổng số ảnh chụp đƣợc trong tập dữ liệu này là 1456 hình. Số lƣợng cụ thể từng loại rau quả đƣợc liệt kê trong bảng 3.1 Bảng 3.1: Bảng số lượng hình ảnh của một loại rau quả Loại rau quả Số ảnh Cà chua 192 Cam 287 Chuối 136 Dƣa chuột 89 Hành 100 Nho 88 Ớt 99 Rau cải 162 Táo 303 TỔNG 1456 3.2.2 Tập dữ liệu Multi-Food Với tập dữ liệu Multi-Food, hình ảnh thực phẩm thu đƣợc khoảng 1500 ảnh đầu vào. Mỗi bức hình chụp từ hơn hai loại rau, củ quả khác nhau. 3.3 Thử nghiệm và Đánh giá Trong thử nghiệm này, do thời gian có hạn, chúng tôi thử nghiệm trên tập dữ liệu SingleFood (Mỗi ảnh có một loại rau quả) gồm 1456 ảnh đƣợc thu thập (số ảnh thu thập trên tập dữ liệu MultiFood cũng khoảng 1500 ảnh). Sau giai đoạn trích chọn đặc trƣng, ta thu đƣợc 1456 vector đặc trƣng từ tập SingleFood. Các vector này đƣợc sử dụng để huấn luyện (training) bộ phân loại SVM (từ thƣ viện libSVM [16]). Sau đó, chúng tôi sử dụng phƣơng pháp kiểm thử 10-fold cross validation. Theo phƣơng pháp này, tập dữ liệu đƣợc phân hoạch (ngẫu nhiên) thành 10 phần; ta sử dụng 9 phần để huấn luyện (training) và một phần còn lại để thử nghiệm (testing); quá trình này lặp lại cho đến khi tất cả các phần đều đƣợc thử nghiệm. Kết quả cuối cùng là trung bình cộng của cả 10 phần. Kết quả thử nghiệm gồm 2 độ đo Precision và Recall [17] đƣợc tổng hợp trong bảng sau đây: Bảng 3.2: Kết quả thử nghiệm trên tập SingleFood Loại rau quả Precision Recall Cà chua 86.98 88.02 Cam 71.78 67.25 Chuối 84.56 86.03 Dƣa chuột 93.26 84.27 Hành 91 89 Nho 89.77 82.95 Ớt 86.87 91.92 Rau cải 91.98 93.83 Táo 79.54 82.84 TỔNG 83.59 83.1 Trong đó: Precision =True Positive /(True Positive + False Positive); Recall = True Positive /( True Positive + False Negative); Precision: Độ chính xác Recall: Tỷ lệ thu hồi True Positive: (Xác thực thực sự hay dƣơng tính thực sự) Số các mục phù hợp đƣợc dán nhãn thuộc về lớp tích cực (positive class) True Negative: (Thực sự tiêu cực hay Thực âm) Những mục đƣợc dãn nhãn thuộc về lớp tích cực nhƣng cần phải có False Positive: (Không xác thực hay dƣơng tính giả): Những mục đƣợc dán nhãn không chính xác cũng thuộc lớp tích cực (positive class) False Negative: (Âm tính giả ) Những mục không đƣợc dán nhãn thuộc về các lớp tích cực cần phải có đƣợc Kết quả bảng 3.2 thử nghiệm trên tập dữ liệu singlefood cho thấy: Tỷ lệ nhận dạng của các loại rau, củ, quả cho độ chính xác cao và tỷ lệ thu hồi đạt xấp xỉ trên 80% với 1456 hình ảnh của 9 thành phần thực phẩm. Trong đó, dƣa chuột, hành và rau cải có tỷ lệ nhận dạng cao trên 90% với đặc trƣng về màu sắc của chúng có phần giống nhau, nhƣng đặc trƣng hình dạng, SURF lại khá riêng biệt. Do đó, có rất ít hình ảnh cho kết quả phân lớp sai khác về kích thƣớc thực (tức lớn hơn 20%). Những hình ảnh cho phân lớp sai dễ nhầm lẫn về màu sắc nhƣ cà chua và ớt đỏ. Hay trong một vài trƣờng hợp, có sự giống nhau về đặc trƣng SURF nhƣ cam và cà chua. Qua đó có thể chứng minh phƣơng pháp nhận dạng hình ảnh dựa trên bề mặt thực phẩm nhƣ một công nghệ ứng dụng cao trong thực tế. 3.4 Kết luận Trong chƣơng này, chúng tôi trình bày quá trình thu thập hình ảnh thực phẩm của mƣời loại rau, củ, quả trong thực tế, tập hình ảnh thu đƣợc là tập dữ liệu đầu vào. Từ đó, phân chia tập dữ liệu đầu này thành hai tập dữ liệu single-Food và multi-Food. Trong thời gian cho phép, chúng tôi đã kiểm nghiệm trên tập dữ liệu single-Food với 1456 hình ảnh của 10 loại rau, củ, quả. Kết quả nhận dạng thu đƣợc đạt độ chính xác và độ thu hồi xấp xỉ trên 80%. 3.5 Thảo luận và hạn chế: KẾT LUẬN Kết quả nghiên cứu Luận văn xây dựng hệ thống nhận dạng rau quả tƣơi ở giai đoạn tiền chế biến dựa trên điện thoại di động. Hệ thống xây dựng dựa trên hai thuật giải chính: Thuật toán K-mean cho bƣớc đầu phân đoạn ảnh đầu vào và thuật toán máy hỗ trợ vector (SVM) cho phân lớp ảnh. Kết quả thực nghiệm trên tập dữ liệu single-Food cho kết quả phân loại chính xác cao và độ thu hồi cao. Là kết quả đúng đắn cho ứng dụng của hệ thống vào thực tế. Các hỗ trợ theo dõi chế độ dinh dưỡng Luận văn xây dựng hệ thống nhận dạng rau quả tƣơi ở giai đoạn tiền chế biến dựa trên điện thoại di động với một chi phí thấp, tự động, mang tính cá nhân. Hệ thống giúp cho ngƣời dùng quản lý và theo dõi chế độ dinh dƣỡng hàng ngày hiệu quả và thuận tiện hơn trong việc giữ gìn sức khỏe và giảm cân. Đối với ngƣời bệnh tiểu đƣờng thì những dữ liệu đƣợc ghi và hiển thị cũng sẽ hỗ trợ ngƣời chăm sóc và chuyên gia y tế của họ cung cấp các hình thức điều trị chính xác hơn Các hạn chế Do có những hạn chế nhất định về mặt thời gian và kiến thức của bản thân, luận văn mới chỉ dừng lại ở mức thử nghiệm của hệ thống trên một tập dữ liệu single-Food với số lƣợng ảnh khá khiêm tốn cho việc xác nhận thực phẩm trong hình.. Hướng phát triển tiếp Trong thời gian tới, chúng tôi sẽ tiến hành thử nghiệm hệ thống với tập dữ liệu multi-Food. Đồng thời, tăng số lƣợng ảnh cần nhận dạng để xây dựng môt hệ thống hoàn chỉnh. TÀI LIỆU THAM KHẢO Tiếng Anh: [1] C.C Cowie et al., “Prevalence of Diabetes and Impaired Fasting Glucose in Adults in the U.SPopulation: National Health and Nutrition Examination Survey 1999–2002”, Diabetes Care, 2006, pp. 1263-1268. [2] A. Smailagic and D. Siewiorek, “DIMA: Diabetes Management Assistant Wearable Computer”, Wearable Computing, IEEE Pervasive Computing, Oct-Dec. 2002, Vol.1, no. 4, pp.7173 [3] K.M. Lee, et al., “Effects of Classification Methods on Color-Based Feature Detection with Food Processing Applications”, IEEE Transactions of Automation Science and Engineering, Jan. 2007, vol.1 pp. 40-51 [4] Gamage, L.B., de Silva, C.W., and Gosine, R.G., “Statistical pattern recognition for cutter positioning in automated fish processing”, Communications, Computers and Signal Processing, 1993., IEEE Pacific Rim Conference on, Volume 2, 19-21 May 1993 Page(s):786 - 789 [5] Aleixos, N., Blasco, J., Molto, E., and Navarron, F., “Assessment of citrus fruit quality usinga real-time machine vision system”,Pattern Recognition, 2000. Proceedings. 15th International Conference on, Volume 1, 3-7 Sept. 2000 Page(s):482 - 485 [6] T. Aono, H. Kimura, Y. Yamauchi, “A food recognition algorithm based on dish recognition”, 28th Annual Conference of the Industrial Electronics Society, IEEE 2002,Volume 2, 5-8 Nov. 2002 Vol.2, pp. 1445 – 1450 [7] F. Takeda; K. Kumada, and M. Takara, “Dish extraction method with neural network for food intake measuring system on medical use”, Computational Intelligence for Measurement Systems and Applications, 29-31 July 2003, pp.56 – 59 [8] National Diabetes Fact Sheet: http://www.cdc.gov/diabetes/pubs/factsheet.htm [9] H. Bay, A. Ess, T. Tuytelaars, and L. van Gool. (2008). Speeded-Up Robust Features (SURF). Comp. Vis. Image Underst. 110(3), 346-59. [10] R. Chincha and Y. Tian. (2011). Finding objects for blind people on SURF features. In Proc. BIBMW. [11] D. N. Ta, W. C. Chen, N. Gelfand, and K. Pulli. (2009). SURFTrac: Efficient Tracking and Continuous Object recognition using Local Feature Descriptors. In Proc. CVPR. [12] J. Chen, A. H. Kam, J. Zhang, N. Liu, and L. Shue. (2005). Bathroom activity monitoring based on sound. In Proc. Pervasive. Internet: [13] http://research.nokia.com/research/projects/WellnessDiary/index.html

- Xem thêm -

Tài liệu Nhận dạng thức ăn rau quả tươi bằng hình ảnh

Tài liệu liên quan

Tài liệu vừa đăng

Tài liệu xem nhiều nhất