ii
TÓM TẮT
Các hệ thống phần mềm luôn không ngừng phát triển theo lẽ tự nhiên để đáp ứng
nhu cầu thay đổi liên tục từ khách hàng và thị trường. Tuy nhiên, những thay đổi
này có thể gây ra các lỗi khiến cho những chức năng đã có của chương trình không
hoạt động đúng. Những lỗi như thế này được gọi là lỗi hồi quy. Sửa lỗi tự động
(Automated Program Repair - APR) gần đây đã cho thấy được tiềm năng lớn trong
việc tự động sửa các lỗi của phần mềm. Mặc dù với sự phát triển mạnh mẽ của
APR, chỉ có một số kỹ thuật tập trung xử lý các lỗi hồi quy. Tuy nhiên, các kỹ thuật
chưa thực sự khai thác đầy đủ thông tin có sẵn trong lịch sử phát triển của các phần
mềm (ví dụ: bản cập nhật gây ra lỗi, v.v.) để sửa lỗi hồi quy. Hơn nữa, những kỹ
thuật này không công bố công cụ cài đặt cho cộng đồng hoặc công cụ rất hạn chế
và khó có thể sử dụng để sửa lỗi trong thực tế. Luận văn này nhằm mục đích đề
xuất phương pháp sửa lỗi hồi quy cho các chương trình Java bằng cách khai thác và
mở rộng những phát hiện gần đây về lỗi hồi quy, ví dụ: mối tương quan giữa các
bản cập nhật tạo ra lỗi và sửa lỗi. Luận văn cài đặt lại và cải tiến phương pháp sửa
lỗi hồi quy tự động cho các chương trình C (Relifix). Từ đó, xây dựng một hệ thống
có tên là LyFix, cho phép người dùng sửa lỗi hồi quy Java tự động bằng cách tận
dụng các nguyên liệu sửa lỗi và các mẫu sửa lỗi cụ thể học được từ lịch sử phát triển
phần mềm. Tám mẫu sửa lỗi hồi quy, thuật toán sửa lỗi đã được cài đặt lại dựa vào
ý tưởng của Relifix. Ngoài ra, luận văn cài đặt thêm ba mẫu sửa lỗi hồi quy mới cho
Java. Luận văn cũng thực hiện thực nghiệm để so sánh khả năng sửa lỗi của LyFix
đối với jRelifix (bản cài đặt Relifix cho Java) và các công cụ sửa lỗi tự động tốt nhất
hiện nay (jGenProg, jMutRepair, TBar) trên tập dữ liệu 51 lỗi hồi quy thực tế của các
hệ thống phần mềm Java mã nguồn mở. Kết quả cho thấy LyFix có thể sinh ra bản
vá thành công cho 56.8% lỗi có trong tập dữ liệu và tỉ lệ số bản vá chính xác là 79.3%
trong khi các công cụ khác sửa lỗi tốt nhất (TBar) với kết quả sinh được bản vá 33.3%
lỗi và tỉ lệ bản vá đúng là 41.1%.
Từ khóa: tự động sửa lỗi chương trình, lỗi hồi quy, lịch sử phát triển phần mềm
iii
LỜI CẢM ƠN
Đầu tiên và quan trọng nhất, tôi xin gửi lời cảm ơn trân trọng và sâu sắc tới PGS.
TS. Phạm Ngọc Hùng - người Thầy giáo đã trực tiếp hướng dẫn tận tình và đóng
góp những ý kiến quý báu trong quá trình tôi học tập, nghiên cứu và cả kinh nghiệm
cuộc sống từ những năm tháng tôi còn là sinh viên tại trường Đại học Công nghệ
cho đến nay. Thầy đã không ngần ngại cho phép và hỗ trợ tôi tự lựa chọn đề tài để
thực hiện luận văn này. Tôi xin được gửi lời cảm ơn chân thành tới TS. Bách Lê, TS.
Lê Quang Lộc, và PGS. TS. Corina Pasareanu đã hướng dẫn và hỗ trợ tôi rất nhiệt
tình trong quá trình thực hiện luận văn này. Các anh và cô luôn động viên tôi và đưa
ra những câu trả lời và gợi ý ngay lập tức mỗi khi tôi gặp khó khăn. Các anh và cô
cũng chia sẻ rất nhiều kinh nghiệm quý báu trong nghiên cứu và cuộc sống và tôi đã
học được nhiều điều từ các anh. Xin được cảm ơn ban tổ chức chương trình Google
Summer of Code 2020 và Java PathFinder Team đã cho phép tài trợ kinh phí để tôi
thực hiện đề tài trong luận văn này. Công trình này cũng được tài trợ một phần từ
đề tài KHCN cấp ĐHQGHN, Mã số đề tài: QG.19.24. Cuối cùng, tôi xin được cảm
ơn những lời động viên từ gia đình, người thân, bạn bè để giúp tôi luôn vững bước
trong con đường tương lai.
iv
Mục lục
1
2
3
Giới thiệu
1
1.1
Mở đầu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
Đóng góp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.3
Bố cục luận văn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Kiến thức nền tảng
4
2.1
Kiểm thử hồi quy và lỗi hồi quy . . . . . . . . . . . . . . . . . . . . . .
4
2.2
Sửa lỗi chương trình tự động . . . . . . . . . . . . . . . . . . . . . . .
7
2.2.1
Xác định vị trí gây ra lỗi . . . . . . . . . . . . . . . . . . . . . .
9
2.2.2
Các phương pháp sửa lỗi tự động hiện nay . . . . . . . . . . .
12
Phương pháp sửa tự động lỗi hồi quy
16
3.1
Tổng quan phương pháp . . . . . . . . . . . . . . . . . . . . . . . . . .
16
3.2
Xác định bản cập nhật gây ra lỗi . . . . . . . . . . . . . . . . . . . . . .
17
3.3
Thu thập thông tin mã nguồn thay đổi và nguyên liệu sửa lỗi . . . .
22
3.4
Các mẫu sửa lỗi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
24
3.5
Xác định vị trí gây lỗi . . . . . . . . . . . . . . . . . . . . . . . . . . . .
33
v
3.6
4
5
Thuật toán sửa lỗi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
34
Cài đặt công cụ và thực nghiệm
40
4.1
Cài đặt công cụ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
40
4.2
Thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
42
4.2.1
Phương pháp thực nghiệm . . . . . . . . . . . . . . . . . . . .
43
4.2.2
Kết quả thực nghiệm và thảo luận . . . . . . . . . . . . . . . .
46
Kết luận
52
A Danh sách các mẫu sửa lỗi
54
Tài liệu tham khảo
60
vi
Danh sách hình vẽ
2.1
Các chiến lược kiểm thử hồi quy . . . . . . . . . . . . . . . . . . . . .
5
2.2
Các bước tiêu chuẩn trong các kỹ thuật APR hiện nay [27] . . . . . .
7
2.3
Số lượng công bố mỗi năm về APR từ 1996 - 2019 . . . . . . . . . . . .
8
2.4
Tổng quan về xác định vị trí gây lỗi dựa trên phổ chương trình . . . .
10
2.5
Tổng quan về các kỹ thuật sửa lỗi [14] . . . . . . . . . . . . . . . . . .
13
3.1
Tổng quan phương pháp sửa tự động lỗi hồi quy . . . . . . . . . . . .
17
3.2
Các bản cập nhật gây ra lỗi và sửa lỗi của Closure 31 [21] . . . . . .
18
3.3
Ví dụ minh họa tính độ đo giữa nguyên liệu sửa lỗi và câu lệnh nghi
4.1
ngờ lỗi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
36
Kiến trúc công cụ sửa lỗi tự động LyFix . . . . . . . . . . . . . . . . .
41
vii
Danh sách bảng
3.1
Nguyên liệu sửa lỗi và mẫu sửa lỗi sử dụng . . . . . . . . . . . . . . .
23
3.2
Các mẫu sửa lỗi đã cài đặt . . . . . . . . . . . . . . . . . . . . . . . . .
24
4.1
Thống kê các chỉ số của bộ dữ liệu lỗi hồi quy . . . . . . . . . . . . . .
44
4.2
Thống kê số lượng các hành động sửa lỗi của bộ dữ liệu lỗi hồi quy .
46
4.3
Kết quả sửa lỗi trên tập dữ liệu lỗi hồi quy . . . . . . . . . . . . . . .
47
viii
Danh sách từ viết tắt và thuật ngữ
APR
Automated Program Repair - Sửa lỗi chương trình tự động
AST
Abstract Syntax Tree - Cây cú pháp trừu tượng
FL
Fault Localization - Xác định vị trí gây lỗi
SUT
System Under Test - Hệ thống được kiểm thử
RTS
Regression Test Selection - Lựa chọn ca kiểm thử hồi quy
TSM
Test Suite Minimization - Giảm thiểu bộ ca kiểm thử
TCP
Test Case Prioritization - Ưu tiên ca kiểm thử
BWTC Bug-witnessing Test Case - Ca kiểm thử phát hiện lỗi
BIC
Bug-inducing Commit - Bản cập nhật gây lỗi
BFC
Bug-fixing Commit - Bản cập nhật sửa lỗi
RT
Repair Templates - Các mẫu sửa lỗi, mỗi mẫu thực hiện một tập
các hành động thay đổi mã nguồn để sửa lỗi
FI
Fix Ingredients - Các nguyên liệu sửa lỗi, là những thành phần
mã nguồn có thể sử dụng làm tham số cho các mẫu sửa lỗi
1
Chương 1
Giới thiệu
1.1
Mở đầu
Các hệ thống phần mềm phát triển và tiến hóa không ngừng như một lẽ tự nhiên để
bắt kịp nhu cầu thay đổi liên tục từ phía khách hàng và thị trường. Quá trình phát
triển phần mềm là một quá trình gia tăng, thường mang theo các tính năng mới
được cài đặt để đáp ứng các yêu cầu thay đổi của người dùng. Tuy nhiên, những
tính năng được thêm mới này có thể làm hỏng các chức năng hiện tại của hệ thống
phần mềm và do đó gây ra lỗi mới. Những lỗi này thường được gọi là lỗi hồi quy.
Lỗi hồi quy rất phổ biến trong các hệ thống phần mềm hiện nay và vẫn đang là một
thách thức lớn trong ngành công nghiệp phát triển phần mềm [35, 11]. Xác định và
sửa lỗi hồi quy là một hoạt động bắt buộc trong các vòng lặp bảo trì phần mềm [39].
Những nghiên cứu từ trước đến nay tập trung chủ yếu vào việc hỗ trợ phát hiện
và xác định lỗi hồi quy [39, 52, 26, 22]. Trong khi đó, sửa lỗi hồi quy vẫn đang phụ
thuộc lớn vào con người để gỡ và sửa lỗi một cách thủ công, khiến công việc này
tiêu tốn thời gian và rủi ro. Ví dụ, người ta đã ước tính rằng các lập trình viên cần
tới 8,5 năm để sửa một lỗi hồi quy [4].
Sửa lỗi tự động (Automated Program Repair - APR), bao gồm các pha xác định
vị trí gây ra lỗi và sửa lỗi mới xuất hiện gần đây để giúp giải quyết vấn đề này. APR
tập trung vào việc tự động quá trình gỡ lỗi phần mềm, từ đó giúp giảm bớt hoặc
thậm chí loại bỏ sự can thiệp của con người vào quá trình sửa lỗi. Các nghiên cứu
Chương 1. Giới thiệu
2
về APR gần đây đã đạt được một số thành công đáng kể và đóng góp cho ngành
nhiều kỹ thuật sửa lỗi tốt [45, 17, 12]. Facebook gần đây đã công bố công cụ sửa lỗi
tự động lần đầu tiên, được sử dụng rộng để sửa lỗi cho toàn bộ hệ thống mã nguồn
lõi mà Facebook đang vận hành [2]. Điều này khẳng định APR đang là một hướng
nghiên cứu mang lại nhiều đóng góp lớn cho lĩnh vực phát triển phần mềm.
Mặc dù với sự phát triển mạnh mẽ gần đây, chỉ có một số kỹ thuật APR tập
trung cho việc sửa lỗi hồi quy [33, 42]. Tuy nhiên, những kỹ thuật này hiện tại vẫn
chưa khai thác đầy đủ thông tin trong lịch sử phát triển của hệ thống (ví dụ: thông
tin thay đổi trong những bản cập nhật gây ra lỗi) để phục vụ cho việc sửa lỗi. Hơn
nữa, những phương pháp sửa lỗi này không cung cấp công khai công cụ cài đặt
kèm theo hoặc công cụ rất hạn chế và khó có thể áp dụng để sửa lỗi trong các dự
án thực tế. Luận văn này hướng tới việc áp dụng sửa lỗi hồi quy tự động cho các
chương trình Java bằng cách cài đặt và mở rộng các phương pháp sửa lỗi và các phát
hiện gần đây về lỗi hồi quy (ví dụ: phương pháp sửa lỗi hồi quy tự động cho các
chương trình C [42], sự tương quan giữa các bản cập nhật gây ra lỗi và sửa lỗi [46]).
Luận văn tập trung vào việc sửa lỗi cho các chương trình Java bởi vì nó là một trong
những ngôn ngữ lập trình phổ biến nhất cho đến hiện nay.1 Luận văn cũng đặt mục
tiêu xây dựng một công cụ kèm theo, có tên LyFix, cho phép người dùng sửa lỗi hồi
quy Java tự động và công bố nó như một phần mềm mã nguồn mở để cộng đồng có
thể sử dụng. Khác với các kỹ thuật APR truyền thống, LyFix sử dụng các nguyên
liệu sửa lỗi và những mẫu sửa lỗi cụ thể học từ lịch sử phát triển của các hệ thống
phần mềm để đạt kết quả sửa lỗi tốt hơn cho các lỗi hồi quy.
1.2
Đóng góp
• Luận văn phân tích bán tự động 3483 lỗi của hai bộ dữ liệu lỗi chuẩn BugSwarm2
và Bears3 , từ đó thu thập được 51 lỗi hồi quy. BugSwarm bao gồm 3232 lỗi
được thu thập tự động dựa trên lịch sử tích hợp liên tục (TravisCI) của các ứng
1 http://www.tiobe.com/index.php/content/paperinfo/tpci/index.html
2 http://www.bugswarm.org/releases/#v113
3 http://bears-bugs.github.io/bears-benchmark
Chương 1. Giới thiệu
3
dụng mã nguồn mở. Bears bao gồm 251 lỗi được thu thập thủ công từ các ứng
dụng mã nguồn mở với mục đích phục vụ cho các công cụ APR.
• Luận văn cài đặt và công bố miễn phí công cụ kèm theo LyFix4 , bao gồm:
– Đề xuất và cài đặt công thức xác định vị trí gây lỗi phù hợp cho đối tượng
là lỗi hồi quy
– Cài đặt lại tám mẫu sửa lỗi dựa trên tư tưởng sửa lỗi hồi quy cho chương
trình C ở [42]
– Đề xuất và cài đặt ba mẫu sửa lỗi hồi quy mới cho Java (mở rộng dựa trên
[36] và học từ bộ dữ liệu 51 lỗi quy đã thu thập)
– Đề xuất và cài đặt thuật toán cải tiến từ thuật toán sửa lỗi của [42] để sinh
được nhiều bản vá hơn và các bản vá có chất lượng tốt hơn
• Luận văn tiến hành thực nghiệm đánh giá khả năng sửa lỗi của LyFix so với
jRelifix (là công cụ sửa lỗi phiên bản Java mà luận văn đã cài đặt lại giống với
phương pháp sửa lỗi đề xuất trong [42]), jGenProg, jMutRepair và TBar trên
tập dữ liệu 51 lỗi hồi quy. Đây là những lỗi hồi quy thực tế từ những hệ thống
phần mềm mã nguồn mở được phát triển và kiểm thử tốt.
1.3
Bố cục luận văn
Các phần còn lại của luận văn được cấu trúc như sau. Chương 2 cung cấp các kiến
thức nền tảng về tính chất của lỗi hồi quy và sửa lỗi tự động. Chương 3 mô tả
phương pháp sửa lỗi đề xuất, bao gồm các bước: xác định bản cập nhật gây ra lỗi,
thu thập thông tin mã nguồn nguồn thay đổi và nguyên liệu sửa lỗi, xác định vị trí
gây ra lỗi, các mẫu sửa lỗi và thuật toán sửa lỗi. Chương 4 mô tả về kiến trúc và
cài đặt công cụ, các kết quả thực nghiệm đánh giá về khả năng sửa lỗi hồi quy của
phương pháp đề xuất được tiến hành và bàn luận. Cuối cùng, Chương 5 kết luận
lại toàn bộ công việc luận văn đã thực hiện, kèm theo các công việc tiếp theo có thể
thực hiện để cải tiến và mở rộng công cụ.
4 https://github.com/bqcuong/lyfix
4
Chương 2
Kiến thức nền tảng
Chương này cung cấp các kiến thức nền tảng cho luận văn. Đầu tiên, kiến thức kiểm
thử hồi quy sẽ được giới thiệu một cách tổng quan. Tiếp theo, kiến thức về sửa lỗi
chương trình tự động sẽ được trình bày, bao gồm: tổng quan, xác định vị trí gây ra
lỗi, và các phương pháp sửa lỗi tự động phổ biến hiện nay.
2.1
Kiểm thử hồi quy và lỗi hồi quy
Các hệ thống phần mềm thay đổi không ngừng theo thời gian. Khi có một thay đổi
mới được thêm vào mã nguồn, thay đổi này có thể phá hỏng các chức năng khác của
chương trình mà trước đó hoạt động bình thường. Kiểm thử hồi quy (regression
testing) là một kỹ thuật được sử dụng để phát hiện các lỗi khi chương trình thay
đổi. Kiểm thử hồi quy có thể áp dụng ở tất các mức kiểm thử: đơn vị, tích hợp, hệ
thống, và chấp nhận [16]. Lỗi được phát hiện nhờ vào kiểm thử hồi quy gọi là lỗi hồi
quy. Lỗi hồi quy được chia thành ba loại1 :
• Local: Thay đổi mới gây ra lỗi, làm các chức năng tồn tại từ trước không hoạt
động đúng như mong muốn nữa. Cách sửa là khôi phục lại phần mã nguồn
gây ra lỗi này.
1 http://www.onestoptesting.com/regression-testing/types.asp
Chương 2. Kiến thức nền tảng
5
• Unmasking: Thay đổi mới khiến luồng thực thi chương trình đi vào những câu
lệnh gây ra những lỗi đã có từ trước. Cách sửa là thêm hoặc cập nhật lại các
câu lệnh điều kiện để giúp luồng thực thi chương trình không còn đi vào các
câu lệnh gây lỗi nữa.
• Remote: Những thay đổi mới tạo ra các lỗi ở những phần mã nguồn khác trong
chương trình. Để sửa những lỗi này, ta buộc phải cập nhật lại mã nguồn ở
những vị trí có lỗi cho phù hợp với thay đổi hoặc ta cần phải tạo ra các câu
lệnh điều kiện để luồng thực thi chương trình không đi vào những câu lệnh
gây lỗi đối với một số trạng thái nhất định.
Kiến thức về thông tin, tính chất của các loại lỗi hồi quy sẽ giúp luận văn này
phát triển kỹ thuật xác định vị trí lỗi, lựa chọn được các nguyên liệu sửa lỗi phù
hợp, và thiết kế được các mẫu sửa lỗi tốt hơn. Kiến thức về các kỹ thuật kiểm thử
hồi quy giúp luận văn thiết kế thuật toán, lựa chọn bộ ca kiểm thử rút gọn để tiết
kiệm thời gian thẩm định bản vá.
HÌNH 2.1: Các chiến lược kiểm thử hồi quy
Hình 2.1 mô tả các chiến lược phổ biến được sử dụng để thực hiện kiểm thử
hồi quy hiện nay. Trong thực tế, người ta chỉ thực thi một phần của bộ ca kiểm thử
để thực hiện kiểm thử hồi quy. Thử thách lớn nhất là cần thực thi lựa chọn đúng
những ca kiểm thử có thể giúp đánh giá tốt nhất cho những phần mã nguồn thay
đổi. Thực thi lại toàn bộ ca kiểm thử (Retest All) chỉ khả thi cho những dự án nhỏ.
Trong những dự án có quy mô lớn, việc thực thi lại toàn bộ ca kiểm thử hầu như là
Chương 2. Kiến thức nền tảng
6
điều không thể bởi vì nó tốn rất nhiều thời gian và có thể làm chậm quá trình phát
hành sản phẩm tới khách hàng.
Giảm thiểu bộ ca kiểm thử (Test Suite Minimization - TSM): Trong những hệ
thống phần mềm quy mô lớn, bộ ca kiểm thử cho những hệ thống này thường rất
đồ sộ, và luôn được cập nhật thêm mới các ca kiểm thử mỗi khi trải qua một bản
phát triển mới. Việc thêm các ca kiểm thử mới có thể khiến những ca kiểm thử khác
trở nên dư thừa bởi vì chức năng ca kiểm thử cũ có thể cũng đã được kiểm tra bởi
những ca kiểm thử mới. Loại bỏ những ca kiểm thử dư thừa này không làm ảnh
hướng tới độ phủ của bộ kiểm thử [41]. Các kỹ thuật TSM nhắm tới mục tiêu xác
định và loại bỏ những ca kiểm thử dư thừa này ra khỏi bộ ca kiểm thử. Một số
nghiên cứu đã được đề xuất có kết quả tốt như là [25, 47, 15].
Lựa chọn ca kiểm thử (Test Case Selection): Có tên gọi khác là Regression Test
Selection - RTS. Các kỹ thuật RTS giống với các kỹ thuật TSM là đều lựa chọn một
tập ca kiểm thử con và chỉ thực hiện kiểm thử hồi quy trên tập đó. Điểm khác biệt
chính giữa hai loại kỹ thuật này là RTS lựa chọn ca kiểm thư dựa vào các thay đổi
của hệ thống được kiểm thử (System Under Test - SUT) còn TSM thì không. Các kỹ
thuật TSM thường lựa chọn ca kiểm thử dựa vào các chỉ số như độ phủ kiểm thử
được đo từ một phiên bản nhất định của SUT. Ngược lại, RTS lựa chọn các ca kiểm
thử dựa trên sự liên quan của chúng so với thay đổi giữa hai phiên bản của nguồn
của SUT. Có nhiều nghiên cứu tập trung đã vào đề xuất các kỹ thuật RTS [39], [52],
[53].
Ưu tiên ca kiểm thử (Test Case Prioritization - TCP): Các kỹ thuật TCP không
lựa chọn một tập các ca kiểm thử còn mà tập trung vào việc sắp xếp độ ưu tiên thực
thi của các kiểm thử theo một thứ tự dựa vào một số tiêu chí nào đó để có thể tìm
được lỗi nhanh nhất. Điều này giúp cho các kiểm thử viên có thể tối đa tỷ lệ có thể
tìm được lỗi sớm của bộ kiểm thử. Các kỹ thuật TCP có thể chia làm ba nhóm chính
dựa trên các mức điều khiển, câu lệnh, và hàm của chương trình [38]. Một số nghiên
cứu đề xuất các kỹ thuật TCP là [26], [22], [23].
Chương 2. Kiến thức nền tảng
2.2
7
Sửa lỗi chương trình tự động
Sửa lỗi chương trình là một trong các bước của công việc gỡ lỗi chương trình cũng
như vòng đời của lỗi chương trình, bao gồm: Nhận diện lỗi - Nhận diện sự tồn tại
của lỗi trong chương trình, quan sát các dấu hiện của lỗi để phục vụ cho các bước
sau; Xác định vị trí gây ra lỗi - Thường là bước khó nhất, mục tiêu là để xác định xem
phần nào của chương trình gây ra lỗi, cụ thể nhất là ở dòng nào; Sửa lỗi - Xác định
cách giải quyết lỗi như thế nào, sau đó đề xuất bản vá và thẩm định lại bản vá.
HÌNH 2.2: Các bước tiêu chuẩn trong các kỹ thuật APR hiện nay [27]
Sửa lỗi chương trình tự động nhắm tới mục đích tự động hóa quá trình gỡ lỗi,
giảm nhu cầu về sự can thiệp của con người trong công việc này. Các kỹ thuật APR
hiện tại thường gồm ba bước chính để thực hiện nhiệm vụ sửa lỗi một hoàn chỉnh
như mô tả ở Hình 2.2: Xác định vị trí gây ra lỗi → Sinh và đề xuất bản vá → Thẩm
định bản vá. Tương tự ở quá trình gỡ lỗi tự nhiên của con người, mô-đun xác định
vị trí gây lỗi ở APR cũng nhằm mục đích xác định các phần mã nguồn nghi ngờ gây
ra lỗi (ở mức dòng, phương thức, hoặc tệp). Mô-đun sinh bản vá sẽ cố gắng sửa lỗi
bằng cách tạo ra nhiều bản vá ứng cử viên nhờ việc biến đổi mã nguồn có lỗi theo
phương pháp đề xuất (cú pháp, ngữ nghĩa, hướng dữ liệu, v.v.). Những bản vá ứng
cử viên này sẽ được mô-đun thẩm định bản vá kiểm tra xem có thực sự sửa lỗi thành
công hay không thông qua việc thực hiện đánh giá chương trình đã được vá lỗi theo
một đặc tả cho trước (bộ ca kiểm thử, đặc tả hình thức, v.v.). Kết quả cuối cùng sẽ là
một danh sách bản vá lỗi được đề xuất cho người dùng mà có thể sử dụng để sửa
lỗi chương trình ban đầu.
Từ đầu những năm 2000, đã có rất nhiều nghiên cứu được thực hiện nhằm đề
xuất các giải pháp phát hiện lỗi trong phần mềm [3, 6, 40] và xác định vị trí gây ra
Chương 2. Kiến thức nền tảng
8
lỗi [37, 18, 19]. Các nghiên cứu cho việc tự động sửa lỗi xuất hiện theo sau với một
số lượng bài báo còn hạn chế. Tuy nhiên, kể từ khi Weimer và cộng sự giới thiệu
một phương pháp sửa lỗi mới dựa trên tư tưởng lập trình di truyền [45] vào năm
2009, APR đã phát triển rất mạnh mẽ và trở thành một hướng nghiên cứu hẹp thiết
yếu đối với lĩnh vực công nghệ phần mềm. Điều này dễ dàng được nhận thấy ở biểu
đồ thống kế số lượng công bố các nghiên cứu về APR trong giai đoạn 1996 - 2019
trong Hình 2.32 . Số lượng các công bố nghiên cứu về APR mỗi năm trước năm 2009
là dưới 5 công bố và sau năm 2009 không ngừng tăng mạnh đạt số lượng xấp xỉ 50
công bố ở các năm gần đây như năm 2018, 2019.
HÌNH 2.3: Số lượng công bố mỗi năm về APR từ 1996 - 2019
2 http://program-repair.org/statistics.html
Chương 2. Kiến thức nền tảng
2.2.1
9
Xác định vị trí gây ra lỗi
Nhìn vào sơ đồ ở Hình 2.2, ta có thể thấy rằng xác định vị trí gây lỗi là bước đầu tiên
trong các bước xử lý của bất kỳ phương pháp APR nào. Xác định vị trí gây lỗi được
sử dụng để xác định những vị trí mã nguồn nghi ngờ gây ra lỗi. Những vị trí mã
nguồn này sẽ được đưa vào các hệ thống APR để tập trung sửa lỗi tại đó. Ta sẽ tìm
hiểu tổng quan các kỹ thuật xác định vị trí gây lỗi hiện nay, và sau đó tập trung vào
kỹ thuật xác định vị trí gây lỗi dựa trên phổ (spectrum-based Fault Localization) là chiến lược xác định lỗi được sử dụng phổ biến nhất trong các kỹ thuật APR và
trong luận văn này.
Các kỹ thuật xác định vị trí gây lỗi truyền thống rất trực quan và đơn giản, bất
cứ người lập trình nào cũng có thể sử dụng. Ta có thể nhắc tới bốn phương pháp
sau đây [48]:
• Hệ thống log: Sử dụng các câu lệnh dùng để in các giá trị trong chương trình
(ví dụ: câu lệnh System.out.println()). Đây là một cách cực kỳ đơn giản và
hữu hiệu để theo dõi thông tin về trạng thái của chương trình. Khi mà phát
hiện có lỗi trong chương trình, nhà phát triển có thể điều tra log của chương
trình để tìm ra vị trí lỗi xuất phát từ đâu.
• Assertions: Là các câu lệnh do người phát triển thêm vào để đảm bảo các giá trị
trạng thái của chương trình đúng với mong muốn tại thời điểm chèn assertion
(ví dụ: assertEquals(5, arr.length)). Chương trình sẽ dừng lại ngay lập tức
nếu như một trong các câu lệnh assertion đánh giá sai. Từ đó nhà phát triển có
thể biết được lỗi bắt đầu ở câu lệnh cuối cùng thay đổi giá trị của biến được
kiểm tra trong câu lệnh assertion (như ví dụ trên, biến này là arr.length).
• Breakpoints: Các trình gỡ lỗi sẽ cho phép người đặt các Breakpoint này. Breakpoint được sử dụng để dừng chương trình khi luồng thực thi đi đến một điểm
mong muốn, và nó cho phép nhà phát triển có thể theo dõi được trạng thái
hiện tại của chương trình. Thậm chí nhà phát triển có thể thay đổi được giá trị
các biến, thêm các câu lệnh mới ngay sau điểm Breakpoint để đánh giá và tìm
Chương 2. Kiến thức nền tảng
10
hiểu thêm thông tin về lỗi để xác định vị trí gây ra lỗi. Một số trình gỡ lỗi hỗ
trợ các tính năng này là GNU GDB3 , Microsoft Visual Studio Debugger4 .
• Profiling: Là một phương pháp phân tích các chỉ số trong lúc chạy chương
trình như mức sử dụng bộ nhớ, tốc độ thực thi, thường được sử dụng để đánh
giá và tối ưu chương trình. Tuy nhiên, phương pháp này có thể được sử dụng
để tìm ra một số lỗi chương như: Xác định lỗi rò rỉ bộ nhớ, Phát hiện số lần
thực thi không mong muốn của một hàm, v.v. Một số công cụ tiêu biểu có thể
nói đến là Valgrind5 , VisualVM6 .
Các kỹ thuật xác định vị trí gây lỗi truyền thống thường được thực hiện một
cách thủ công hoặc bán tự động. Chính vì vậy, các kỹ thuật xác định vị trí gây lỗi
nâng cao ra đời, nhằm giảm thiểu tối đa sự can thiệp của con người vào quá trình
xác định vị trí lỗi. Các kỹ thuật xác định vị trí gây lỗi nâng cao phổ biến hiện này có
thể chia làm tám loại chính [48]: Dựa trên lát cắt (slide-based), Dựa trên mật đổ phổ
chương trình (spectrum-based), Dựa trên xác suất (statistics-based), Dựa trên trạng
thái chương trình (state-based), Dựa trên học máy (machine learning-based), Dựa
trên khai phá dữ liệu (data mining-based), Dựa trên mô hình (model-based), và Một
số kỹ thuật khác [5, 7, 13].
HÌNH 2.4: Tổng quan về xác định vị trí gây lỗi dựa trên phổ chương
trình
Hiện nay, thường thì các kỹ thuật APR đều sử dụng cùng một chiến lược xác
định vị trí lỗi là dựa trên phổ chương trình. Phổ chương trình cung cấp các thông
3 https://www.gnu.org/software/gdb
4 https://docs.microsoft.com/visualstudio/debugger
5 https://www.valgrind.org
6 https://visualvm.github.io
11
Chương 2. Kiến thức nền tảng
tin thực thi của chương trình theo một số khía cạnh nhất định. Phổ chương trình có
thể dùng để theo dõi hành vi của chương trình, do đó nó có ích cho việc xác định
vị trí gây lỗi. Khi một đường thực thi thất bại, những thông tin trên đường thực thi
đó có thể được sử dụng để xác định ra những dòng mã nguồn nghi ngờ gây ra lỗi.
Ví dụ như thông tin về độ phủ mã nguồn (code coverage), hoặc ESHS (Executable
Statement Hit Spectrum) có thể cho ta biết những câu lệnh nào được thực thi khi
thực hiện đường thực thi thất bại. Từ đó, giảm không gian tìm kiếm cho việc xác
định các câu lệnh nghi ngờ gây ra lỗi.
Có nhiều kỹ thuật xác định vị trí gây lỗi dựa trên phổ ra đời (chủ yếu dựa
trên ESHS), trong đó có một kỹ thuật dựa trên hệ số tương đồng nổi tiếng nhất là
Tarantula [20]. Kỹ thuật này sử dụng thông tin về độ phủ các câu lệnh và kết quả
của các lần thực thi bộ kiểm thử. Từ đó, tính ra độ nghi ngờ gây lỗi cho các câu lệnh
trong chương trình theo Công thức 2.1. Giá trị của công thức này được tính bằng tỉ
lệ các ca kiểm thử failed đi qua câu lệnh s chia cho tổng tỉ lệ các ca kiểm failed và
passed đi qua câu lệnh s.
f ailed(s)
Tarantula(s) =
total f ailed
f ailed(s)
total f ailed
Ochiai (s) = p
+
passed(s)
(2.1)
total passed
f ailed(s)
total f ailed × ( f ailed(s) + passed(s)))
(2.2)
Trong đó: s là câu lệnh được tính độ nghi ngờ, f ailed(s) là số lượng ca kiểm thử
thất bại có đường thực thi qua s, passed(s) là số lượng ca kiểm thử thất bại có đường
thực thi qua s, total f ailed là tổng số lượng ca kiểm thử thất bại, total passed là tổng
số lượng ca kiểm thử thành công.
Gần đây, kỹ thuật Ochiai [1] được đề xuất và thực nghiệm cho thấy Ochiai có
kết quả đánh giá tốt hơn so với Tarantula. Độ nghi ngờ của các câu lệnh theo Ochiai
Chương 2. Kiến thức nền tảng
12
được tính theo Công thức 2.2. Hình 2.47 mô tả tổng quan về kỹ thuật xác định vị
trí gây lỗi dựa trên phổ chương trình với độ nghi ngờ của các câu lệnh tính bằng
công thức Ochiai. Với đầu vào là chương trình và bộ ca kiểm thử, thông tin về phổ
chương trình sẽ thu được nhờ thực thi tất cả ca kiểm thử (đường thực thi của ca
kiểm thử chạy qua những câu lệnh nào). Những thư viện hỗ trợ nhiệm vụ này có
thể là JaCoCo8 , PIT9 , v.v. Tiếp đó, những thông tin về phổ này được sử dụng để tính
toán độ nghi ngờ cho từng câu lệnh dựa vào công thức đã đề xuất, giá trị độ nghi
ngờ thuộc đoạn [0.0, 1.0].
2.2.2
Các phương pháp sửa lỗi tự động hiện nay
Hiện nay, các pnghiên cứu sửa lỗi tự động có thể chia thành ba loại chính: sửa lỗi
dựa trên phỏng đoán/cú pháp (heuristic-based), sửa lỗi dựa trên ràng buộc/ngữ
nghĩa (constraint-based), và sửa lỗi dựa trên học máy/dữ liệu (learning-based) [14].
Hình 2.5 mô tả tổng quan các phương pháp sửa lỗi này.
Các phương pháp sửa lỗi dựa trên phỏng đoán thường sử dụng chiến lược Sinh
và Thẩm định (Generate-and-Validate). Sau khi nhận kết quả các vị trí mã nguồn nghi
ngờ có lỗi từ mô-đun xác định vị trí gây lỗi, những phương pháp này đầu tiên sẽ
sinh ra một tập các biến đổi mã nguồn (bằng cách thêm, sửa, xóa các thành phần mã
nguồn ở vị trí lỗi), gọi là không gian tìm kiếm. Sau khi áp dụng những biến đối mã
nguồn này vào chương trình có lỗi sẽ thu được một tập các bản vá ứng cử viên. Quá
trình này gọi là Sinh. Tiếp theo, quá trình Thẩm định sẽ thực thi các ca kiểm thử trên
các chương trình đã áp dụng các bản vá ứng cử viên và đếm số lượng ca kiểm thử
thành công. Nếu tất cả ca kiểm thử đều thành công, thì bản vá ứng cử viên đó được
coi là một bản vá chính thức của chương trình có lỗi ban đầu. Nhược điểm của các
kỹ thuật này là không gian tìm kiếm có thể vô cùng lớn bởi vì có vô số cách kết hợp
của các thành phần mã nguồn với nhau để tạo thành một bản vá. Một số công cụ
tiêu biểu có thể kể đến khi nói đến những phương pháp này bao gồm GenProg [45],
ssFix [49], SimFix [17], HDRepair [24], v.v.
7 https://youtu.be/pJV1oMd-nno?t=60
8 https://www.eclemma.org/jacoco
9 https://pitest.org
Chương 2. Kiến thức nền tảng
13
HÌNH 2.5: Tổng quan về các kỹ thuật sửa lỗi [14]
Các phương pháp sửa lỗi dựa trên ngữ nghĩa sử dụng một phương pháp khác
so với chiến lược của những phương pháp dựa trên phỏng đoán. Những phương
pháp này tập trung xây dựng ra hệ các ràng buộc để phục vụ cho việc sinh các bản
vá. Hệ các ràng buộc này thường mô tả về một phần mã nguồn (mã nguồn vá lỗi)
mà có thể thỏa mãn được về kiểu, giá trị của biến hoặc hành vi được mô tả trong
các ràng buộc. Phần mã nguồn vá lỗi này sẽ được coi như là một hàm ẩn. Ví dụ các
phương pháp thực thi tượng trưng (symbolic execution) có thể trích xuất ra được
các thuộc tính của hàm ẩn này, sau đó các thuộc tính này sẽ được tổng hợp thành
hệ các ràng buộc. Bằng cách sử dụng các bộ giải ràng buộc (ví dụ Z3, CVC4, v.v.)
hoặc các thuật toán tìm kiếm cao cấp, hệ các ràng buộc sẽ được giải. Phần mã nguồn
vá lỗi sẽ được tổng hợp từ kết quả giải hệ các ràng buộc dựa trên các phương pháp
tổng hợp chương trình (program synthesis). Những phương pháp này thường sửa
hiệu quả cho các lỗi liên quan đến các biểu thức điều kiện ở câu lệnh if như sửa điều
kiện sai, thêm điều kiện còn thiếu. Một số công cụ đại diện cho phương pháp này là
SPS [31], Nopol [51], ACS [50], v.v.
- Xem thêm -