Luận án Tiếp cận máy học và hệ chuyên gia để nhận dạng và phát hiện virus máy tính
MỤC LỤC DANH MỤC BẢNG BIỂU. vi DANH MỤC HÌNH ẢNH. vii KÝ HIỆU VÀ VIẾT TẮT. ix CHƯƠNG 1 - MỞ ĐẦU.1 1.1. Giới thiệu đềtài .1 1.1.1. Lý do chọn đềtài .1 1.1.2. Mục tiêu của đềtài.2 1.1.3. Các giai đoạn thực hiện đềtài.2 1.2. Đối tượng, phạm vi nghiên cứu của đềtài.3 1.2.1. Virus máy tính và các hệthống đích .3 1.2.2. Các hệhọc và khám phá tri thức .3 1.2.3. Các hệchuyên gia .4 1.3. Ý nghĩa khoa học và thực tiễn của đềtài .4 1.4. Cấu trúc của luận án.5 CHƯƠNG 2 – CÁC CƠCHẾCHẨN ĐOÁN VIRUS MÁY TÍNH VÀ MỘT SỐVẤN ĐỀLIÊN QUAN.7 2.1. Khảo sát virus máy tính .7 2.2. Các cơchếchẩn đoán virus máy tính .9 2.2.1. Phát hiện virus dựa vào chuỗi nhận dạng .11 2.2.2. Phát hiện virus dựa vào hành vi.11 2.2.3. Phát hiện virus dựa vào ý định .12 2.3. Các hệphòng chống virus máy tính.12 2.3.1. Các sản phẩm trong nước .12 2.3.2. Các sản phẩm nước ngoài .13 2.4. Tình hình nghiên cứu virus máy tính.13 2.4.1. Tình hình nghiên cứu, ứng dụng trong nước .14 2.4.2. Tình hình nghiên cứu, ứng dụng ởnước ngoài .15 2.4.3. Các vấn đềmởcủa công nghệanti-virus.15 - ii - 2.5. Hướng giải quyết của đềtài .16 2.5.1. Các luận điểm của đềtài .17 2.5.2. Giải pháp của đềtài .18 2.6. Các hệcơsởtri thức .19 2.6.1. Các Hệchuyên gia .19 2.6.1.1. Cơsởtri thức.20 2.6.1.2. Động cơsuy diễn .20 2.6.2. Các hệKhám phá tri thức từcơsởdữliệu .20 2.6.2.1. Giới thiệu.20 2.6.2.2. Tiến trình khám phá tri thức .21 2.6.3. Các Hệhọc.22 2.6.3.1. Học giám sát.23 2.6.3.2. Học không giám sát.23 2.6.3.3. Các hình thức học.24 2.6.4. Các nghiên cứu máy học nhận dạng virus máy tính.25 2.6.5. Các nghiên cứu hệchuyên gia nhận dạng virus máy tính .27 2.7. Tổng kết chương .29 CHƯƠNG 3 – CƠCHẾMÁY HỌC CHẨN ĐOÁN VIRUS MÁY TÍNH.30 3.1. Phân hoạch bài toán chẩn đoán virus máy tính.30 3.2. Các độ đo chất lượng chẩn đoán.31 3.3. Cơchếmáy học chẩn đoán virus máy tính .31 3.3.1. Bài toán 1: Chẩn đoán lớp virus C-class .31 3.3.1.1. Phát biểu bài toán .31 3.3.1.2. Tổchức cơsởdữliệu và trích chọn đặc trưng.32 3.3.1.3. Thuật toán chẩn đoán lớp C-class .32 3.3.1.4. Phân tích, đánh giá thuật toán chẩn đoán lớp C-class.33 3.3.2. Bài toán 2: Chẩn đoán lớp virus D-class .34 3.3.2.1. Phát biểu bài toán .34 3.3.2.2. Tổchức cơsởdữliệu.35 - iii - 3.3.2.3. Tổchức không gian tìm kiếm .36 3.3.2.4. Trích chọn đặc trưng .37 3.3.2.5. Luật nhận dạng virus lớp D-class.37 3.3.2.6. Thực nghiệm bài toán chẩn đoán lớp D-class.38 3.3.3. Bài toán 3: Chẩn đoán lớp virus B-class .39 3.3.3.1. Phát biểu bài toán .39 3.3.3.2. Tạo lập cơsởtri thức .40 3.3.3.3. Tổchức cơsởdữliệu.41 3.3.3.4. Trích chọn đặc trưng .41 3.3.3.5. Xây dựng không gian trạng thái.42 3.3.3.6. Cơchếphân tích.43 3.3.3.7. Đánh giá độphức tạp và kết quảthực nghiệm.44 3.3.4. Bài toán 4: Chẩn đoán lớp virus E-class.45 3.3.4.1. Phát biểu bài toán .45 3.3.4.2. Tổchức cơsởdữliệu virus, trích chọn đặc trưng .45 3.3.4.3. Xây dựng cơsởtri thức.46 3.3.4.4. Tổchức cơsởdữliệu thông tin hệthống .46 3.3.4.5. Thiết kế động cơsuy diễn .47 3.3.4.6. Giải thích thuật toán SID .47 3.3.4.7. Các tác tửhoạt động.49 3.3.4.8. Kết quảthực nghiệm .50 3.3.4.9. Đánh giá phương pháp chẩn đoán lớp virus E-class.51 3.3.5. Bài toán 5: Chẩn đoán lớp virus A-class .52 3.3.5.1. Lược sửvấn đềnhận dạng mã độc.52 3.3.5.2. Phát biểu bài toán .54 3.3.5.3. Tổchức cơsởdữliệu virus.54 3.3.5.4. Biểu diễn dữliệu virus bằng mô hình không gian vectơ.55 3.3.5.5. Rút trích đặc trưng .55 3.3.5.6. Ước lượng tỷlệmã độc.56 - iv - 3.3.5.7. Ví dụminh họa bài toán A-class .57 3.3.5.8. Kết quảthực nghiệm .59 3.3.5.9. Bàn luận vềphương pháp chẩn đoán lớp A-class .59 3.4. Tổng kết chương .60 CHƯƠNG 4 – THIẾT KẾXÂY DỰNG HỆTHỐNG VÀ THỰC NGHIỆM.62 4.1. Mô hình tổng quát của hệ.62 4.2. Tổchức cơsởtri thức .62 4.2.1. Mô tả đối tượng .62 4.2.2. Luật nhận dạng virus .64 4.3. Giai đoạn Học dữliệu .65 4.3.1. Trích chọn dữliệu.65 4.3.2. Phân cụm dữliệu .65 4.3.2.1. Tổchức cấu trúc dữliệu.66 4.3.2.2. Thuật toán ACV gom cụm trên V-Tree .67 4.3.2.3. Đánh giá thuật toán ACV.71 4.3.3. Rút luật phân bốtrịthuộc tính .73 4.3.3.1. Rút luật phân cụm trên V-Tree .73 4.3.3.2. Rút luật phân cụm trên ma trận dữliệu.74 4.4. Giai đoạn Xửlý dữliệu .76 4.4.1. Phân loại dữliệu chẩn đoán.79 4.4.1.1. Phân loại đối tượng .79 4.4.1.2. So khớp luật phân nhóm .82 4.4.2. Chẩn đoán virus bằng kỹthuật hợp nhất dữliệu .83 4.4.2.1. Tinh chếdữliệu trong tiến trình khám phá tri thức .83 4.4.2.2. Tinh chếdữliệu NULL bằng kỹthuật hợp nhất dữliệu.83 4.4.2.3. Virus lạvà dữliệu NULL .84 4.4.2.4. Dựbáo virus lạbằng kỹthuật hợp nhất dữliệu .86 4.4.2.5. Kết quảthực nghiệm .88 4.4.2.6. Bàn luận vềkỹthuật DF2RV .90 - v - 4.5. Kết quảthực nghiệm .90 4.5.1. Đánh giá hiệu quảnhận dạng virus của MAV.91 4.5.2. Đánh giá tốc độthực thi của MAV.92 4.6. Tổng kết chương .94 CHƯƠNG 5 - KẾT LUẬN.95 5.1. Những đóng góp mới của đềtài.96 5.2. Hạn chếcủa đềtài, cách khắc phục .97 5.3. Hướng phát triển tương lai.98 5.4. Đềnghịvềcác nghiên cứu tiếp theo.99 CÔNG TRÌNH ĐÃ CÔNG BỐ.100 TÀI LIỆU THAM KHẢO.102 PHỤLỤC 1 – KHẢO SÁT VIRUS MÁY TÍNH.108 PHỤLỤC 2 – CÁC ĐỊNH DẠNG DỮLIỆU NHIỄM VIRUS.117 PHỤLỤC 3 – CÁC TÁC TỬHOẠT ĐỘNG VÀ THUẬT TOÁN SID.128 PHỤLỤC 4 - PHÂN TÍCH HỆTHỐNG PHẦN MỀM MAV.133 PHỤLỤC 5 - PHÂN HỆMÁY CHỦMAVSR.137 PHỤLỤC 6 - PHÂN HỆMÁY TRẠM MAVCL.148
Các file đính kèm theo tài liệu này:
- 3.pdf
- 0.pdf
- 1.pdf
- 2.pdf
- 4.pdf
- 5.pdf
- 6.pdf
- 7.pdf
- 8.pdf
- 9.pdf
- 10.pdf