Giải thuật rừng ngẫu nhiên xiên phân cho phân lớp dữ liệu có số chiều lớn - Đỗ Thanh Nghị

Phân lóp dữ liệu không cân bằng

lóp quan tâm chiếm tỷ lệ rất thấp (lóp dương, thiêu số)

lóp còn lại chiếm tỷ lệ rất cao (lóp âm, đa số)

giải thuật phân lóp: độ chính xác toàn cục

không dự đoán được lóp thiêu số (dương)

ví dụ: tỷ lệ lớp dương là 5% và lóp âm là 95%

mô hình học M không dự đoán được lóp dương, chỉ luôn dự đoán là lóp âm, thì độ chính xác toàn cục vẫn là 95%

t9 * £ « * > <

Giới thiêu

Rừng ngẫu nhiên xiên phân (RF-ODT)

Kết quã thực nghiệm Hướng phát triển

Rừng ngẫu nhiên xiên phân (RF-ODT)

Phân lóp dữ liệu có số chiều lón

xem xét sự phụ thuộc của các biến

hàm phân hoạch: đa biến (xiên)

phân lóp rất hiệu quả dữ liệu có số chiều lởn

Mở rộng cho các vấn đề

phân lóp dữ liệu không cân bang

phân lóp đa lớp

tăng khả năng chịu đựng nhiễu

 

pdf40 trang | Chia sẻ: trungkhoi17 | Lượt xem: 412 | Lượt tải: 0download
Bạn đang xem trước 20 trang tài liệu Giải thuật rừng ngẫu nhiên xiên phân cho phân lớp dữ liệu có số chiều lớn - Đỗ Thanh Nghị, để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên

Các file đính kèm theo tài liệu này:

  • pdfgiai_thuat_rung_ngau_nhien_xien_phan_cho_phan_lop_du_lieu_co.pdf