Tóm tắt Luận án Khai phá và phân tích quan điểm người dùng trên mạng internet
Dữ liệu thực nghiệm^] gồm 190,655 câu và được trích xuất từ 52,574 văn bản đánh giá, tập dữ liệu này đã được sử dụng trong nghiên cứu (Brody và các cộng sự). Gồm sáu nhãn khía cạnh Price, Food, Service, Ambience, Anecdotes, và Miscellaneous, và bốn nhãn quan điểm khía cạnh Positive, Negative, Neutral and Conflict. Từng câu được gán cả hai nhãn khía cạnh và quan điểm tương ứng của khía cạnh. 75% số lượng câu đã cho làm dữ liệu huấn luyện và 25% số lượng câu còn lại được sử dụng để đánh giá chất lượng mô hình.
Dối với các tập véc-tơ biểu diễn từ và bộ từ điển ký tự, chúng tôi sử dụng hai tập véc-tơ biểu diễn từ đang được sử dụng rộng rãi và công bố trên internet là Word2Vec tại địa chi0 và GloVe tại địa chỆỊ. Bộ từ điển ký tự được sử dụng gồm 52 ký tự thông thường của tiếng Anh.
Các file đính kèm theo tài liệu này:
- tom_tat_luan_an_khai_pha_va_phan_tich_quan_diem_nguoi_dung_t.pdf