Khai phá quan điểm với kỹ thuật học sâu

Trần Uyên Trang

Luận án tiến sĩ khai phá quan điểm và kỹ thuật học sâu - Trương Nguyên Trang

Luận án tiến sĩ khám phá quan điểm qua kỹ thuật học sâu.

Trường ĐH

Trường Đại học Bách khoa, Đại học Đà Nẵng

Chuyên ngành

Khoa học máy tính

Tác giả

Luan An

Thể loại

Luận án tiến sĩ

Năm xuất bản

2023

Số trang

164

Thời gian đọc

25 phút

Lượt xem

0

Lượt tải

0

Phí lưu trữ

50 Point

LỜI CAM ĐOAN

DANH MỤC THUẬT NGỮ VÀ TỪ VIẾT TẮT

DANH MỤC BẢNG

DANH MỤC HÌNH

TÍNH CẤP THIẾT CỦA LUẬN ÁN

MỤC TIÊU, ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU CỦA LUẬN ÁN

1. CHƯƠNG 1: TỔNG QUAN VÀ KHAI PHÁ QUAN ĐIỂM VÀ KỸ THUẬT HỌC SÂU

1.1. KHAI PHÁ QUAN ĐIỂM

1.2. CÁC CẤP ĐỘ KHAI PHÁ QUAN ĐIỂM

1.2.1. Khai phá quan điểm mức tài liệu

1.2.2. Khai phá quan điểm mức câu

1.2.3. Khai phá quan điểm mức khía cạnh hay mức đặc trưng

1.3. CÁC HƯỚNG NGHIÊN CỨU KHAI PHÁ QUAN ĐIỂM

1.3.1. Hướng tiếp cận dựa trên ngữ liệu

1.3.2. Hướng tiếp cận máy học

1.3.3. Các nghiên cứu liên quan

1.4. MỘT SỐ HẠN CHẾ CỦA CÁC TIẾP CẬN KHAI PHÁ QUAN ĐIỂM HIỆN NAY

1.5. HỌC SÂU VÀ NHÓM KỸ THUẬT HỌC SÂU ĐƯỢC SỬ DỤNG TRONG CÁC MÔ HÌNH KHAI PHÁ QUAN ĐIỂM ĐỀ XUẤT

1.5.1. Các kỹ thuật học sâu phổ biến dùng trong xử lý ngôn ngữ tự nhiên và khai phá quan điểm

1.6. ĐỀ XUẤT NGHIÊN CỨU: KHAI PHÁ QUAN ĐIỂM VỚI KỸ THUẬT HỌC SÂU

1.7. KẾT LUẬN CHƯƠNG 1

2. CHƯƠNG 2: TRÍCH RÚT KHÍA CẠNH TRONG KHAI PHÁ QUAN ĐIỂM VỚI HƯỚNG TIẾP CẬN HỌC SÂU

2.1. TRÍCH RÚT KHÍA CẠNH VỚI HƯỚNG TIẾP CẬN HỌC SÂU

2.2. MÔ HÌNH TRÍCH RÚT KHÍA CẠNH VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT

2.2.1. Mô hình tích hợp BiGRU-CRF cho trích rút khía cạnh

2.2.2. Mô hình tích hợp Bi-IndyLSTM-CRF cho trích rút khía cạnh

2.3. KẾT QUẢ THỰC NGHIỆM

2.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm

2.3.2. Kết quả thực nghiệm và đánh giá hiệu quả trích rút khía cạnh

2.4. KẾT LUẬN CHƯƠNG 2

3. CHƯƠNG 3: KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI HƯỚNG TIẾP CẬN HỌC SÂU

3.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ

3.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ VỚI TIẾP CẬN HỌC SÂU ĐỀ XUẤT

3.2.1. Mô hình CNN-BiGRU cho trích rút khía cạnh và quan điểm

3.2.2. Mô hình CNN-IOB2 cho trích rút từ mục tiêu

3.2.3. Mô hình MABSA cho trích rút và phân loại ba tác vụ tiếp theo: khía cạnh, thực thể và quan điểm

3.3. KẾT QUẢ THỰC NGHIỆM CÁC MÔ HÌNH

3.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm

3.3.2. Kết quả thực nghiệm, đánh giá hiệu quả khai phá quan điểm đa tác vụ

3.4. KẾT LUẬN CHƯƠNG 3

4. CHƯƠNG 4: KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ, ĐA MIỀN VỚI HƯỚNG TIẾP CẬN HỌC SÂU

4.1. KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA MIỀN

4.2. MÔ HÌNH KHAI PHÁ QUAN ĐIỂM MỨC KHÍA CẠNH ĐA TÁC VỤ ĐA MIỀN ĐỀ XUẤT

4.2.1. Mô hình khai phá quan điểm mức khía cạnh đa miền CNN-BiLSTM

4.2.2. Mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền CNN- BiIndyLSTM-Attention

4.3. KẾT QUẢ THỰC NGHIỆM

4.3.1. Tập dữ liệu và công cụ sử dụng trong thực nghiệm

4.3.2. Kết quả thực nghiệm và đánh giá hiệu quả khai phá quan điểm đa tác vụ trên đơn miền và đa miền

4.4. KẾT LUẬN CHƯƠNG 4

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN

HƯỚNG PHÁT TRIỂN

DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC ĐÃ CÔNG BỐ

TÀI LIỆU THAM KHẢO

I.Khai phá Quan điểm Tổng quan và Kỹ thuật Học sâu

Khai phá quan điểm (Opinion Mining) là lĩnh vực quan trọng trong xử lý ngôn ngữ tự nhiên. Lĩnh vực này tập trung vào việc tự động phát hiện, trích rút và phân tích cảm xúc từ dữ liệu văn bản. Mục tiêu là hiểu quan điểm của người dùng về các thực thể, khía cạnh sản phẩm hoặc dịch vụ. Phân tích cảm xúc (Sentiment Analysis) có ba cấp độ chính: cấp độ tài liệu, cấp độ câu và cấp độ khía cạnh. Cấp độ khía cạnh cung cấp thông tin chi tiết nhất về cảm xúc liên quan đến từng thuộc tính cụ thể. Các phương pháp truyền thống thường dựa trên từ điển ngữ liệu hoặc thuật toán học máy cổ điển. Tuy nhiên, các phương pháp này đối mặt với nhiều hạn chế. Chúng thiếu khả năng khái quát hóa và khó xử lý ngôn ngữ tự nhiên phức tạp. Sự phát triển của học sâu (Deep Learning) mở ra hướng tiếp cận mới. Học sâu mang lại tiềm năng lớn để cải thiện đáng kể hiệu quả khai phá quan điểm. Các mô hình mạng nơ-ron nhân tạo đã chứng minh khả năng học các đặc trưng phức tạp từ dữ liệu. Điều này giúp vượt qua những thách thức của phương pháp cũ.

1.1. Định nghĩa và các cấp độ khai phá quan điểm

Khai phá quan điểm, còn gọi là phân tích cảm xúc, liên quan đến việc xác định thái độ, cảm xúc và chủ quan trong văn bản. Công việc này bao gồm phân loại văn bản thành các cực tính như tích cực, tiêu cực, hoặc trung tính. Ba cấp độ phân tích chính: cấp độ tài liệu, cấp độ câu và cấp độ khía cạnh. Phân tích cấp độ tài liệu đánh giá cảm xúc tổng thể của một văn bản. Phân tích cấp độ câu xác định cảm xúc trong từng câu riêng lẻ. Cấp độ khía cạnh là thách thức nhất. Nó yêu cầu trích rút các khía cạnh hoặc thuộc tính cụ thể được nhắc đến, sau đó xác định cảm xúc đối với từng khía cạnh đó. Phương pháp này cung cấp cái nhìn sâu sắc, chi tiết hơn. Nó rất hữu ích cho các ứng dụng thực tế.

1.2. Hạn chế phương pháp truyền thống và vai trò của học sâu

Các phương pháp khai phá quan điểm truyền thống bao gồm tiếp cận dựa trên từ điển và học máy thống kê. Chúng yêu cầu kỹ thuật đặc trưng thủ công tốn thời gian. Khả năng xử lý ngữ cảnh, đa nghĩa và câu trúc câu phức tạp còn hạn chế. Học sâu (Deep Learning) đã thay đổi bức tranh này. Mạng nơ-ron nhân tạo có khả năng tự động học các biểu diễn đặc trưng hiệu quả từ dữ liệu thô. Các kiến trúc như mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy (RNN) vượt trội trong việc nắm bắt mối quan hệ ngữ nghĩa. Điều này cải thiện độ chính xác và khả năng khái quát hóa của hệ thống. Học sâu đóng vai trò then chốt trong việc giải quyết các thách thức của khai phá quan điểm hiện đại.

1.3. Các kỹ thuật học sâu phổ biến

Nhiều kỹ thuật học sâu được ứng dụng rộng rãi trong khai phá quan điểm. Mạng nơ-ron tích chập (CNN) hiệu quả trong việc trích xuất đặc trưng cục bộ và phân loại văn bản. Mạng nơ-ron hồi quy (RNN), đặc biệt là LSTM và GRU, phù hợp xử lý dữ liệu chuỗi như văn bản. Chúng nắm bắt được mối quan hệ phụ thuộc dài hạn trong câu. Kiến trúc Transformer đã cách mạng hóa xử lý ngôn ngữ tự nhiên. Transformer sử dụng cơ chế attention để xử lý song song và nắm bắt mối quan hệ toàn cục. Các mô hình này là nền tảng cho nhiều nghiên cứu tiên tiến trong phân tích cảm xúc và khai phá ý kiến. Việc kết hợp các kỹ thuật này mang lại hiệu suất vượt trội.

II.Ứng dụng Học sâu trong Trích rút Khía cạnh Hiệu quả

Trích rút khía cạnh là một nhiệm vụ cốt lõi trong khai phá quan điểm mức khía cạnh. Nhiệm vụ này yêu cầu xác định các thuộc tính hoặc thực thể cụ thể mà người dùng đang đưa ra ý kiến. Ví dụ, trong câu 'Điện thoại này có camera tốt nhưng pin yếu', 'camera' và 'pin' là các khía cạnh. Độ chính xác của trích rút khía cạnh ảnh hưởng trực tiếp đến chất lượng phân tích cảm xúc. Các phương pháp truyền thống gặp khó khăn khi xử lý sự đa dạng và phức tạp của ngôn ngữ. Các kỹ thuật học sâu (Deep Learning) cung cấp giải pháp mạnh mẽ cho thách thức này. Luận án đề xuất một số mô hình dựa trên học sâu để cải thiện hiệu quả trích rút khía cạnh. Các mô hình này tận dụng khả năng của mạng nơ-ron để học các biểu diễn ngữ nghĩa sâu sắc từ dữ liệu. Điều này cho phép hệ thống tự động xác định các khía cạnh một cách chính xác hơn. Việc này không cần kỹ thuật đặc trưng thủ công.

2.1. Mục tiêu trích rút khía cạnh

Mục tiêu chính của trích rút khía cạnh là xác định các thực thể hoặc thuộc tính cụ thể trong văn bản. Những thực thể hoặc thuộc tính này thường được gắn với một quan điểm hoặc cảm xúc. Nhiệm vụ này khác với phân loại cảm xúc tổng thể. Nó đi sâu vào các thành phần chi tiết của một đối tượng. Ví dụ, với một bài đánh giá về nhà hàng, các khía cạnh có thể là 'thức ăn', 'dịch vụ', 'không gian'. Trích rút khía cạnh hiệu quả giúp doanh nghiệp hiểu rõ hơn về điểm mạnh và điểm yếu sản phẩm/dịch vụ của họ. Nó cũng cung cấp thông tin có giá trị cho khách hàng tiềm năng. Công việc này đặt nền móng cho phân tích cảm xúc chi tiết hơn.

2.2. Các mô hình học sâu đề xuất

Luận án giới thiệu các mô hình học sâu (Deep Learning) cải tiến cho trích rút khía cạnh. Một mô hình được đề xuất là BiGRU-CRF. Mô hình này kết hợp mạng GRU hai chiều (BiGRU) với Lớp Trường ngẫu nhiên có điều kiện (CRF). BiGRU hiệu quả trong việc nắm bắt thông tin ngữ cảnh từ cả hai hướng của câu. Lớp CRF giúp tạo ra chuỗi nhãn tối ưu, xem xét mối quan hệ phụ thuộc giữa các nhãn. Mô hình khác là Bi-IndyLSTM-CRF. Nó sử dụng Mạng IndyLSTM hai chiều. IndyLSTM giảm thiểu số lượng tham số so với LSTM truyền thống. Điều này giúp tăng tốc độ huấn luyện và giảm thiểu quá khớp. Các kiến trúc này đặc biệt phù hợp với nhiệm vụ gắn nhãn chuỗi như trích rút khía cạnh, mang lại hiệu suất mạnh mẽ.

2.3. Đánh giá hiệu quả thực nghiệm

Hiệu quả của các mô hình học sâu (Deep Learning) đề xuất được đánh giá trên các tập dữ liệu chuẩn. Các tập dữ liệu này đã được gán nhãn cho nhiệm vụ trích rút khía cạnh. Các chỉ số như độ chính xác (Precision), độ thu hồi (Recall) và điểm F1-score được sử dụng để định lượng hiệu suất. Kết quả thực nghiệm cho thấy các mô hình BiGRU-CRF và Bi-IndyLSTM-CRF đạt được độ chính xác cao. Chúng vượt trội hơn so với nhiều phương pháp truyền thống và một số mô hình học sâu trước đó. Hiệu suất được cải thiện chứng tỏ khả năng học biểu diễn ngữ cảnh hiệu quả của các kiến trúc mạng nơ-ron. Điều này khẳng định tiềm năng của kỹ thuật học sâu trong việc nâng cao chất lượng trích rút khía cạnh.

III.Nghiên cứu Khai phá Quan điểm Đa tác vụ với Học sâu

Khai phá quan điểm mức khía cạnh đa tác vụ (MABSA) là một hướng nghiên cứu tiên tiến. Nó giải quyết đồng thời nhiều nhiệm vụ liên quan đến phân tích cảm xúc. Các nhiệm vụ này bao gồm trích rút khía cạnh, trích rút thực thể mục tiêu và phân loại cực tính cảm xúc. Tiếp cận đa tác vụ giúp các mô hình học sâu (Deep Learning) tận dụng mối quan hệ giữa các nhiệm vụ. Điều này dẫn đến cải thiện hiệu suất tổng thể. Thay vì huấn luyện các mô hình riêng biệt cho từng nhiệm vụ, một mô hình duy nhất được thiết kế để học chung. Luận án khám phá các kiến trúc học sâu đa tác vụ hiệu quả. Các mô hình này được thiết kế để xử lý sự phức tạp của việc xác định nhiều loại thông tin cảm xúc trong cùng một câu. Mục tiêu là tạo ra một hệ thống khai phá quan điểm toàn diện và chính xác hơn.

3.1. Giới thiệu khai phá quan điểm đa tác vụ

Khai phá quan điểm đa tác vụ (Multi-task Aspect-based Sentiment Analysis - MABSA) là một phương pháp tiếp cận mạnh mẽ. Nó giải quyết nhiều tác vụ liên quan trong phân tích cảm xúc. Các tác vụ này thường bao gồm trích rút khía cạnh (aspect extraction), trích rút thực thể quan điểm (opinion entity extraction), và phân loại cảm xúc (sentiment classification) cho từng khía cạnh. Bằng cách huấn luyện đồng thời các tác vụ này, mô hình học sâu (Deep Learning) có thể học các biểu diễn chung. Các biểu diễn này hữu ích cho tất cả các tác vụ. Điều này giúp cải thiện hiệu suất cho từng tác vụ riêng lẻ. Nó cũng giúp giảm thiểu dữ liệu gán nhãn cần thiết. Cách tiếp cận đa tác vụ phản ánh cách con người xử lý ngôn ngữ, tích hợp nhiều thông tin khác nhau để hiểu ngữ cảnh.

3.2. Kiến trúc mô hình học sâu đa tác vụ

Luận án đề xuất một số kiến trúc học sâu (Deep Learning) cho khai phá quan điểm đa tác vụ. Một trong số đó là mô hình kết hợp CNN-BiGRU. Kiến trúc này sử dụng mạng nơ-ron tích chập (CNN) để trích xuất các đặc trưng cục bộ. Sau đó, nó sử dụng mạng BiGRU để nắm bắt các mối quan hệ ngữ cảnh dài hạn. Một mô hình khác là CNN-IOB2, được thiết kế để trích rút từ mục tiêu và phân loại cảm xúc. Ngoài ra, mô hình MABSA tích hợp ba tác vụ chính: trích rút khía cạnh, trích rút thực thể và phân loại quan điểm. Các mô hình này được xây dựng để chia sẻ thông tin giữa các tác vụ. Điều này cho phép học hiệu quả hơn và cải thiện khả năng khái quát hóa. Chúng thể hiện khả năng mạnh mẽ trong việc phân tích các thành phần khác nhau của cảm xúc đồng thời.

3.3. Kết quả đánh giá và so sánh

Các mô hình học sâu (Deep Learning) đa tác vụ được đánh giá kỹ lưỡng trên các tập dữ liệu tiêu chuẩn. Kết quả thực nghiệm cho thấy hiệu suất vượt trội của các mô hình đề xuất. Mô hình CNN-BiGRU và MABSA đạt được độ chính xác và điểm F1 cao. Chúng vượt qua các phương pháp đơn tác vụ hoặc các kiến trúc đa tác vụ trước đó. Cụ thể, khả năng trích rút khía cạnh và phân loại cảm xúc đồng thời được cải thiện đáng kể. Sự chia sẻ thông tin giữa các tác vụ trong kiến trúc đa tác vụ chứng minh tính hiệu quả. Điều này giúp mô hình học được các biểu diễn mạnh mẽ hơn. Các kết quả này khẳng định tiềm năng của học sâu trong việc xây dựng hệ thống phân tích cảm xúc toàn diện và chính xác.

IV.Mô hình Học sâu cho Khai phá Quan điểm Đa miền

Khai phá quan điểm đa miền là một thách thức lớn trong xử lý ngôn ngữ tự nhiên. Các mô hình được huấn luyện trên một miền dữ liệu cụ thể (ví dụ: đánh giá phim) thường hoạt động kém hiệu quả khi áp dụng sang miền khác (ví dụ: đánh giá điện thoại). Sự khác biệt về từ vựng, ngữ cảnh và cách biểu đạt quan điểm giữa các miền là nguyên nhân chính. Để giải quyết vấn đề này, luận án tập trung phát triển các mô hình học sâu (Deep Learning) có khả năng thích ứng. Các mô hình này cần duy trì hiệu suất tốt trên nhiều miền dữ liệu khác nhau. Mục tiêu là xây dựng hệ thống phân tích cảm xúc mạnh mẽ, không cần huấn luyện lại hoàn toàn cho mỗi miền mới. Điều này giúp giảm chi phí và thời gian triển khai. Các phương pháp chuyển giao học (transfer learning) và học đa nhiệm (multi-task learning) được tích hợp để đạt được mục tiêu này.

4.1. Thách thức của dữ liệu đa miền

Thách thức chính của khai phá quan điểm đa miền nằm ở sự khác biệt ngữ nghĩa giữa các miền. Một từ có thể mang cảm xúc tích cực ở miền này nhưng trung tính hoặc tiêu cực ở miền khác. Ví dụ, 'khó' có thể tiêu cực cho dịch vụ, nhưng tích cực cho một câu đố. Các mô hình học sâu (Deep Learning) thường gặp khó khăn khi khái quát hóa qua các miền mới. Chúng cần một lượng lớn dữ liệu gán nhãn cho từng miền. Điều này không khả thi trong nhiều trường hợp. Phát triển các mô hình có thể học các đặc trưng miền chung và đặc trưng miền riêng là cần thiết. Khả năng thích ứng với các miền mới mà không cần huấn luyện lại hoàn toàn là mục tiêu quan trọng.

4.2. Thiết kế mô hình học sâu đa miền

Luận án đề xuất các mô hình học sâu (Deep Learning) tiên tiến cho khai phá quan điểm đa miền. Mô hình CNN-BiLSTM được sử dụng để trích rút các đặc trưng ngữ cảnh từ văn bản. Mạng nơ-ron tích chập (CNN) giúp nắm bắt các cụm từ quan trọng. Mạng BiLSTM xử lý các mối quan hệ phụ thuộc dài hạn. Đặc biệt, mô hình CNN-BiIndyLSTM-Attention tích hợp cơ chế attention. Cơ chế này cho phép mô hình tập trung vào các phần quan trọng nhất của câu khi xử lý. Mạng BiIndyLSTM giảm thiểu tham số, tăng hiệu quả tính toán. Các kiến trúc này được thiết kế để học các biểu diễn mạnh mẽ, có thể được chia sẻ giữa các miền. Đồng thời, chúng cũng có khả năng nắm bắt các đặc trưng riêng của từng miền dữ liệu.

4.3. Hiệu suất trên các tập dữ liệu đa miền

Hiệu suất của các mô hình học sâu (Deep Learning) đa tác vụ, đa miền được đánh giá trên nhiều tập dữ liệu từ các miền khác nhau. Các tập dữ liệu này bao gồm đánh giá sản phẩm từ các danh mục như nhà hàng, máy tính xách tay, điện thoại. Kết quả thực nghiệm chứng minh rằng các mô hình đề xuất có khả năng thích ứng tốt. Chúng duy trì độ chính xác cao ngay cả khi chuyển đổi giữa các miền. Đặc biệt, mô hình CNN-BiIndyLSTM-Attention thể hiện hiệu suất vượt trội. Cơ chế attention giúp mô hình học hiệu quả hơn các mối quan hệ ngữ cảnh liên quan đến từng khía cạnh trong các miền khác nhau. Các kết quả này khẳng định khả năng khái quát hóa của các mô hình, mở ra hướng ứng dụng rộng rãi.

V.Kết luận về Học sâu trong Khai phá Quan điểm

Luận án này đã trình bày một cách toàn diện các nghiên cứu về khai phá quan điểm (Opinion Mining) sử dụng kỹ thuật học sâu (Deep Learning). Các mô hình mạng nơ-ron nhân tạo đã được phát triển và kiểm chứng. Chúng thể hiện khả năng giải quyết hiệu quả các thách thức trong trích rút khía cạnh, phân tích cảm xúc đa tác vụ và khai phá quan điểm đa miền. Các đóng góp chính bao gồm việc đề xuất các kiến trúc mạng nơ-ron mạnh mẽ như BiGRU-CRF, Bi-IndyLSTM-CRF, CNN-BiGRU, và các mô hình tích hợp cơ chế attention. Kết quả thực nghiệm trên các tập dữ liệu chuẩn đã chứng minh hiệu quả vượt trội của các phương pháp học sâu này. Việc ứng dụng học sâu đã nâng cao đáng kể độ chính xác và khả năng khái quát hóa của hệ thống khai phá quan điểm. Các hạn chế hiện tại và hướng phát triển tương lai cũng được trình bày, mở ra nhiều tiềm năng nghiên cứu tiếp theo.

5.1. Tóm tắt đóng góp chính của luận án

Luận án đã đóng góp quan trọng vào lĩnh vực khai phá quan điểm (Opinion Mining) và phân tích cảm xúc (Sentiment Analysis). Các đóng góp chính bao gồm việc phát triển các mô hình học sâu (Deep Learning) tiên tiến. Các mô hình này giải quyết ba nhiệm vụ cốt lõi: trích rút khía cạnh (BiGRU-CRF, Bi-IndyLSTM-CRF), khai phá quan điểm mức khía cạnh đa tác vụ (MABSA với CNN-BiGRU, CNN-IOB2) và khai phá quan điểm đa miền (CNN-BiLSTM, CNN-BiIndyLSTM-Attention). Hiệu quả của các mô hình được chứng minh qua thực nghiệm. Các kiến trúc này tận dụng sức mạnh của mạng nơ-ron tích chập (CNN) và mạng nơ-ron hồi quy (RNN) để xử lý dữ liệu ngôn ngữ. Công trình đã khẳng định học sâu là công cụ mạnh mẽ trong phân tích cảm xúc.

5.2. Hạn chế và hướng phát triển tương lai

Mặc dù đạt được nhiều kết quả tích cực, các nghiên cứu vẫn còn một số hạn chế. Khả năng giải thích của các mô hình học sâu (Deep Learning) vẫn là một thách thức. Việc xử lý các biểu hiện cảm xúc phức tạp như mỉa mai, châm biếm cần được cải thiện. Hướng phát triển tương lai bao gồm việc khám phá các kiến trúc Transformer. Các mô hình Transformer đã chứng minh hiệu quả vượt trội trong xử lý ngôn ngữ tự nhiên. Nghiên cứu cũng có thể tập trung vào học tăng cường để cải thiện khả năng thích ứng của mô hình với dữ liệu mới. Phát triển các phương pháp học ít dữ liệu hoặc học không giám sát cũng là một hướng đi đầy tiềm năng. Điều này giúp giải quyết vấn đề thiếu hụt dữ liệu gán nhãn.

24/04/2026

Xem trước tài liệu

Tải đầy đủ để xem toàn bộ nội dung

Luận án tiến sĩ khai phá quan điểm với kỹ thuật học sâu

Tải xuống file đầy đủ để xem toàn bộ nội dung

Tải đầy đủ (164 trang)

Trích đoạn nội dung luận án

Tải xuống để đọc toàn bộ

Đ¾I HàC ĐÀ NÀNG TR¯âNG Đ¾I HàC BÁCH KHOA TRÄN UYÊN TRANG KHAI PHÁ QUAN ĐIÂM VàI Kþ THUÀT HàC SÂU (Opinion mining with deep learning) LUÀN ÁN TI¾N SĨ Kþ THUÀT ĐÀ NẴNG – 2023 Đ¾I HàC ĐÀ NÀNG TR¯âNG Đ¾I HàC BÁCH KHOA TRÄN UYÊN TRANG KHAI PHÁ QUAN ĐIÂM VàI Kþ THUÀT HàC SÂU (Opinion mining with deep learning) Ngcnh: Khoa hác máy tính M愃̀ sĀ: 9.01 LUÀN ÁN TI¾N SĨ Kþ THUÀT Cán bộ h°ớng dẫn: 1. Hoàng Thß Thanh Hà 2. Đặng Hoài Ph°¢ng ĐÀ NẴNG – 2023 ii LâI CAM ĐOAN Tôi xin cam đoan đây là công trình nghiên cứu do tôi thực hiện, dưới sự hướng dẫn của TS. Hoàng Thị Thanh Hà và TS.

Đặng Hoài Phương. Tôi cam đoan các kết quả nghiên cứu được trình bày trong luận án là trung thực và không sao chép từ bất kỳ công trình nghiên cứu nào khác. Mọi trích dẫn trong luận án đều đề cập đến nguồn gốc xuất xứ rõ ràng và đầy đủ. Tác giÁ TrÅn Uyên Trang iii MĀC LĀC LâI CAM ĐOAN.

IV DANH MĀC THUÀT NGĊ VÀ TĆ VI¾T TÂT. VII DANH MĀC BÀNG. IX DANH MĀC HÌNH. TÍNH CÂP THI¾T CĂA LUÀN ÁN.

MĀC TIÊU, ĐÞI T¯þNG VÀ PH¾M VI NGHIÊN CĄU CĂA LUÀN ÁN. 6 CH¯¡NG 1- TàNG QUAN VÀ KHAI PHÁ QUAN ĐIÂM VÀ Kþ THUÀT HàC SÂU. KHAI PHÁ QUAN ĐIÂM. CÁC CÂP ĐÞ KHAI PHÁ QUAN ĐIÂM.

Khai phá quan điểm mức tài liệu. Khai phá quan điểm mức câu. Khai phá quan điểm mức khía cạnh hay mức đặc trưng. CÁC H¯àNG NGHIÊN CĄU KHAI PHÁ QUAN ĐIÂM.

Hướng tiếp cận dựa trên ngữ liệu. Hướng tiếp cận máy học. Các nghiên cứu liên quan. MÞT SÞ H¾N CH¾ CĂA CÁC TI¾P CÀN KHAI PHÁ QUAN ĐIÂM HIÞN NAY.

HàC SÂU VÀ NHÓM Kþ THUÀT HàC SÂU Đ¯þC SĈ DĀNG TRONG CÁC MÔ HÌNH KHAI PHÁ QUAN ĐIÂM ĐÀ XUÂT. Các kỹ thuật học sâu phổ biến dùng trong xử lý ngôn ngữ tự nhiên và khai phá quan điểm. ĐÀ XUÂT NGHIÊN CĄU: KHAI PHÁ QUAN ĐIÂM VàI Kþ THUÀT HàC SÂU. K¾T LUÀN CH¯¡NG 1.

47 CH¯¡NG 2-TRÍCH RÚT KHÍA C¾NH TRONG KHAI PHÁ QUAN ĐIÂM VàI H¯àNG TI¾P CÀN HàC SÂU. TRÍCH RÚT KHÍA C¾NH VàI H¯àNG TI¾P CÀN HàC SÂU. MÔ HÌNH TRÍCH RÚT KHÍA C¾NH VàI TI¾P CÀN HàC SÂU ĐÀ XUÂT. Mô hình tích hợp BiGRU-CRF cho trích rút khía cạnh.

Mô hình tích hợp Bi-IndyLSTM-CRF cho trích rút khía cạnh. K¾T QUÀ THČC NGHIÞM. Tập dữ liệu và công cụ sử dụng trong thực nghiệm. Kết quả thực nghiệm và đánh giá hiệu quả trích rút khía cạnh.

K¾T LUÀN CH¯¡NG 2. 67 CH¯¡NG 3-KHAI PHÁ QUAN ĐIÂM MĄC KHÍA C¾NH ĐA TÁC VĀ VàI H¯àNG TI¾P CÀN HàC SÂU. KHAI PHÁ QUAN ĐIÂM MĄC KHÍA C¾NH ĐA TÁC VĀ. MÔ HÌNH KHAI PHÁ QUAN ĐIÂM MĄC KHÍA C¾NH ĐA TÁC VĀ VàI TI¾P CÀN HàC SÂU ĐÀ XUÂT.

Mô hình CNN-BiGRU cho trích rút khía cạnh và quan điểm. Mô hình CNN-IOB2 cho trích rút từ mục tiêu. Mô hình MABSA cho trích rút và phân loại ba tác vụ tiếp theo: khía cạnh, thực thể và quan điểm. K¾T QUÀ THČC NGHIÞM CÁC MÔ HÌNH.

Tập dữ liệu và công cụ sử dụng trong thực nghiệm. Kết quả thực nghiệm, đánh giá hiệu quả khai phá quan điểm đa tác vụ 91 3. K¾T LUÀN CH¯¡NG 3. 97 CH¯¡NG 4-KHAI PHÁ QUAN ĐIÂM MĄC KHÍA C¾NH ĐA TÁC VĀ, ĐA MIÀN VàI H¯àNG TI¾P CÀN HàC SÂU.

KHAI PHÁ QUAN ĐIÂM MĄC KHÍA C¾NH ĐA MIÀN. MÔ HÌNH KHAI PHÁ QUAN ĐIÂM MĄC KHÍA C¾NH ĐA TÁC VĀ ĐA MIÀN ĐÀ XUÂT. Mô hình khai phá quan điểm mức khía cạnh đa miền CNN-BiLSTM. Mô hình khai phá quan điểm mức khía cạnh đa tác vụ, đa miền CNN- BiIndyLSTM-Attention.

K¾T QUÀ THČC NGHIÞM. Tập dữ liệu và công cụ sử dụng trong thực nghiệm. Kết quả thực nghiệm và đánh giá hiệu quả khai phá quan điểm đa tác vụ trên đơn miền và đa miền. K¾T LUÀN CH¯¡NG 4.

124 K¾T LUÀN VÀ H¯àNG PHÁT TRIÂN. 126 H¯àNG PHÁT TRIÂN. 132 DANH MĀC CÁC CÔNG TRÌNH KHOA HàC ĐÃ CÔNG BÞ. 133 TÀI LIÞU THAM KHÀO.

135 vi DANH MĀC THUÀT NGĊ VÀ TĆ VI¾T TÂT STT ThuÁt ngċ Ti¿ng Anh Vi¿t tÃt 1 Đ¡n vß tuyến tính đ°ợc chỉnh Rectified Linear Unit ReLU l°u 2 Hác máy Machine learning ML 3 Hác sâu Deep learning DL 4 Khai phá quan điểm/Phân tích Opinion mining/Sentiment analysis OM/SA cảm xúc 5 Khai phá quan điểm māc tci Document_based sentiment analysis DBSA liệu 6 Khai phá quan điểm māc câu Sentence_based sentiment analysis SBSA 7 Khai phá quan điểm māc khía Aspect/Feature_based sentiment ABSA c¿nh/đặc tr°ng analysis 8 Khai phá quan điểm māc khía Multitask aspect/feature_based MABSA c¿nh/đặc tr°ng đa tác vụ sentiment analysis 9 Khai phá quan điểm māc khía Multidomain aspect/feature_based c¿nh/đặc tr°ng đa miền sentiment analysis 10 Ma trận đồng xuất hiện Co-occurrence matrix 11 M¿ng neural hồi quy Recurrent Neural Network RNN 12 M¿ng neural hồi quy hai Bidirectional Recurrent Neural BiRNN chiều Network 13 M¿ng bộ nhớ ngắn dci Long_Short Term Memory LSTM 14 M¿ng bộ nhớ ngắn dci hai Bidirectional Long_Short Term BiLSTM chiều Memory 15 M¿ng bộ nhớ ngắn dci độc lập Independently Long_Short Term IndyLSTM Memory 16 M¿ng bộ nhớ ngắn dci độc lập Bidirectional Independently BiIndyLSTM hai chiều Long_Short Term Memory 17 M¿ng đ¡n vß hồi quy có cổng Gated Recurrent Unit GRU 18 M¿ng đ¡n vß hồi quy có cổng Bidirectional Gated Recurrent Unit BiGRU hai chiều 19 M¿ng neural đệ quy Recursive Neural Network 20 M¿ng neural tích chập Convolutional Neural Network CNN 21 Máy vector hỗ trợ Support Vector Machine SVM 22 Mô hình Markov ẩn Hidden Markov Models HMM 23 Phân bổ Dirichlet tiềm ẩn Latent Dirichlet Allocation LDA 24 Phân lo¿i miền Domain classification 25 Phân lo¿i quan điểm Sentiment classification 26 Phân rã đ¿o hcm Gradient decay 27 Phân tích ngữ nghĩa tiềm ẩn Latent Semantic Analysis LSA 28 Phân tích ngữ nghĩa tiềm ẩn Probabilistic Latent Semantic pLSA xác suất Analysis 29 Quan điểm Opinion 30 Quan điểm tích cực Positive opinion 31 Quan điểm tiêu cực Negative opinion 32 Quan điểm trung lập Neutral opinion vii 33 Quá khớp Overfitting 34 Trích rút khía c¿nh Aspect extraction 35 Trích rút từ mục tiêu quan Opinion target extraction điểm 36 Trích rút thực thể Entity extraction 37 Tr°ßng ngẫu nhiên có điều Conditional Random Field CRF kiện 38 Triệt tiêu/bùng nổ đ¿o hcm Vanishing/exploding gradient 39 Vector tocn cục Global Vector GloVe viii DANH MĀC BÀNG BÁng 1. Các mô hình khai phá quan điểm dựa trên h°ớng tiếp cận ngữ liệu nổi bật vc hiệu suất cÿa các mô hình. Các mô hình khai phá quan điểm dựa trên h°ớng tiếp cận máy hác nổi bật vc hiệu suất cÿa các mô hình. Tập dữ liệu SemEval 2014.

So sánh độ đo F1 trên mô hình BiGRU-CRF và Bi-IndyLSTM-CRF với các mô hình hiện có. Sử dụng miền Restaurant trong tập dữ liệu SemEval 2016 cho thực nghiệm. Kết quả thực nghiệm mô hình hiện có so với các mô hình đề xuất cÿa luận án trong Ch°¡ng 2 vc Ch°¡ng 3 trên miền Laptop cÿa tập dữ liệu SemEval 2014. Kết quả thực nghiệm mô hình hiện có so với các mô hình đề xuất cÿa luận án trong Ch°¡ng 2 vc Ch°¡ng 3 trên miền Restaurant cÿa tập dữ liệu SemEval 2014.

Kết quả thực nghiệm xét trên độ đo F1 vc Accuracy cÿa các mô hình hiện có vc mô hình CNN-IOB2 trên miền Restaurant cÿa SemEval 2016. Kết quả thực nghiệm mô hình MABSA đề xuất xét trên các độ đo Precision, Recall, F1 vc Accuracy trên miền Restaurant cÿa tập SemEval 2016. Tập dữ liệu huấn luyện gồm các đ¡n miền Restaurant, Laptop cÿa tập SemEval 2016, đa miền Laptop_Restaurant, vc đa miền Laptop_Restaurant_Hotel. Trích rút khía c¿nh xét trên độ đo Precision, Recall vc F1 cÿa hai mô hình đề xuất so với các mô hình hiện có trên miền Laptop vc Restaurant.

Kết quả thực nghiệm mô hình CNN-BiLSTM trên đa miền Laptop_Restaurant. Kết quả thực nghiệm mô hình CNN-BiIndyLSTM-Attention trên đa miền Laptop_Restaurant_Hotel. Trích rút khía c¿nh xét trên độ đo Precision, Recall vc F1 cÿa hai mô hình đề xuất so với các mô hình hiện có trên đ¡n miền Restaurant, đa miền Laptop_Restaurant vc đa miền Laptop_Restaurant_Hotel. Bảng tổng hợp đặc điểm cÿa các mô hình khai phá quan điểm đề xuất.

128 ix DANH MĀC HÌNH Hình 1. Các cấp độ cụ thể trong khai phá quan điểm. Mô hình m¿ng neural đ¡n giản gồm 1 lớp ẩn. Mô hình m¿ng hác sâu gồm 3 lớp ẩn.

M¿ng neural tích chập. Tính toán với MaxPooling. Mô hình CNN trong xử lý văn bản. Mô hình m¿ng RNN vc các tính toán bên trong RNN.

Cấu trúc cÿa mô-đun trong RNN. Cấu trúc cÿa mô-đun trong LSTM. Cấu trúc chi tiết cÿa một mô-đun LSTM. Cấu trúc m¿ng BiLSTM.

Cấu trúc c¡ bản cÿa GRU. Cấu trúc m¿ng BiGRU. Cấu trúc m¿ng Bidirectional IndyLSTM. Quy trình trích rút khía c¿nh cÿa mô hình BiGRU-CRF.

Cấu trúc mô hình BiGRU-CRF cho trích rút khía c¿nh trong câu quan điểm. Quy trình trích rút khía c¿nh cÿa mô hình Bi-IndyLSTM-CRF. Cấu trúc mô hình Bi-IndyLSTM-CRF cho trích rút khía c¿nh trong câu quan điểm. Biểu đồ so sánh độ chính xác F1 cÿa hai mô hình đề xuất với các mô hình đ愃̀ đ°ợc đánh giá cao tr°ớc đây.

Quy trình trích rút, phân lo¿i khía c¿nh vc quan điểm cÿa mô hình CNN-BiGRU. Cấu trúc mô hình CNN-BiGRU cho khai phá quan điểm māc khía c¿nh trích rút đồng thßi khía c¿nh vc quan điểm. Quy trình trích rút từ mục tiêu cÿa mô hình CNN-IOB2. Cấu trúc mô hình CNN-IOB2 cho trích rút từ mục tiêu.

Quy trình trích rút, phân lo¿i khía c¿nh, thực thể vc quan điểm cÿa mô hình MABSA. Cấu trúc mô hình khai phá quan điểm māc khía c¿nh đa tác vụ MABSA cho phân lo¿i khía c¿nh, thực thể vc quan điểm. So sánh độ chính xác cÿa tác vụ trích rút khía c¿nh xét trên độ đo F1 cÿa các mô hình hiện có so với mô hình CNN-BiGRU đề xuất. So sánh độ chính xác cÿa tác vụ phân lo¿i quan điểm xét trên độ đo Accuracy cÿa mô hình hiện có so với mô hình CNN-BiGRU đề xuất.

Biểu đồ so sánh độ chính xác cÿa mô hình đề xuất với các mô hình hiện có xét trên độ đo F1 vc Accuracy. Biểu đồ biểu diễn độ đo Precision, Recall, F1 vc Accuracy cÿa mô hình MABSA đề xuất. Quy trình thực hiện cÿa mô hình khai phá quan điểm māc khía c¿nh đa miền CNN- BiLSTM. Cấu trúc mô hình khai phá quan điểm māc khía c¿nh đa miền CNN-BiLSTM.

Quy trình thực hiện cÿa mô hình CNN-BiIndyLSTM-Attention. Cấu trúc mô hình khai phá quan điểm māc khía c¿nh đa tác vụ đa miền .

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Câu hỏi thường gặp

Luận án "Khai phá quan điểm với kỹ thuật học sâu" nghiên cứu về vấn đề gì?

Luận án tiến sĩ khám phá quan điểm qua kỹ thuật học sâu.

Luận án "Khai phá quan điểm với kỹ thuật học sâu" được bảo vệ tại trường nào?

Luận án này được bảo vệ tại Trường Đại học Bách khoa, Đại học Đà Nẵng. Năm bảo vệ: 2023.

Luận án "Khai phá quan điểm với kỹ thuật học sâu" thuộc chuyên ngành gì?

Luận án "Khai phá quan điểm với kỹ thuật học sâu" thuộc chuyên ngành Khoa học máy tính. Danh mục: Công Nghệ Thông Tin.

Luận án "Khai phá quan điểm với kỹ thuật học sâu" có bao nhiêu trang?

Luận án "Khai phá quan điểm với kỹ thuật học sâu" có 164 trang. Bạn có thể xem trước một phần tài liệu ngay trên trang web trước khi tải về.

Cách tải luận án "Khai phá quan điểm với kỹ thuật học sâu" về máy như thế nào?

Để tải luận án về máy, bạn nhấn nút "Tải xuống ngay" trên trang này, sau đó hoàn tất thanh toán phí lưu trữ. File sẽ được tải xuống ngay sau khi thanh toán thành công. Hỗ trợ qua Zalo: 0559 297 239.

Luận án liên quan

Chia sẻ tài liệu: Facebook Twitter

Mục lục chi tiết

Tóm tắt nội dung