Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp

Luận án Tiến sĩ: Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp 2024

Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp thông qua kỹ thuật tối ưu hóa cấu trúc và tham số.

Trường ĐH

Trường Đại học Tây Bắc

Chuyên ngành

Khoa học máy tính

Tác giả

Luan An

Thể loại

Luận án

Năm xuất bản

2024

Số trang

118

Thời gian đọc

18 phút

Lượt xem

2

Lượt tải

0

Phí lưu trữ

40 Point

LỜI CAM ĐOAN

LỜI CẢM ƠN

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

DANH MỤC CÁC HÌNH VẼ

DANH MỤC CÁC BẢNG BIỂU

MỞ ĐẦU

1. CHƯƠNG 1: MÔ HÌNH RBF RÚT GỌN TRONG BÀI TOÁN PHÂN LỚP

1.1. Giới thiệu mô hình RBF

1.2. SVM: mô hình phân lớp RBF dựa trên lề cực đại

1.2.1. SVM tuyến tính

1.2.2. SVM phi tuyến sử dụng hàm nhân RBF

1.3. RVM: mô hình phân lớp RBF dựa trên suy luận Bayes

1.3.1. Mô hình Bayes rút gọn

1.3.2. Phân lớp với mô hình Bayes rút gọn

1.4. Độ phức tạp tính toán của các thuật toán

1.4.1. Độ phức tạp tính toán của SVM

1.4.2. Độ phức tạp tính toán của RVM

1.5. Mô hình lai học sâu và RBF

1.5.1. Mô hình học sâu trong phân lớp

1.5.2. Mô hình lai CNN-SVM

1.5.3. Đề xuất mô hình lai CNN-RBF tổng quát

1.6. Kết chương

2. CHƯƠNG 2: CÁC THUẬT TOÁN HUẤN LUYỆN NHANH MÔ HÌNH RBF RÚT GỌN

2.1. Các phương pháp huấn luyện mô hình RBF rút gọn

2.1.1. Các kỹ thuật tăng tốc SVM

2.1.2. Các kỹ thuật tăng tốc RVM

2.2. Dữ liệu thực nghiệm và đánh giá hiệu năng phân lớp

2.2.1. Dữ liệu thực nghiệm

2.2.2. Đánh giá hiệu năng phân lớp

2.3. Thuật toán SimpSVM ngẫu nhiên

2.3.1. Thuật toán SimpSVM-GD

2.3.2. Đề xuất thuật toán SimpSVM-SVD

2.4. Thuật toán FastRVM

2.4.1. Thuật toán RVM2

2.4.2. Đề xuất thuật toán FastRVM

2.5. Kết chương

3. CHƯƠNG 3: ỨNG DỤNG MÔ HÌNH RBF RÚT GỌN TRONG PHÂN LỚP ĐỐI TƯỢNG

3.1. Phân lớp nhận dạng ngôn ngữ ký hiệu

3.1.1. Mô tả tập dữ liệu

3.1.2. Trích chọn đặc trưng

3.1.3. Lựa chọn tham số

3.1.4. Phân lớp ký hiệu

3.2. Phân lớp nhận dạng cử chỉ người

3.2.1. Tập dữ liệu

3.2.2. Trích chọn đặc trưng

3.2.3. Lựa chọn tham số

3.2.4. Phân lớp cử chỉ, hành động

3.3. Phân lớp nhận dạng ảnh hoa

3.3.1. Tập dữ liệu

3.3.2. Trích chọn đặc trưng

3.3.3. Lựa chọn tham số

3.3.4. Phân lớp ảnh hoa

3.4. Kết chương

KẾT LUẬN

DANH MỤC CÔNG TRÌNH KHOA HỌC

TÀI LIỆU THAM KHẢO

I.Mô hình RBF rút gọn Nâng cao hiệu năng phân lớp

Luận án tập trung vào việc cải thiện hiệu năng mô hình RBF trong các bài toán phân lớp. Các mô hình RBF rút gọn mang lại lợi thế về tốc độ và khả năng tổng quát hóa. Nghiên cứu đề xuất các phương pháp mới để tối ưu hóa quá trình huấn luyện và cấu trúc của mô hình RBF. Mục tiêu chính là giảm độ phức tạp tính toán mà vẫn duy trì hoặc tăng cường độ chính xác. Điều này bao gồm việc phát triển các thuật toán phân lớp hiệu quả hơn. Các ứng dụng thực tế của mạng RBF trong nhiều lĩnh vực cũng được khám phá. Nghiên cứu đóng góp vào lĩnh vực học máy và học có giám sát bằng cách cung cấp các giải pháp tối ưu hóa RBF tiên tiến. Các phương pháp mới giúp các mô hình RBF rút gọn hoạt động hiệu quả hơn trên các tập dữ liệu lớn.

1.1. Giới thiệu tổng quan về mô hình RBF

Mô hình RBF (Radial Basis Function) là một công cụ mạnh mẽ trong học máy, đặc biệt trong các bài toán phân lớp và hồi quy. Cấu trúc mạng RBF bao gồm ba lớp: lớp đầu vào, lớp ẩn với các hàm cơ sở xuyên tâm, và lớp đầu ra. Mỗi hàm cơ sở có tâm và độ rộng riêng, phản ứng mạnh nhất khi dữ liệu đầu vào gần tâm của nó. Điều này cho phép mô hình RBF học các mối quan hệ phi tuyến phức tạp trong dữ liệu. Tuy nhiên, việc huấn luyện mô hình RBF truyền thống có thể tốn kém về mặt tính toán, đặc biệt với dữ liệu lớn. Các phương pháp RBF rút gọn ra đời nhằm giải quyết vấn đề này. Mục tiêu là giảm số lượng các hàm cơ sở mà vẫn duy trì hiệu năng mô hình cao. Điều này giúp tăng tốc độ huấn luyện và dự đoán, làm cho mô hình RBF trở nên thiết thực hơn trong nhiều ứng dụng.

1.2. SVM và RVM Các mô hình phân lớp RBF nền tảng

Hai trong số các mô hình RBF phổ biến nhất là Support Vector Machine (SVM) và Relevance Vector Machine (RVM). SVM sử dụng hàm nhân RBF để ánh xạ dữ liệu vào không gian đặc trưng có chiều cao hơn, cho phép tìm kiếm một siêu phẳng phân lớp tối ưu với lề cực đại. SVM hiệu quả nhưng có thể tạo ra số lượng Support Vector (SV) lớn, làm tăng độ phức tạp tính toán. RVM, ngược lại, là một mô hình Bayes rút gọn dựa trên suy luận Bayes. RVM cũng sử dụng hàm nhân RBF nhưng có khả năng tạo ra một mô hình RBF rút gọn hơn đáng kể bằng cách xác định ít Relevance Vector (RV) hơn so với SV của SVM. Số lượng RV ít hơn giúp cải thiện hiệu năng mô hình về mặt tốc độ dự đoán và yêu cầu bộ nhớ, đồng thời vẫn duy trì độ chính xác cao trong bài toán phân lớp. Nghiên cứu khám phá cách tối ưu hóa RBF thông qua việc so sánh và cải tiến các thuật toán này.

1.3. Mô hình lai Kết hợp học sâu với RBF

Mô hình học sâu (Deep Learning) đã chứng minh khả năng vượt trội trong việc trích chọn đặc trưng tự động và khử chiều dữ liệu. Kết hợp mô hình học sâu với mô hình RBF mở ra hướng nghiên cứu mới để nâng cao hiệu năng mô hình phân lớp. Luận án xem xét mô hình lai CNN-SVM, nơi mạng nơ-ron tích chập (CNN) được sử dụng để trích xuất đặc trưng mạnh mẽ từ dữ liệu thô, sau đó SVM thực hiện phân lớp trên các đặc trưng này. Đi xa hơn, luận án đề xuất mô hình lai CNN-RBF tổng quát. Mô hình này tận dụng khả năng học đặc trưng của CNN và khả năng phân lớp hiệu quả của mạng RBF. Sự kết hợp này nhằm khắc phục nhược điểm của từng mô hình riêng lẻ, tạo ra một thuật toán phân lớp mạnh mẽ hơn, đặc biệt đối với dữ liệu phức tạp như ảnh và chuỗi thời gian, từ đó nâng cao hiệu năng mô hình tổng thể.

II.Tối ưu hóa thuật toán huấn luyện RBF rút gọn

Việc tối ưu hóa RBF là yếu tố then chốt để các mô hình RBF rút gọn có thể ứng dụng rộng rãi. Các thuật toán phân lớp truyền thống thường đối mặt với vấn đề độ phức tạp tính toán cao khi xử lý dữ liệu lớn. Phần này trình bày các phương pháp huấn luyện nhanh, đặc biệt là các kỹ thuật tăng tốc cho SVM và RVM. Mục tiêu là giảm thời gian huấn luyện mà không làm giảm đáng kể hiệu năng mô hình. Nghiên cứu khám phá các cải tiến trên các thuật toán hiện có và đề xuất các thuật toán mới. Các thuật toán này tập trung vào việc lựa chọn các hàm cơ sở một cách hiệu quả hơn, hoặc sử dụng các kỹ thuật xấp xỉ để tăng tốc quá trình huấn luyện của mô hình RBF. Các phương pháp này đóng vai trò quan trọng trong việc triển khai học máy trên các hệ thống có tài nguyên hạn chế hoặc yêu cầu thời gian thực.

2.1. Kỹ thuật tăng tốc huấn luyện RBF rút gọn

Để nâng cao hiệu năng mô hình và giảm độ phức tạp tính toán, nhiều kỹ thuật tối ưu hóa RBF đã được phát triển. Đối với SVM, các kỹ thuật tăng tốc bao gồm sử dụng các phương pháp tập con (subset methods), tối ưu hóa từng phần (decomposition methods) hoặc các thuật toán ngẫu nhiên. Các kỹ thuật này giúp xử lý các tập dữ liệu lớn hơn mà vẫn giữ được đặc tính phân lớp của SVM. Đối với RVM, các cải tiến thường tập trung vào việc tối ưu hóa quy trình ước tính tham số Bayes và lựa chọn Relevance Vector. Mục tiêu là giảm số lượng các vector liên quan, từ đó tạo ra một mô hình RBF rút gọn và nhanh hơn trong quá trình dự đoán. Việc kết hợp các chiến lược này giúp rút ngắn đáng kể thời gian huấn luyện của mô hình RBF, đồng thời duy trì độ chính xác cần thiết cho bài toán phân lớp trong học có giám sát.

2.2. Thuật toán SimpSVM ngẫu nhiên

Thuật toán SimpSVM ngẫu nhiên được phát triển nhằm tối ưu hóa RBF trong ngữ cảnh của SVM. SimpSVM-GD là một phiên bản khởi điểm, nhưng luận án đề xuất một thuật toán mới: SimpSVM-SVD (Singular Value Decomposition). SimpSVM-SVD sử dụng phân tích giá trị suy biến để lựa chọn các Support Vector một cách hiệu quả hơn. Kỹ thuật này giúp giảm số lượng SV, tạo ra một mô hình RBF rút gọn mà vẫn duy trì khả năng phân lớp cao. Việc giảm số lượng SV trực tiếp cải thiện hiệu năng mô hình về mặt tốc độ huấn luyện và dự đoán. SimpSVM-SVD tận dụng các đặc tính của dữ liệu để tìm ra một tập hợp các SV đại diện hơn, từ đó khử chiều một cách hiệu quả và giảm độ phức tạp tính toán của mạng RBF. Kết quả là một thuật toán phân lớp nhanh hơn và hiệu quả hơn cho các ứng dụng thực tế.

2.3. Thuật toán FastRVM cải tiến

Trong nỗ lực tối ưu hóa RBF cho RVM, luận án cũng nghiên cứu và đề xuất thuật toán FastRVM. Các thuật toán trước đó như RVM2 đã đạt được những cải tiến nhất định so với RVM gốc. Tuy nhiên, FastRVM được thiết kế để đẩy nhanh hơn nữa quá trình huấn luyện và phân lớp. FastRVM tập trung vào việc tinh chỉnh cơ chế lựa chọn Relevance Vector và cập nhật tham số Bayes. Mục tiêu là xác định nhanh chóng các RV quan trọng nhất, từ đó xây dựng một mô hình RBF rút gọn với số lượng vector cơ sở tối thiểu. Điều này làm giảm đáng kể độ phức tạp tính toán và thời gian cần thiết để huấn luyện mô hình RBF. FastRVM mang lại hiệu năng mô hình vượt trội, đặc biệt hữu ích trong các tình huống yêu cầu học máy nhanh chóng và đáng tin cậy trên các tập dữ liệu lớn, giúp mở rộng ứng dụng của học có giám sát.

III.Đánh giá hiệu năng mô hình RBF trên dữ liệu thực

Việc đánh giá hiệu năng mô hình là bước thiết yếu để xác nhận hiệu quả của các thuật toán phân lớp và phương pháp tối ưu hóa RBF được đề xuất. Phần này trình bày chi tiết về quá trình thử nghiệm, từ việc lựa chọn dữ liệu thực nghiệm đến các tiêu chí đánh giá cụ thể. Các kết quả thực nghiệm chứng minh khả năng của các mô hình RBF rút gọn trong việc cân bằng giữa độ phức tạp tính toán và độ chính xác. Mục tiêu là cho thấy các cải tiến không chỉ mang tính lý thuyết mà còn có giá trị thực tiễn. Điều này bao gồm việc so sánh các thuật toán mới với các phương pháp hiện có để làm nổi bật những đóng góp của nghiên cứu. Các thử nghiệm được thực hiện một cách có hệ thống, đảm bảo tính khách quan và khả năng tái lập của các kết quả về mô hình RBF trong học máy.

3.1. Thiết lập môi trường và dữ liệu thực nghiệm

Để đánh giá hiệu năng phân lớp của các mô hình RBF rút gọn, nhiều tập dữ liệu thực nghiệm đa dạng đã được sử dụng. Các tập dữ liệu này bao gồm các bộ dữ liệu chuẩn trong học máy cũng như các tập dữ liệu thực tế từ các bài toán phân lớp cụ thể. Việc lựa chọn kỹ lưỡng các tập dữ liệu đảm bảo rằng các thuật toán phân lớp được kiểm tra trong nhiều kịch bản khác nhau. Điều này giúp đánh giá khả năng tổng quát hóa và độ bền của các phương pháp tối ưu hóa RBF. Môi trường thực nghiệm được thiết lập để đảm bảo tính công bằng trong các phép so sánh. Các tham số của mô hình RBF được tinh chỉnh cẩn thận để đạt được hiệu năng mô hình tối ưu trên từng tập dữ liệu, phản ánh điều kiện ứng dụng thực tế.

3.2. Tiêu chí đánh giá hiệu năng phân lớp

Các tiêu chí đánh giá hiệu năng phân lớp đóng vai trò quan trọng trong việc định lượng sự cải thiện của các mô hình RBF rút gọn. Độ chính xác (Accuracy), độ đo F1-score, độ nhạy (Recall) và độ đặc hiệu (Precision) là những chỉ số chính được sử dụng để đánh giá chất lượng phân lớp. Ngoài ra, thời gian huấn luyện và số lượng Support Vector (SV) hoặc Relevance Vector (RV) được dùng để đo lường độ phức tạp tính toán và mức độ rút gọn của mô hình RBF. Một mô hình RBF rút gọn lý tưởng phải có độ chính xác cao, thời gian huấn luyện ngắn và số lượng vector cơ sở nhỏ. Các tiêu chí này cung cấp một cái nhìn toàn diện về hiệu năng mô hình, cho phép so sánh khách quan giữa các thuật toán phân lớp khác nhau trong học máy.

3.3. So sánh hiệu quả thuật toán tối ưu RBF

Kết quả so sánh giữa các thuật toán phân lớp được đề xuất (SimpSVM-SVD, FastRVM) và các phương pháp hiện có (SVM, RVM2) cho thấy những cải tiến rõ rệt. Các mô hình RBF rút gọn được tối ưu hóa đã chứng minh khả năng giảm đáng kể thời gian huấn luyện. Đồng thời, hiệu năng mô hình về độ chính xác và độ đo F1-score vẫn được duy trì ở mức cao hoặc thậm chí được cải thiện. Đặc biệt, số lượng Support Vector và Relevance Vector giảm đáng kể, khẳng định hiệu quả của các kỹ thuật tối ưu hóa RBF trong việc tạo ra mô hình RBF rút gọn hơn. Điều này không chỉ giúp giảm độ phức tạp tính toán mà còn tăng tính khả thi của việc triển khai mạng RBF trên các ứng dụng yêu cầu tốc độ và hiệu quả bộ nhớ, đặc biệt trong học có giám sát.

IV.Ứng dụng mô hình RBF rút gọn trong phân lớp đối tượng

Khả năng phân lớp hiệu quả của mô hình RBF rút gọn được kiểm chứng qua các ứng dụng thực tế. Nghiên cứu tập trung vào ba bài toán cụ thể: nhận dạng ngôn ngữ ký hiệu, nhận dạng cử chỉ người, và nhận dạng ảnh hoa. Mỗi ứng dụng đại diện cho một loại dữ liệu và thách thức khác nhau. Mô hình RBF đã chứng minh hiệu năng mô hình ổn định và đáng tin cậy. Các phương pháp tối ưu hóa RBF được áp dụng giúp cải thiện tốc độ và độ chính xác trong các tình huống này. Điều này mở rộng tiềm năng ứng dụng của mạng RBF trong các hệ thống thông minh. Các kết quả này cung cấp bằng chứng thực nghiệm về tính khả thi và ưu việt của các thuật toán phân lớp dựa trên RBF rút gọn trong học máy và học có giám sát trên các dữ liệu thực tế.

4.1. Phân lớp nhận dạng ngôn ngữ ký hiệu

Bài toán phân lớp nhận dạng ngôn ngữ ký hiệu là một ứng dụng quan trọng của mô hình RBF rút gọn. Dữ liệu trong lĩnh vực này thường là chuỗi thời gian hoặc hình ảnh của các cử chỉ. Việc trích chọn đặc trưng phù hợp là yếu tố then chốt. Mô hình RBF được huấn luyện trên các đặc trưng này để phân loại các ký hiệu khác nhau. Các phương pháp tối ưu hóa RBF đã giúp cải thiện hiệu năng mô hình về tốc độ và độ chính xác trong việc nhận dạng. Điều này có ý nghĩa lớn đối với việc phát triển các hệ thống hỗ trợ giao tiếp cho người khiếm thính. Khả năng xử lý dữ liệu phức tạp và cung cấp kết quả phân lớp nhanh chóng làm cho mô hình RBF rút gọn trở thành một lựa chọn lý tưởng cho ứng dụng này trong học máy.

4.2. Phân lớp nhận dạng cử chỉ người

Nhận dạng cử chỉ người là một lĩnh vực khác nơi mô hình RBF rút gọn thể hiện hiệu quả. Cử chỉ có thể được sử dụng để điều khiển thiết bị hoặc tương tác trong môi trường thực tế ảo. Thách thức nằm ở sự đa dạng của cử chỉ và điều kiện ánh sáng khác nhau. Mô hình RBF được sử dụng để phân lớp các cử chỉ dựa trên các đặc trưng không gian và thời gian. Các thuật toán như SimpSVM-SVD và FastRVM đã giúp nâng cao hiệu năng mô hình bằng cách rút gọn mạng RBF và tăng tốc độ xử lý. Khả năng khử chiều của mô hình RBF cũng giúp xử lý các đặc trưng có chiều cao. Ứng dụng này chứng minh tiềm năng của học có giám sát và thuật toán phân lớp hiệu quả trong việc tạo ra các giao diện người-máy tự nhiên hơn.

4.3. Phân lớp nhận dạng ảnh hoa chính xác

Bài toán phân lớp nhận dạng ảnh hoa là một ứng dụng tiêu biểu khác cho mô hình RBF rút gọn. Đối với ảnh, việc trích xuất đặc trưng là bước quan trọng. Các đặc trưng hình ảnh được đưa vào mô hình RBF để phân loại các loài hoa khác nhau. Các phương pháp tối ưu hóa RBF đã cải thiện đáng kể hiệu năng mô hình trong việc phân loại ảnh, đạt được độ chính xác cao. Điều này đặc biệt có giá trị trong các hệ thống nhận dạng tự động hoặc trong lĩnh vực thực vật học. Mạng RBF với khả năng học các ranh giới phân lớp phức tạp chứng tỏ tính ưu việt. Việc áp dụng các thuật toán phân lớp nhanh hơn giúp xử lý lượng lớn ảnh một cách hiệu quả, đóng góp vào sự phát triển của học máy trong thị giác máy tính.

10/04/2026

Xem trước tài liệu

Tải đầy đủ để xem toàn bộ nội dung

Nâng cao hiệu năng các mô hình rbf rút gọn cho bài toán phân lớp 2024

Tải xuống file đầy đủ để xem toàn bộ nội dung

Tải đầy đủ (118 trang)

Trích đoạn nội dung luận án

Tải xuống để đọc toàn bộ

NÂNG CAO HIỆU NĂNG CÁC MÔ HÌNH RBF RÚT GỌN CHO BÀI TOÁN PHÂN LỚP LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN Hà Nội – 2024 NÂNG CAO HIỆU NĂNG CÁC MÔ HÌNH RBF RÚT GỌN CHO BÀI TOÁN PHÂN LỚP Chuyên ngành: Khoa học máy tính Mã số: 9.01 LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪN KHOA HỌC: 1.TS Nguyễn Thanh Thủy 2.TS Nguyễn Đức Dũng Hà Nội – 2024 LỜI CAM ĐOAN Tôi xin cam đoan các kết quả trình bày trong luận án là công trình nghiên cứu của tôi dưới sự hướng dẫn của các cán bộ hướng dẫn. Các số liệu, các kết quả trình bày trong luận án hoàn toàn trung thực và chưa được công bố trong các công trình trước đây. Các dữ liệu tham khảo được trích dẫn đầy đủ. i LỜI CẢM ƠN Trong quá trình nghiên cứu và hoàn thành luận án, nghiên cứu sinh đã nhận được sự định hướng, giúp đỡ, các ý kiến đóng góp quý báu và những lời động viên của các nhà khoa học, các thầy cô giáo, đồng nghiệp và gia đình.

Trước tiên, nghiên cứu sinh xin bày tỏ lòng biết ơn sâu sắc tới các thầy GS.TS Nguyễn Thanh Thủy, PGS.TS Nguyễn Đức Dũng đã tận tình hướng dẫn, động viên và giúp đỡ trong quá trình nghiên cứu. Cho phép nghiên cứu sinh chân thành cảm ơn các thầy cô giáo, các nhà khoa học của Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã có các góp ý quý báu cho nghiên cứu sinh trong quá trình thực hiện luận án này. Nghiên cứu sinh chân thành cảm ơn Ban Giám hiệu, Khoa Khoa học Tự nhiên - Công nghệ, Trường Đại học Tây Bắc đã tạo điều kiện thuận lợi để nghiên cứu sinh hoàn thành nhiệm vụ nghiên cứu. Cuối cùng, nghiên cứu sinh bày tỏ lời cảm ơn tới các đồng nghiệp, gia đình, bạn bè đã luôn động viên, chia sẻ, ủng hộ và giúp đỡ nghiên cứu sinh vượt qua khó khăn để đạt được những kết quả nghiên cứu trong luận án này.

ii MỤC LỤC LỜI CẢM ƠN. ii MỤC LỤC. iii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT. vi DANH MỤC CÁC HÌNH VẼ.

vi DANH MỤC CÁC BẢNG BIỂU. ix MỞ ĐẦU. MÔ HÌNH RBF RÚT GỌN TRONG BÀI TOÁN PHÂN LỚP 7 1.1 Giới thiệu mô hình RBF .2 SVM: mô hình phân lớp RBF dựa trên lề cực đại .1 SVM tuyến tính .2 SVM phi tuyến sử dụng hàm nhân RBF .3 RVM: mô hình phân lớp RBF dựa trên suy luận Bayes .1 Mô hình Bayes rút gọn .2 Phân lớp với mô hình Bayes rút gọn .4 Độ phức tạp tính toán của các thuật toán .1 Độ phức tạp tính toán của SVM .2 Độ phức tạp tính toán của RVM .5 Mô hình lai học sâu và RBF .1 Mô hình học sâu trong phân lớp .2 Mô hình lai CNN-SVM .3 Đề xuất mô hình lai CNN-RBF tổng quát .6 Kết chương. 29 iii CHƯƠNG 2.

CÁC THUẬT TOÁN HUẤN LUYỆN NHANH MÔ HÌNH RBF RÚT GỌN 30 2.1 Các phương pháp huấn luyện mô hình RBF rút gọn .1 Các kỹ thuật tăng tốc SVM .2 Các kỹ thuật tăng tốc RVM .2 Dữ liệu thực nghiệm và đánh giá hiệu năng phân lớp .1 Dữ liệu thực nghiệm .2 Đánh giá hiệu năng phân lớp .3 Thuật toán SimpSVM ngẫu nhiên .1 Thuật toán SimpSVM-GD .2 Đề xuất thuật toán SimpSVM-SVD .4 Thuật toán FastRVM .1 Thuật toán RVM2 .2 Đề xuất thuật toán FastRVM .5 Kết chương. ỨNG DỤNG MÔ HÌNH RBF RÚT GỌN TRONG PHÂN LỚP ĐỐI TƯỢNG 62 3.1 Phân lớp nhận dạng ngôn ngữ ký hiệu .1 Mô tả tập dữ liệu .2 Trích chọn đặc trưng .3 Lựa chọn tham số .4 Phân lớp ký hiệu .2 Phân lớp nhận dạng cử chỉ người .1 Tập dữ liệu .2 Trích chọn đặc trưng .3 Lựa chọn tham số .4 Phân lớp cử chỉ, hành động .3 Phân lớp nhận dạng ảnh hoa .1 Tập dữ liệu .2 Trích chọn đặc trưng .3 Lựa chọn tham số .4 Phân lớp ảnh hoa .4 Kết chương. 87 KẾT LUẬN 89 DANH MỤC CÔNG TRÌNH KHOA HỌC 92 TÀI LIỆU THAM KHẢO 93 v DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT CNN Convolutional Neural Network DBN Deep Belief Network DCA Discriminant Canonical Analysis DDT Deep Decision Tree DL Deep Learning EM Expectation–Maximization FN False Negative FP False Positive GPU Graphics Processing Unit LOP Local Occupancy Patterns RBF Radial Basis Function RV Relevance Vector RVM Relevance Vector Machine SV Support Vector SVM Support Vector Machine TN True Negative TP True Positive VC Vapnik-Chervonenkis vi DANH MỤC CÁC HÌNH VẼ Hình 1.1 Siêu phẳng phân tách tập mẫu trong không gian Rd .2 Siêu phẳng phân chia hai tập mẫu .3 Tập mẫu không thể phân hoạch bằng một siêu phẳng .4 Một mặt phân chia phi tuyến trở thành một siêu phẳng trong không gian lớn hơn .5 Mô hình CNN phân lớp ảnh .6 Mô hình lai CNN-SVM nhận dạng chữ viết tay [52] .7 Mô hình lai CNN-RBF tổng quát .1 So sánh thời gian huấn luyện giữa các SimpSVM .2 Tốc độ rút gọn và độ chính xác giữa các SVM rút gọn .4 Thời gian huấn luyện giữa RVM2 và RVM [75] .5 Lỗi phân lớp và độ rút gọn của mô hình RVM2 và RVM [75] 58 Hình 3.1 Cách diễn đạt từ "thanks" trong ngôn ngữ Auslan [25] .2 Găng tay dụng cụ cùng các cảm biến ghi lại dữ liệu cử chỉ biểu thị ký hiệu trong ngôn ngữ Auslan (nguồn: Internet) .3 Tìm kiếm trên ô lưới để tìm các giá trị tham số C, γ .4 Kiểm tra chéo 5-fold cho các mô hình thực nghiệm .5 Độ chính xác và độ đo F 1 của các thuật toán SVM, SimpSVM- GD, SimpSVM-SVD, RVM2 và FastRVM trên 3 kiểu đặc trưng .6 Số vectơ cơ sở của các thuật toán SVM, SimpSVM-GD, SimpSVM-SVD, RVM2 và FastRVM trên 3 kiểu đặc trưng .7 Thời gian huấn luyện của SimpSVM-GD, SimpSVM-SVD, RVM2 và FastRVM với 3 loại đặc trưng .8 Cảm biến Kinect của Microsoft (nguồn: Internet) .9 Cảm biến Kinect ghi lại dữ liệu về khung xương (nguồn: Internet) .10 Minh họa các ví dụ về 12 cử chỉ trong MSRC-12 (nguồn: Internet) .11 Độ chính xác và độ đo F 1 của các mô hình SVM, SimpSVM- GD, SimpSVM-SVD, RVM2 và FastRVM trong phân lớp cử chỉ người .12 Số hàm cơ sở của các mô hình học được bởi SVM, SimpSVM- GD, SimpSVM-SVD, RVM2 và FastRVM trong phân lớp cử chỉ người .13 Thời gian huấn luyện của các mô hình học được bởi SimpSVM- GD, SimpSVM-SVD, RVM2 và FastRVM trong phân lớp cử chỉ người .14 Minh họa ví dụ về ảnh các loài hoa trong 2 tập dữ liệu Oxford 17-Flowers và Oxford 102-Flowers [51] .15 Mô hình sử dụng CNN để trích chọn đặc trưng tự động của ảnh hoa .16 Độ chính xác và độ đo F1 của các mô hình CNN, CNN-SVM, CNN-SimpSVM-GD, SimpSVM-SVD, CNN-RVM2 và CNN-FastRVM trong phân lớp ảnh hoa .17 Số hàm cơ sở của các mô hình học được bởi CNN, CNN- SVM, CNN-SimpSVM-GD, CNN-SimpSVM-SVD, CNN-RVM2 và CNN-FastRVM trong phân lớp ảnh hoa .18 Thời gian huấn luyện của các mô hình học được bởi CNN, CNN-SVM, CNN-SimpSVM-GD, CNN-SimpSVM-SVD, CNN-RVM2 và CNN-FastRVM trong phân lớp ảnh hoa. 86 ix DANH MỤC CÁC BẢNG BIỂU Bảng 2.1 Các tập dữ liệu và tham số thiết lập sử dụng trong thực nghiệm so sánh hiệu năng các SimpSVM .2 Các tham số thiết lập sử dụng trong thực nghiệm so sánh hiệu năng SimpSVM-GD với SVM gốc .3 Độ chính xác dự đoán của SimpSVM-GD với tốc độ tăng tốc pha kiểm thử khác nhau trên các tập dữ liệu .4 Độ chính xác dự đoán của các SimpSVM với tốc độ tăng tốc pha kiểm thử khác nhau trên các tập dữ liệu .5 Thời gian huấn luyện của các SimpSVM trên các tập dữ liệu 49 Bảng 2.6 Các tham số trong thực nghiệm so sánh hiệu năng FastRVM với RVM2 .7 Độ chính xác và thời gian huấn luyện của các thuật toán RVM2 và FastRVM .1 Danh sách các kênh thông tin của tập dữ liệu Auslan .2 Kết quả phân lớp nhận dạng ngôn ngữ ký hiệu .3 So sánh kết quả của các phương pháp học máy dùng để phân lớp ngôn ngữ ký hiệu Auslan .4 Kết quả phân lớp nhận dạng cử chỉ người .5 Tốc độ pha kiểm thử của các phương pháp trong nhận dạng cử chỉ người .6 So sánh kết quả của các phương pháp học máy dùng để phân lớp cử chỉ người .7 Tham số huấn luyện mạng ResNet18 tinh chỉnh .8 Kết quả phân lớp nhận dạng ảnh hoa .9 So sánh kết quả của các phương pháp phân lớp ảnh hoa.

88 xi MỞ ĐẦU Tính cấp thiết của đề tài nghiên cứu: Ngày nay, sự bùng nổ như vũ bão của CNTT và kỹ thuật số dẫn đến dữ liệu trong thực tế gia tăng nhanh chóng cả về dung lượng lẫn chủng loại. Học máy và khai phá dữ liệu trở thành công cụ hiệu quả giúp con người giải quyết vấn đề xử lý, phân tích thông tin, dữ liệu một cách tự động. Phân lớp đối tượng là một trong những chủ đề chính trong học máy và khai phá dữ liệu, đã và đang được cộng đồng nghiên cứu và doanh nghiệp quan tâm do sự cần thiết và khả năng ứng dụng thực tiễn trong nhiều lĩnh vực của cuộc sống. Phân lớp (classfication) là tiến trình xử lý nhằm xếp dữ liệu hay đối tượng được xem xét vào một trong các lớp được định nghĩa trước.

Các mẫu dữ liệu chính là các đối tượng được phân lớp, được chuyên gia đo đạc, quan sát trực tiếp trên thực tế. Khi đó, giá trị thuộc tính của các đối tượng mẫu có vai trò quan trọng, theo nghĩa do các đối tượng mẫu đã được xếp vào các lớp tương ứng, mỗi lớp sẽ được đặc trưng bởi tập các giá trị thuộc tính của các đối tượng mẫu chứa trong lớp đó. Phân lớp đối tượng là nhiệm vụ dễ dàng đối với con người, nhưng lại là một bài toán phức tạp đối với máy móc. Quá trình phân lớp thường bao gồm các bước chính.

Bước đầu tiên, thu thập dữ liệu, tiền xử lý và trích chọn đặc trưng. Bước thứ hai, gọi là pha huấn luyện, phân tích dữ liệu và xây dựng mô hình phân lớp phù hợp dựa trên dữ liệu huấn luyện. Bước thứ ba, gọi là pha kiểm thử, đánh giá hiệu năng của mô hình phân lớp trên dữ liệu kiểm thử. Cuối cùng, nếu hiệu năng của mô hình phân lớp được khẳng định thì mô hình phân lớp đó được sử dụng để phân lớp cho đối tượng dữ liệu mới về sau.

Phân lớp đối tượng được sử dụng rộng rãi trong nhiều miền ứng dụng khác 1 nhau như: nhận dạng ngôn ngữ ký hiệu, cử chỉ, hành động, nhận dạng ảnh y sinh, sinh trắc học, ảnh giám sát bằng video, điều hướng xe, giám sát trực quan công nghiệp, điều hướng robot, viễn thám.

Nội dung được bảo vệ bản quyền — Tải xuống đầy đủ

Câu hỏi thường gặp

Luận án "Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp" nghiên cứu về vấn đề gì?

Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp thông qua kỹ thuật tối ưu hóa cấu trúc và tham số.

Luận án "Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp" được bảo vệ tại trường nào?

Luận án này được bảo vệ tại Trường Đại học Tây Bắc. Năm bảo vệ: 2024.

Luận án "Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp" thuộc chuyên ngành gì?

Luận án "Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp" thuộc chuyên ngành Khoa học máy tính. Danh mục: Thủy Sản.

Luận án "Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp" có bao nhiêu trang?

Luận án "Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp" có 118 trang. Bạn có thể xem trước một phần tài liệu ngay trên trang web trước khi tải về.

Cách tải luận án "Nâng cao hiệu năng mô hình RBF rút gọn cho bài toán phân lớp" về máy như thế nào?

Để tải luận án về máy, bạn nhấn nút "Tải xuống ngay" trên trang này, sau đó hoàn tất thanh toán phí lưu trữ. File sẽ được tải xuống ngay sau khi thanh toán thành công. Hỗ trợ qua Zalo: 0559 297 239.

Luận án liên quan

Chia sẻ tài liệu: Facebook Twitter

Mục lục chi tiết

Tóm tắt nội dung