daigai

Well-Known Member
Tải miễn phí luận văn thạc sỹ

Mục lục 2

Danh mục các ký hiệu, các chữ viết tắt 4

Danh mục các bảng 4

Danh mục các hình vẽ, đồ thị 5

MỞ ĐẦU 7

Chương 1 - TỒNG QUAN 8

1.1. Giới thiệu về khai khoáng văn bản tiếng Việt 8

1.2. Phân loại thông điệp 9

1.3. Các phương pháp phân loại hiện tại 12

1.3.1. Phương pháp SVM 12

1.3.2. Phương pháp Naive Bayes 12

1.3.3. Bộ phân loại kết họp 15

1.3Ể3ằl. Giới thiệu bộ phân loại kết họp 15

1.3.2.2. Phân loại dựa trên sự kết hợp CBA 18

1.3.2.3. Phân loại dựa trên đa luật kết hợp CMAR 19

1.4. Phân loại văn bản đa cấp 23

1.5.1. Phân loại theo tiếp cận cục bộ 24

1.5.2. Phân loại theo tiếp cận toàn cục 25

1.5. Tóm lại 26 Chương 2-TIỀN XỬ LÝ Dừ LIỆU 28

2.1. Phân tích và biểu diễn dữ liệu 28

2.1.1. Tách từ 28

2.1.2. Trích dữ liệu 34

2.1.3. Biểu diễn dữ liệu 35

2.2. Xây dựng cụm từ và chèn cụm từ 37

2.2.1. Phương pháp FP-growth 39
3
2.2.1.1. Thiết kế và xây dựng FP-tree 39

2.2.1.2. Khai khoáng các mẫu bằng FP-tree 44

2.2.2. Phương pháp FP-phrase 52 2.2ệ3. Tỉa cụm từ thừa bằng CP-tree 56 2.2ệ4. Chèn cụm từ 56

2.3ề Chọn đặc trưng 58

Chương 3 - PHÂN LOẠI THÔNG ĐIỆP 61

3.1. Phương pháp EFP-growth 61

3ắ 1.1. Thiết kế và xây dựng EFP-tree 61

3.1.2. Khai khoáng các luật CAR mạnh bàng EFP-tree 66 3ề2. ĐộđoRC 68

3.3. Tỉa luật thừa bằng CR-tree 71

3.4. Phương pháp FR-growth 73

3.5. Xây dựng bộ phân loại COMAR 75

3.5ễl. xếp hạng các luật CAR 75

3.5.2. Tỉa luật thừa bằng phủ cơ sở dữ liệu 76

3.6. Quy trình chọn đa luật để phân loại 77

3.7. Tính phân phổi xác suất cho chủ đề 79

3.8. Độ chính xác 81

3.8.1. Các độ đo dùng để ước lượng độ chính xác 81

3.8.2. Độ đo PHA 82 Chương 4 - CHƯƠNG TRÌNH PHÂN LOẠI 86

4.1. Tập dừ liệu và các tham số hệ thống 87

4.2. Độ chính xác của phân loại 87

4.3. Mô hình xử lý tựa Merise tổng quát 88

4.4. Các chức năng chính của chương trình phân loại 89

4.5. Đánh giá kết quả đạt được 90 Chương 5 - KẾT LUẬN 91

5.1. Kết luận 91
4
5.2. Hướng phát triển 91

TÀI LIỆU THAM KHẢO 92

PHỤ LỤC 1 Một số giao diện chính 94

PHỤ LỤC 2 Stoplist 95

PHỤ LỤC 3 Stemming 97

PHỤ LỤC 4 Một số luật trong tập các luật được khai khoáng 98
Danh mục các ký hiệu, các chữ viết tắt

1. CAR: Class Association Rules (các luật có vế phải là một loại).

2. CBA: Classification Based on Association.

3. COMAR: Classification using Cohesion and Multiple Association Rules.

4. CMAR: Classifcation based on Multiple Association Rules.

5. CP-tree: Compressed Pattern tree.

6. CR-tree: Compressed Rule tree.

7. CSDL: Cơ sở dữ liệu.

8. EFP-tree: Extended Frequent Pattern tree.

9. FP-tree: Frequent Pattern tree

10. Item: Thuộc tính của CSDL.

11. Itemset: Tập các item của CSDL.

12. Min sup: Độ hỗ trợ tối thiểu.

13. Min conf: Độ tin cậy tối thiểu.

14. PHA: Probabilistic Hierarchical Accuracy

15. SVM: Support Vector Machine

Danh mục các bảng

1.1. Bảng dữ liệu thực tế

lệ2. Bảng dữ liệu lý thuyết

1.3. Bảng dữ liệu lý thuyết đối với max-x2
5
2.1. Các từ trích từ thông điệp trên hình 2.4 2.2Ỗ Bảng dữ liệu các giao tác

2.3ệ Quy trình khai khoáng cây FP trong hình 2.5e

3.1. Các giao tác của CSDL

3.2. Phân bố loại của dữ liệu trong bảng 3.1

3.3. Quy trình khai khoáng EFP-tree trong hình 3.1d

3.4. Tỉa luật dùng CR-tree

3.5. Các luật được xếp hạng

3.6. Bảng ngẫu nhiên đổi với loại c

3.7. Tính PHA

4.1. Thống kê tập dữ liệu

4.2. Phân bổ các thông điệp trong các chủ đề

4.3. Các tham số hệ thống

4.4. So sánh kết quả giữa bộ phân loại COMAR với SVM

Danh mục các hình vẽ, đồ thị

1.1. Quá trình phân loại

1.2. Thứ bậc các chủ đề

1.3. Khung chức năng của bộ phân loại

2.1. Xây dựng ôtômát âm tiết 2ể2. Xây dựng ôtômát từ vựng

2.3. Một tình huống nhập nhằng

2.4. Một thông điệp trên diễn đàn

2.5. Xây dựng FP-tree

2.6. Xây dựng FP-tree có điều kiện của phần tử 5 trong hình 2.5e

2.7. Tỉa cụm từ thừa cục bộ

2.8. Liệt kê mẫu theo ưu tiên độ sâu của đường dẫn

3.1. Xây dựng EFP-tree với dừ liệu bảng 3.1

3.2. CR-tree
6
3.3. Một cây phân cấp loại

4.1. Mô hình tựa Merise của hệ thống

4.2. Sơ đồ chức năng

AI. Danh sách các chủ đề thuộc một giáo viên. A2. Danh sách các thông điệp trong mỗi chủ đề



Link tải:
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
D Phân tích quy định về một loại hợp đồng thông dụng trong BLDS 2015 Luận văn Luật 0
E Ứng dụng viễn thám và hệ thông tin địa lý để nâng cao độ chính xác kết quả phân loại lớp phủ thực vậ Luận văn Sư phạm 3
Q Phân loại tài liệu và tổ chức bộ máy tìm tin theo ký hiệu phân loại tại Trung tâm Thông tin - Thư vi Văn hóa, Xã hội 0
A Phân loại thông điệp trên mạng xã hội tiếng Việt Hệ Thống thông tin quản trị 0
C Phân loại hàng hóa và kiểm tra sau thông quan đối với ô tô. Thực trạng và giải pháp Tài liệu chưa phân loại 0
W Công tác kiểm tra sau thông quan về phân loại và áp mã hàng hóa xuất khẩu, nhập khẩu tại Chi cục Ki Tài liệu chưa phân loại 0
K Text Mining và các ứng dụng của nó về thu thập thông tin từ dữ liệu văn bản và phân loại dữ liệu văn Tài liệu chưa phân loại 1
J Tìm hiểu Khung phân loại LCC và quá trình áp dụng LCC tại Thư viện và Mạng thông tin Trường Đại học Tài liệu chưa phân loại 0
A Khảo sát ảnh hưởng của một số thông số đến quá trình làm sạch và phân loại cà phê quả tươi theo phươ Nông Lâm Thủy sản 0
B Kiểm tra sau thông quan về phân loại, áp mã hàng hóa xuất khẩu, nhập khẩu tại Chi cục Kiểm tra sau thông quan Cục hải quan Hà Nội Luận văn Kinh tế 4

Các chủ đề có liên quan khác

Top