Download Luận án Học máy, học máy mô tả phức: thuật toán và vấn đề rút gọn lỗi

Download miễn phí Luận án Học máy, học máy mô tả phức: thuật toán và vấn đề rút gọn lỗi





Mục lục
Nội dung Trang
Phần mở đầu 3
Chương 1. Bài toán học máy và một số thuật toán 6
I.1. Bài toán học máy 6
I.1.1. Bài toán học máy 6
I.1.2. Một số đặc trưng trong học máy 7
I.1.3. Phương pháp điển hình biểu diễntri thức trong học máy 9
I.2. Thuật toán điển hình trong học máy 10
I.2.1. Thuật toán tách nhóm 10
I.2.2. Thuật toán phân lớp Bayes 14
I.2.3. Thuật toán phân lớp kưngười láng giềng gần nhất 18
I.2.4. Thuật toán cây quyết định 20
Chương 2. Học máy mô tả phức 21
II.1. Mô hình học máy mô tả phức 21
II.1.1. Sơ bộ về mô hình học máy mô tả phức 21
II.1.2. Một số nội dung của học máy mô tả phức 23
II.2. Một số khái niệm và trình bày tri thức trong học máy mô tả phức
II.2.1 Một số khái niệm 26
II.2.2 Trình bày tri thức trong học máy mô tả phức 27
II.3. Một số mô hình học máy mô tả phức 33
II.3.1. Mô hình POIL 33
II.3.2. Mô hình POCL 37
II.3.3. Mô hình HYDRA 42
II.3.4. Mô hình HYDRAưMM 45
Chương 3. Rút gọn lỗi trong học máy mô tả phức 49
III.1. Sơ bộ về rút gọn lỗi trong học máy mô tả phức 49
III.1.1. Một số khái niệm 49
III.1.2. Sơ bộ về rút gọn lỗi trong học máy mô tả phức 49
III.2. Một số nội dung về rút gọn lỗi trong học máy mô tả phức 55
III.2.1. Sử dụng tập luật phức cho lỗi thấp hơn 55
III.2.2. Mối quan hệ giữagiảm lỗi và các lỗi tương quan 57
III.2.3. Thu thập các mối quan hệ và rút gọn lỗi 58
III.2.4. Tác động của nhiễu 59
III.2.5. Tác động của thuộctính không thích hợp 60
III.2.6. Tác động của việc đa dạng hoá 62
Chương 4. Thuật toán tìm kiếm và phân lớp trong cơ sở dữ liệu full-text 64
IV.1. Cơ sở dữ liệu full-text 64
IV.1.1. Khái niệm về cơsở dữ liệu full-text 64
IV.1.2. Các nội dung cơ bản của một cơ sở dữ liệu full-text 66
IV.1.3. Các mô hình quản lý và lưu trữ thông tin văn bản 69
IV.2. Thuật toán tìm kiếm và phânlớp trong cơ sở dữ liệu full-text
theo mô hình vector cải tiến 72
IV.2.1. Mô hình vector cải tiến và thuật toán tìm kiếm 73
IV.2.2. Thuật toán phân lớp Bayes thứ nhất 79
IV.2.3. Thuật toán phân lớp Bayes thứ hai 83
IV.2.4. Thuật toán phân lớp kưngười láng giềng gần nhất 86
Phần kết luận 90
Tài liệu tham khảo



Để tải bản DOC Đầy Đủ xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung:

i tiết hơn và đánh giá hiệu quả của
mỗi sự mở rộng trên số literal đ−ợc kiểm tra bởi FOCL hay độ chính xác của
FOCL. Để minh hoạ những mở rộng này, sử dụng 2 miền nh− d−ới đây. Miền
thứ nhất - việc học khẳng định Member, minh hoạ một khái niệm đệ quy đơn
nh− thế nào có thể đ−ợc học. FOIL đã giới thiệu các ví dụ tích cực và tiêu cực
của khẳng định member và khẳng định component và học định nghĩa đệ quy
đúng cho member nh− trong bảng 2.3.
L−ơng Song Vân Học máy, học máy mô tả phức: thuật toán và vấn đề rút gọn lỗi
-40-
Bảng 2.3. Các luật cho hàm member
1. member(X,Y) ← component(X, Z, Y).
2. member(X,Y) ← component(X, Z, Y).
member(X,Y) ← component(A, B, Y).
member(X,Y) ← component(X, Y, Z).
Miền thứ hai phức tạp hơn nhiều và đã đ−ợc giới thiệu bởi Muggeleton và
cộng sự (1989) trong việc học các n−ớc cờ. Miền này khẳng định rằng FOCL có
thể điều khiển làm giảm kích th−ớc các miền thực. Hàng trăm ví dụ đ−ợc dùng
để xây dựng một mô tả khái niệm khác nhau từ 4 đến 11 câu, dựa vào sự mở
rộng các khẳng định đ−ợc cung cấp. Khẳng định hay khái niệm đ−ợc học là
illegal(A,B,C,D,E,F). Đó là sự thật nếu bàn cờ bao gồm một vua trắng, xe trắng
và vua đen ở trong một trạng thái illegal (trái luật). Một trạng thái là illegal nếu
hay là vua bị chiếu hay là nhiều hơn một vị trí chiếm giữ cùng một không gian.
A, B là vị trí vua trắng ( hàng và cột), C, D là vị trí xe trắng và E, F là vị trí vua
đen. Các hàng và cột đ−ợc biểu diễn bởi các số từ 1 đến 8. Trong ví dụ này, các
toán tử khẳng định sử dụng là: giữa(X,Y,Z) (giá trị của Y là giữa giá trị X và Z),
kề(X,Y) (giá trị của X hay lớn hơn hay nhỏ hơn giá trị của Y), bằng(X,Y) (giá trị
của X và Y nh− nhau).
Bảng 2.4: Đặc tả tổng kết FOCL
Input:
1. Tên của khẳng định của đối số đã biết.
2. Một tập các bộ d−ơng.
3. Một tập các bộ âm.
4. Một tập các khẳng định đ−ợc xác định theo cách dàn trải.
5. Một tập các khẳng định đ−ợc xác định theo cách bổ sung.
6. Một tập các ràng buộc (ví dụ typing) trên các khẳng định bổ sung và dàn
trải.
L−ơng Song Vân Học máy, học máy mô tả phức: thuật toán và vấn đề rút gọn lỗi
-41-
7. Một luật (toán tử hay phủ định) ban đầu.
Output:
Luật trong các hạng thức của khẳng định dàn trải mà không câu nào phủ
một ví dụ tiêu cực và một số câu phủ mọi ví dụ tích cực.
Sau đây là giải thích mỗi thành phần của FOCL và chỉ ra chúng điều chỉnh
lẫn nhau nh− thế nào trong bảng 2.4. Đây là thiết kế ở mức độ cao nhằm nhấn
mạnh sự khác biệt với FOIL. FOCL mở rộng FOIL theo một số cách. Đầu tiên,
có những ràng buộc trong quá trình quy nạp vì rằng không phải tất cả các sự biến
đổi của một khẳng định cần đ−ợc kiểm tra. Thứ hai, FOCL có thể tính toán thông
tin đạt đ−ợc của các khẳng định đ−ợc xác định theo cách bổ sung (bổ sung vào
các khẳng định đ−ợc xác định theo cách dàn trải). Thứ ba, FOCL có thể dùng các
khẳng định đ−ợc xác định theo cách bổ sung bởi việc tìm một toán tử đặc biệt
mà phủ nhiều ví dụ tích cực và một số it ví dụ tiêu cực. Thứ t−, FOCL có thể tính
toán thông tin đạt đ−ợc của một luật (toán tử hay phủ định) ban đầu cho khái
niệm đ−ợc học và quyết định sử dụng điều đó trong favor của quy nạp. Giá trị
của luật ban đầu (ví dụ khái niệm đích) chỉ ra sự biến đổi của khẳng định phủ
nhận tức là giống nh− đ−ợc sử dụng. Bảng 2.4 biểu diễn những nét chung của
thuật toán FOCL.
Metric thu thập thông tin đồng bộ cho FOCL khả năng giải quyết lý thuyết
miền ch−a đầy đủ và ch−a đúng do đáp ứng cả hai dạng literal phân tích và literal
quy nạp. Chỉ có một ít khác nhau giữa hai dạng này là việc tìm kiếm một trong
các literal dạng phân tích chủ đạo. Quyết định việc sử dụng quy nạp hay phân
tích để mở rộng một câu đ−ợc căn cứ vào lợi ích trong sản xuất và độ chính xác
giả thiết, và đ−ợc đo bởi metric thu thập thông tin.
II.3.3. Mô hình HYDRA
HYDRA đ−ợc bắt nguồn từ FOCL ([17]) và bổ sung cho FOCL khả năng
học sử dụng tri thức nền đ−ợc xác định trong các hạng thức của các luật. Giả mã
của HYDRA đ−ợc trình bày trong bảng 2.5. HYDRA dựa trên sự mở rộng của
L−ơng Song Vân Học máy, học máy mô tả phức: thuật toán và vấn đề rút gọn lỗi
-42-
FOIL (Quinlan, 1990) mà Ali và Pazzani (1993), Pazzani và cộng sự (1991) đã
có nhiều cải tiến sửa đổi, bổ sung cho việc học một số mô hình. Trong thân của
HYDRA cũng có hạt nhân là FOIL (xem bảng 2.5).
Bảng 2.5: Giả m∙ của HYDRA
HYDRA ( Metric, POS_1,. . ., POS_n):
For i in classes 1 to n do
POS = POS_i
NEG= (POS_1 union . . . POS_n) - POS_i
ConceptDescription_i = FOIL(POS, NEG, Metric)
For rule R in ConceptDescription_i do
Augment R with its LS
HYDRA khác với FOCL ở ba điểm chính:
• HYDRA học một tập các luật cho mỗi lớp do đó mỗi tập hợp có thể so
sánh để phân lớp các ví dụ test. Ali K. & Pazzani M. [5] đã chỉ ra rằng điều này
cho phép HYDRA học máy với các bộ dữ liệu bị nhiễu đ−ợc chính xác hơn.
• HYDRA gắn liền một độ đo có tính đầy đủ về mặt lôgic (ls- độ đo tin
cậy của việc phân lớp) đối với mỗi luật.
• Metric đ−ợc sử dụng bởi HYDRA (là metric ls-nội dung) để sắp xếp các
literal t−ơng xứng với phạm vi phủ ví dụ tích cực với độ chính xác dạy tạo ra các
−u điểm về bao phủ lớn hơn tr−ờng hợp thực hiện bởi metric thu thập thông tin
(có trong mô hình FOCL). Ưu điểm này cũng không đ−ợc khuyếch tr−ơng khi
làm việc với các bộ dữ liệu có nhiễu quá lớn.
Biểu diễn tri thức trong HYDRA
Các luật học máy đối với HYDRA đi kèm với độ đo mức độ đầy đủ về
logic (đo độ tin cậy trong phân loại):
lsij=
p rule T True T class
p rule T True T class
ij i
ij i
( ( ) / )
( ( ) /
= ∈
= ∉ (2.9)
L−ơng Song Vân Học máy, học máy mô tả phức: thuật toán và vấn đề rút gọn lỗi
-43-
ở đây T là thay mặt cho một ví dụ tuỳ ý. Mức độ đầy đủ về mặt lôgic là sự khái
quát hoá của khái niệm đầy đủ mà phần thân của một luật có chứa phần đầu của
luật đó. Muggleton và các tác giả ([15]) chỉ ra rằng phạm vi phủ các cí dụ cần
dạy cho một biểu thị tin cậy về độ chính xác thật sự của luật hơn là các tham số
đo độ chính xác từ dữ liệu cần dạy. Vì thế mô hình lựa chọn sử dụng Ls nh− là
độ đo tin cậy bởi vì nó có −u điểm là đo cả độ bao phủ và độ chính xác.
Để hiểu cách HYDRA phân lớp một ví dụ test nh− thế nào thì cần hiểu về
khái niệm luật biểu diễn. Luật biểu diễn của một tập các luật R và một ví dụ test
x là luật có độ tin cậy cao nhất đ−ợc lựa chọn từ tập con của R mà thoả mãn x.
Luật biểu diễn đ−ợc chọn lọc từ mỗi lớp mà ở đó x thoả mãn ít nhất một luật. Ví
dụ test đ−ợc phân loại theo các lớp mà các luật biểu diễn nó có độ tin cậy cao
nhất. Nếu có quá một luật biểu diễn trong một tập các luật thoả mãn thì vẫn ch−a
chắc chắn là ví dụ test thuộc lớp này. Các thử nghiệm của Ali K. và Pazzani M.
[5] đã chỉ r...
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
D Skkn một phương án dạy học tích vô hướng của hai vectơ trên cơ sở phân tích khoa học luận tri thức Luận văn Sư phạm 0
B Những vấn đề cấu tạo từ tiếng Thái Lan hiện đại. Luận án PTS. Ngôn ngữ học Văn hóa, Xã hội 0
L Địa hoá môi trường vùng biển nông ven bờ Rạch Giá - Vũng Tàu :Luận án TS. Địa hoá học Khoa học Tự nhiên 0
F Phương trình sai phân ẩn tuyến tính không dừng chỉ số 1 :Luận án TS. Toán học Khoa học Tự nhiên 0
D Nghiên cứu đánh giá thẩm định chương trình giáo dục đại học : Luận án TS. Giáo dục học: 62 14 05 01 Luận văn Sư phạm 0
E Mô hình quản lý trường trung học phổ thông chuyên đáp ứng mục tiêu giáo dục toàn diện : Luận án TS. Luận văn Sư phạm 0
C Đánh giá hiệu trưởng trường tiểu học Việt Nam theo hướng chuẩn hóa : Luận án TS. Giáo dục học : 62 1 Luận văn Sư phạm 0
H Đánh giá giảng viên đại học theo hướng chuẩn hóa trong giai đoạn hiện nay : Luận án TS. Giáo dục học Luận văn Sư phạm 0
S Quản lý hoạt động bồi dưỡng nghiệp vụ sư phạm cho giảng viên đại học theo tiếp cận CDIO : Luận án TS Luận văn Sư phạm 0
N Quản lý chất lượng đào tạo đại học trong các học viện, trường công an nhân dân : Luận án TS. Giáo dụ Luận văn Sư phạm 0

Các chủ đề có liên quan khác

Top