By thienthannho722000
#968430 Link tải luận văn miễn phí cho ae

Giới thiệu các khái niệm về quy hoạch tuyến tính, lý thuyết học thống kê và các khái niệm ban đầu về kỹ thuật vector tựa (SVM), cũng như mối liên hệ giữa lý thuyết thống kê và kỹ thuật vector tựa. Giới thiệu tổng quan về khai phá dữ liệu và học máy. Nghiên cứu về không gian đặc trưng và sử dụng hạt nhân trong kỹ thuật vector tựa. Phân tích các nội dung cơ bản của phương pháp vector tựa và đi sâu nghiên cứu các kỹ thuật vector tựa hay được sử dụng hiện nay. Xây dựng bài toán nhận dạng khuôn mặt bằng kỹ thuật vector tựa. Lựa chọn phương pháp phân tích thành phần chính (PCA) để trích rút đặc trưng của khuôn mặt, xây dựng cơ sở dữ liệu ảnh mặt để kiểm tra khả năng hoạt động của các kỹ thuật vector tựa. Cài đặt thử nghiệm hệ thống nhận dạng khuôn mặt người để kiểm tra khả năng phân lớp của kỹ thuật vector tựa. Đánh giá hiệu quả của phương pháp vector tựa, đưa ra các hướng cải tiến, các ứng dụng có thể áp dụng kỹ thuật vector tựa

LỜI CAM ĐOAN........................................................................................................1
LỜI CẢM Ơ N ............................................................................................................. 2
C Á C TỪ VIẾT TẮT, T H U Ậ T N G Ữ .............................................................................. 6
C Á C HÌNH V Ẽ ........................................................................................................................6
CHƯƠNG 1 : MỘT SỐ KIẾN THÚC CHUẨN B Ị......................................... 10
1.1 Bài toán tối ưu.............................................................................10
1.1.1 Bài toán qui hoạch tuyến tính.................................................................10
/. ỉ. ỉ. ỉ Dạng chính tắc.........................................................................1Ị
Ị. ỉ. ỉ.2 Dạng chaân tắc........................................................................ / /
1.1.2 Qui hoạch tuyến tính đổi ngẫu................................................................ 12
1.2 Biểu diễn dữ liệu............................................................................ 14
1.2.1 Dữ liệu huấn luyện.......................................................................................... 14
1.2.2 Không gian hữu hạn chiều...................................................................... 14
1.2.3 Một thuật toán nhận dạng mẫu đơn g iản .............................................. 15
1.2.4 Một số khái niệm trong lý thuyết học thổng k ê...................................18
1.2.4. ỉ Không gian v c ...........................................................................19
1.2.4.2 Mối liên hệ giữa lý thuvểt học thống kê và SVM ..................20
1.3 Phưoìig pháp phân tích thành phần chính (PCA).....................................20
1.3.1 Độ lệch c h u ẩ n ........................................................................................................ 20
1.3.2 Phương sai..................................................................................................21
1.3.3 Vector riêng, giá trị riêng........................................................................22
1.3.4 Phương pháp phân tích thành phần chính............................................ 23
CHƯƠNG 2 : KHAI PHÁ DỮ LIỆU VÀ HỌC MÁY..................................... 28
2.1 Khái niêm hoc.................................................................................28
• •
2.1.1 Qúa trình học............................................................................................. 28
2.2 Máy học................................................................................................................29
2.2.1 Quy trình của máy học.............................................................................30
2.2.1.1 Học có thày.................................................................................30
2.2.1.2 Học không có thày..................................................................... 31
2.2. ỉ.3 Học có thày một phần................................................................Sỉ
2.3 Khai phá dữ liệu.................................................................................................32
2.3.1 Cấu trúc của một hệ thống khai phá dừ liệu........................................32
2.3. ỉ. ì Xử lý dữ liệu................................................................................. 32
2.3.2 Các bài toán chính trong khai phá dữ liệu............................................33
2.3.2.1 Phân lớp và phán cụm ...............................................................33
23.2.2 Tim ra các luật............................................................................34
2.3.3 Một số phương pháp tính dùng trong khai phá dừ liệu..........................35
2.4 Sự giống và khác nhau giữa khai phá dữ liệu và máy học..........................35
CHU ONG 3 ............................................................................................................................36
HÀM HẠT N H Â N ............................................................................................................ 36
3.1 Tích vô hướng các đặc trưng........................................................................... 36
3.1.1 Đặc trưng đơn............................................................................................36
3.1.2 H àm hạt n h â n .........................................................................................................37
3.1.3 Hàm hạt nhân đa thức..............................................................................37
3.2 Biểu diễn sự đồng dạng trong không gian tuyến tính............................39
3.2.1 Các hạt nhân xác định dương..................................................................39
3.2.2 Tái lập ánh xạ hạt nhân........................................................................... 40
3.2.3 Tái lập không gian hạt nhân Hilbert..................................................... 42
3.2.4 Ánh xạ hạt nhân Mercer.......................................................................... 43
3.3 Các hạt nhân thưòng đưọc sử dụng..................................................45
CHƯ ƠNG 4 .................................................................................................................. 46
PHƯƠNG PHÁP VECTOR TỰA (SVM).............................................................46
4.1 Phân chia bằng siêu phắng................................................................................ 46
4.2 Vai trò cùa lề trong siêu phẳng......................................................................... 47
4.3 Siêu phẳng tối ưu - Phân lóp tuyến tính............ .... .......................................49
4.3.1 Đánh giá lỗi.............................................................................................. 50
4.3.2 Bài toán qui hoặch toàn phươne của tìm lề phân lớp tối ưu..............51
4.4 Phân lóp phi tuyến bằng vector t ự a ................................................................ 51
4.5 Siêu phẳng vói lề m ềm ........................................................................................54
4.6 Phấn lóp trong truòìig họp có nhiều l ớ p ....................................................... 60
4.6.1 Chiến lược Một-đỐi-Phần còn lại (One Versus the Rest)...................60
4.6.2 Chiến lược so sánh theo cặp (hay còn gọi là một đối m ột)................ 61
CHƯONG 5 : MỘT SÓ ỦNG DỤNG CỦA KỲ THUẬT VECTOR TựA .62
5.1 Phấn loai văn b ả n .................................................................................................62

5.2 Nhận dạng ả n h ...................................................................................................... 64
5.2.1 Phân lớp độc lập.......................................................................................64
5.2.2 Phân lớp với ảnh màu.............................................................................. 65
5.3 Nhận dạng chữ số viết tay................................................................................66
5.4 Tin-sinh học (Bio-lnformatỉcs)..........................................................................67
5.4.1 Phát hiện protein tương đồng...,.............................................................67
CHƯƠNG 6 : CÀI ĐẬT THỬ N G H IỆ M # * .......................................................... ....69
6.1 Nhận dạng ảnh khuôn mặt người.................................................................... 69
6.1.1 Xây dựng không gian đặc trưng.............................................................70
6.1.2 Huấn luyện và nhận dạng........................................................................72
6.2 Xây dựng hệ thống nhận dạng....................................................................... 74
KÉT LUẬN...............................................................................................................76
TÀI LIỆU THAM K H Ả O ........................................................................................77
5
Trong thời gian gần đây, công nghệ thông tin đã góp phần quan trọng vào
sự phát triển kinh tế, giáo dục và làm thav đổi xã hội, tạo ra những khái niệm,
quan niệm mới trong nhiều lĩnh vực, tác động đến tất cả các cá nhân, tổ chức
trong xã hội. Công nghệ thông tin đà làm xoá mờ khoảng cách về địa lý, giúp
con người ờ khắp nơi trên thế giới, ở tất cả các nền văn hoá có thế dễ dàng trao
đổi, chia sẻ thông tin. Chính vì nhừng tiện ích vô cùng thân thiện cùa nó nên
cộng đồng tham gia vào việc sử dụng, phát triển công nghệ thông tin là rất rộng
lớn, không kể tuổi tác, nahề nghiệp, tôn giáo, vùng miền,...Chúng ta đã được
chứng kiến sự phát triên nhir vũ bão của công nghệ thông tin trong nhừng năm
vừa qua, từ bộ vi xử lý tới các hệ thổna lưu trữ cũng đã phải phát triển nhanh
chóng đế đáp ứng được khối lượng thông tin khổng lồ; các thông tin này không
nằm một chỗ mà nó luôn được luân chuyển, bổ sung, cập nhật bởi người sử
dụng.
Với khối lượng thông tin lớn đến như vậy, liệu con người chúng ta có cảm
thấy quá tái, ngập chìm trong biên thông tin, không thế chọn lựa được những
thông tin quan trọng, gần với nhu cầu sử dụng của minh nhất. Điều đó có nghĩa
là chúng ta có quá nhiều thông tin, nhưng điều chúng ta thực sự cần đó là tri
thức,là kiến thức có được qua sự tổng hợp, phân tích, thống kê từ các kho thông
tin đó. Đe tìm ra được tri thức trong một kho thông tin lớn thì chúng ta cần
phải có các phương pháp khái phá các lượng thông tin đó. Cùng chính vì lý do
đó mà trong thời gian gần đây, nghành khai phá dừ liệu được rất nhiều người
quan tâm và nghiên cứu.
Trong luận vãn tốt nghiệp cao học tại trường Đại học công nghệ - Đại học
quốc gia Hà Nội, tui thực hiện đề tài “Một sổ kỹ thuật vector tựa (SVM) trong
khai phá dữ liệu và ứng dụng vào nhận dạng”
• Lý do chọn đề tài
Trong khai phá dừ liệu và học máy, yếu tố quyết định đến độ chính
xác trong các đoán là khả năng phân lớp tốt. Kỹ thuật vector tựa được
đánh giá là có khả năng phân lớp rất tốt, đặc biệt là các bài toán phân lớp
phi tuyến. Hiện nay đã có nhiều ứng dụng được xây dựng dựa trên kỹ
thuật vector tựa và cho kết quả rất khả quan.
• Mục đích, đổi tượng, phạm vi nghiên cứu
Link Download bản DOC
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link tải, không dùng IDM để tải:

Bấm vào đây để đăng nhập và xem link!
Hình đại diện của thành viên
By vqngoc89
Kết nối đề xuất:
Đọc Truyện online
Advertisement