world_boy_17

New Member
Link tải luận văn miễn phí cho ae
Máy vectơ tựa (support vector machine-SVM) và ứng dụng trong việc xác định tham số độ thấm trong ngành địa chất
Luận văn ThS. Công nghệ phần mềm -- Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội, 2012
Tìm hiểu tổng quan về máy vectơ tựa SVM, bài toán phân loại đa lớp, các chiến thuật trong bài toán phân lớp và mở rộng của máy vectơ tựa SVM (hay còn gọi là hồi quy SVM) dùng trong bài toán dự đoán. Trình bày về một số ứng dụng của SVM trong thực tiến được áp dụng dựa trên bài toán phân loại hai và nhiều lớp được triển khai trên phần mềm MatLab. Tìm hiểu máy “học” dùng hồi quy SVM để xác định thông tin về độ thấm – một thông số quan trọng trong bài toán mô phỏng vỉa dầu khí ngành địa chất thông qua các thông tin liên quan khác (tại những điểm đã biết thông tin cụ thể về độ thấm). Sau khi máy học, đưa ra thông tin về độ thấm tại những điểm cần dự báo. Đưa ra kết quả thực nghiệm đạt được
MỞ ðẦU
Với tốc ñộ phát triển như vũ bão của thông tin hiện nay, việc khai thác, sử dụng
thông tin và dựa trên ñó ñể ñưa ra các dự báo là một bài toán có ứng dụng rộng rãi và
ñược rất nhiều người quan tâm nghiên cứu.
Nhiều kỹ thuật mô hình hóa dự báo, gồm các mạng thần kinh, phận cụm, cây
quyết ñịnh, suy luận quy nạp, mạng Beyesian, máy vectơ tựa SVM (Support Vector
Machine),... ra ñời giúp cho việc dự báo (prediction), phân loại (classification) thông
tin ngày một tốt và chính xác hơn.
Các mô hình dự báo ñược sinh ra bất cứ khi nào sử dụng dữ liệu ñể huấn luyện
một kỹ thuật mô hình hóa dự báo hay nói cách khác: dữ liệu + kỹ thuật mô hình hóa
dự báo = mô hình.
Do ñó mô hình dự báo là kết quả của việc kết hợp dữ liệu và toán học, trong ñó
việc huấn luyện có thể coi là việc xác ñịnh một ánh xạ từ tập hợp các mẫu luyện (hay
còn gọi là ñầu vào) vào một hay nhiều biến ñích (hay còn gọi là biến ñầu ra).
Trong các kỹ thuật ñó, máy vectơ tựa SVM ñược Vapnik ñề xuất vào năm 1995
là một phương pháp học có sự giám sát dựa trên lý thuyết tối ưu hóa, thống kê, giải
tích dùng trong bài toán phân loại và mở rộng của nó (còn gọi là hồi quy SVM) ñược
dùng trong bài toán dự báo ñã ñược ứng dụng ở nhiều lĩnh vực và ñược coi là công cụ
mạnh, phổ biến ñặc biệt thích hợp cho bài toán với dữ liệu lớn và nhiều chiều.
Phân lớp (classification) là một tiến trình xử lý nhằm xếp các mẫu dữ liệu hay các
ñối tượng vào một trong các lớp ñã ñược ñịnh nghĩa trước. Các mẫu dữ liệu hay các
ñối tượng ñược xếp vào các lớp dựa vào giá trị của các thuộc tính (attributes) cho một
mẫu dữ liệu hay ñối tượng. Sau khi ñã xếp tất cả các ñối tượng ñã biết trước vào các
lớp tương ứng thì mỗi lớp ñược ñặc trưng bởi tập các thuộc tính của các ñối tượng
chứa trong lớp ñó.
Quá trình phân lớp còn ñược gọi là quá trình gán nhãn cho các tập dữ liệu. Nhiệm
vụ của bài toán phân lớp dữ liệu là cần xây dựng mô hình (bộ) phân lớp ñể khi có một
dữ liệu mới vào thì mô hình phân lớp sẽ cho biết dữ liệu ñó thuộc lớp nào.
Bài toán phân lớp này ñược mô tả như sau: Xét một tập hợp gồm N ñối tượng,
trong ñó mỗi ñối tượng ñược ñặc trưng bởi một bộ các thuộc tính (có thể ñược mô tả
như một vectơ trong không gian n chiều). Theo một nguyên tắc “chuyên gia” nào ñó,
người ta có thể chỉ ñịnh (một cách thủ công) cho mỗi ñối tượng thuộc vào một lớp nào
ñó trong k lớp xác ñịnh trước. Nói chung, nguyên tắc phân lớp này không mô tả ñược
một cách tường minh dưới dạng quy tắc, công thức hay thuật toán xác ñịnh.
Vấn ñề ñặt ra: Khi số N là rất lớn, khiến cho việc phân lớp bằng thủ công là
không thể thực hiện ñược, thì có hay không một công cụ thực hiện việc phân lớp một
cách tự ñộng, với khả năng sai sót có thể xảy ra là không vượt quá một chỉ tiêu xác
ñịnh nào ñó cho trước?
Mô hình toán học cho bài toán: Ta giả thiết, mỗi ñối tượng có thể ñược xem là
một vectơ A a a a = ∈ ( , ,..., ) 1 2 n ℝn , trong ñó mỗi tọa ñộ aj là ñặc trưng cho thuộc
tính thứ j của ñối tượng này. Ta ký hiệu lớp ñối tượng thứ i là L i k i ( 1,2,..., ) = và
ký hiệu L L i k = = { i | 1,..., } là tập tất cả các lớp này. Như vậy, mỗi phép phân lớp
có thể ñược xem như một ánh xạ từ tập tất cả các ñối tượng
D A i l l N : | 1,..., ; = = ≤ { i } vào tập L , và vấn ñề ñặt ra là thiết lập ánh xạ F
thực hiện việc phân lớp sao cho các sai sót (nếu có) là không vượt quá một chỉ tiêu xác
ñịnh cho trước.
ðể xây dựng thuật toán phân lớp ñối tượng theo phương pháp máy vectơ tựa
SVM, người ta cũng sử dụng một tập con các ñối tượng ñã ñược phân lớp sẵn, ñể làm
cơ sở cho việc thiết lập ra các bài toán tối ưu ñã nói ở trên.
Ý tưởng chính của SVM là chuyển tập mẫu từ không gian biểu diễn ℝn sang
một không gian ℝd (d n > ). Trong không gian mới này, tìm một siêu mặt tối ưu ñể
tách tập mẫu dựa trên phân lớp của chúng ñể từ ñó xác ñịnh ñược phân lớp của mẫu
cần nhận dạng (trong không gian ℝn ).
Hình 0-1. Siêu phẳng phân hoạch tập mẫu trong không gian ℝd
Phương pháp máy vectơ tựa SVM cũng ñưa ra một công thức cụ thể cho việc
ñánh giá khả năng sai sót (theo nghĩa xác suất), và theo ñó khi tập con ñược phân lớp
sẵn (còn ñược gọi là tập hợp luyện hay tập mẫu luyện) càng nhiều thì khả năng sai sót
xảy ra với việc phân lớp là càng thấp.
Luận văn bố cục như sau, Chương 1 tìm hiểu tổng quan về máy vectơ tựa SVM,
bài toán phân loại ña lớp, các chiến thuật trong bài toán phân lớp và mở rộng của máy
vectơ tựa SVM (hay còn gọi là hồi quy SVM) dùng trong bài toán dự ñoán. Phần cuối
chương trình bày về một số ứng dụng của SVM trong thực tiễn ñược áp dụng dựa trên
Mẫu cần nhận dạng
Ánh xạ
Mặt phân hoạch
Siêu phẳng


Link Download bản DOC
Do Drive thay đổi chính sách, nên một số link cũ yêu cầu duyệt download. các bạn chỉ cần làm theo hướng dẫn.
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link để tải:

 
Last edited by a moderator:

daigai

Well-Known Member
link mới cập nhật, mời các bạn xem lại bài đầu để tải
 
Top