Rocky

New Member
Download Luận văn Ứng dụng phân hạng tổng hợp cho bài toán so khớp lược đồ

Download miễn phí Luận văn Ứng dụng phân hạng tổng hợp cho bài toán so khớp lược đồ





MỤC LỤC
Chương 1- Dẫn nhập . 1
1.1. Giới thiệu vềso khớp lược đồ . 1
1.2. Một số ứng dụng của bài toán so khớp lược đồ. 3
1.2.1. Tích hợp lược đồ . 3
1.2.2. Kho dữliệu . 4
1.2.3. Thương mại điện tử. 4
1.3. Một sốthách thức của bài toán so khớp lược đồ . 5
1.4. Giải pháp cho bài toán so khớp lược đồ. 6
1.5. Cấu trúc luận văn . 7
Chương 2- Một sốthành tựu đạt được trong lĩnh vực so khớp lược đồtrảvề
một ánh xạlược đồ . 8
2.1. Phát biểu bài toán so khớp lược đồ . 8
2.2. Một sốkỹthuật so khớp lược đồcơbản . 10
2.2.1. Các kỹthuật so khớp mức phần tử . 11
2.2.1.1. Các kỹthuật so khớp dựa vào chuỗi. 11
2.2.1.2. Các kỹthuật so khớp dựa vào ngôn ngữ . 13
2.2.1.3. Các kỹthuật dựa vào ràng buộc . 15
2.2.2. Các kỹthuật so khớp mức cấu trúc. 17
2.2.3. Các kỹthuật so khớp dựa vào các thểhiện dữliệu và các kỹthuật học máy . 20
2.2.4. Nhận xét vềcác kỹthuật so khớp cơbản. 21
2.3. Tổng quan vềmột sốhệthống so khớp lược đồ. 25
2.3.1. Cupid . 26
2.3.2. Similarity Flooding . 27
2.3.3. COMA . 29
2.3.4. Nhận xét vềcác hệthống so khớp lược đồ . 31
Chương 3- Hướng tiếp cận top-k ánh xạlược đồ . 33
3.1. Định nghĩa top-k ánh xạlược đồ . 34
3.2. Thuật toán tìm top-k ánh xạmức lược đồ . 35
3.2.1. Mô hình hóa ma trận tương tự . 37
3.2.2. Thuật toán . 42
3.2.3. Phân tích tính ổn định . 46
3.2.4. Kết quảthực nghiệm . 49
3.3. Nhận xét. 50
Chương 4- Thuật toán phân hạng tổng hợp. 51
4.1. Thuật toán phân hạng tổng hợp trong lĩnh vực tìm kiếm thông tin . 52
4.1.1. Mô hình thuật toán phân hạng tổng hợp . 53
4.1.2. Thuật toán đếm Borda . 53
4.1.2.1. Thuật toán. 54
4.1.2.2. Đếm Borda có trọng số . 55
4.1.2.3. Kết quảthực nghiệm của hai thuật toán đếm Borda và đếm Borda có trọng số . 55
4.1.3. Thuật toán đếm tham chiếu . 56
4.1.3.1. Thuật toán cơsở . 57
4.1.3.2. Một sốthuật toán tham chiếu trọng số. 58
4.1.3.3. Kết quảthực nghiệm của thuật toán đếm tham chiếu cơsởvà các
thuật toán đếm tham chiếu trọng số . 62
4.1.4. Nhận xét . 62
4.2. Thuật toán phân hạng tổng hợp cho bài toán so khớp lược đồ . 63
4.2.1. Phát biểu thuật toán. 64
4.2.1.1. Sơ đồthuật toán. 65
4.2.1.2. Mã giảcủa một sốhàm chính . 67
4.2.2. Các hàm tính điểm cho mỗi danh sách top-k ánh xạlược đồ . 68
4.2.3. Các hàm tính điểm cho mỗi ánh xạlược đồ . 71
4.3. Chương trình cài đặt. 73
4.3.1. Hệthống OntoBuilder được sửdụng trong chương trình . 73
4.3.2. Mô hình của hệthống được cài đặt thửnghiệm . 74
4.3.3. Màn hình kết quả . 75
4.4. Thửnghiệm và đánh giá . 77
4.4.1. Độ đo sửdụng để đánh giá . 77
4.4.2. Bộthửnghiệm . 78
4.4.3. Quá trình thửnghiệm . 79
4.4.4. Kết quảthửnghiệm. 79
4.4.5. Kết luận . 83
Chương 5- Kết luận và hướng phát triển . 84
5.1. Kết luận . 84
5.2. Hướng phát triển . 85
5.2.1. Phát triển các hệthống so khớp lược đồ đầu vào . 85
5.2.2. Phát triển các phương pháp tính trọng sốcho thuật toán đếm Borda có
trọng số. 86
5.2.3. Phát triển các phương pháp xác định hai ánh xạtương đương . 86
5.2.4. Xây dựng giao diện trực quan cho hệthống . 86
TÀI LIỆU THAM KHẢO. 87
PHỤLỤC A . 91
PHỤLỤC B . 93



Để tải bản DOC Đầy Đủ xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung:

1
Chương 1 Dẫn nhập
1.1. Giới thiệu về so khớp lược đồ
Những năm gần đây, cơ sở dữ liệu trên Web phát triển rất nhanh chóng, nghiên
cứu vào tháng 4/2004 của K. C.-C. Chang và các đồng sự [3] cho biết có 450000 cơ
sở dữ liệu trực tuyến. Nguồn thông tin web càng phát triển thì nhu cầu tích hợp dữ
liệu càng tăng lên nhanh chóng. So khớp lược đồ là thao tác cơ sở của quá trình tích
hợp dữ liệu, nó đóng vai trò trung tâm trong nhiều lĩnh vực ứng dụng khác nhau
như: tích hợp lược đồ (Schema integration), kho dữ liệu (Data warehouses), thương
mại điện tử (E-commerce), xử lý truy vấn ngữ nghĩa (Semantic query
processing),…
So khớp lược đồ xác định sự tương ứng hay so khớp về ngữ nghĩa giữa các
khái niệm mô tả ý nghĩa của dữ liệu trong những nguồn dữ liệu phân tán không
đồng nhất (như các lược đồ cơ sở dữ liệu, XML DTD, các HTML form tags,…).
Kết quả so khớp lược đồ hay ánh xạ lược đồ bao gồm tập tất cả các so khớp có thể
có giữa các phần tử của hai lược đồ. So khớp lược đồ được xác định là một trong
những thao tác cơ bản trong nhiều xử lý tích hợp dữ liệu [2], vì vậy kết quả so khớp
ảnh hưởng rất lớn đến kết quả tích hợp dữ liệu. Ánh xạ lược đồ (kết quả của quá
trình so khớp) có thể ứng dụng trong quá trình phát sinh lược đồ toàn cục, viết lại
câu truy vấn trên các nguồn không đồng nhất, loại bỏ dữ liệu trùng lắp,…
Bài toán so khớp lược đồ phát sinh khi giải quyết bài toán tích hợp lược đồ,
và trong quá trình nghiên cứu, so khớp lược đồ còn là giải pháp cho những vấn đề
liên quan đến sự không đồng nhất về ngữ nghĩa mà các hệ thống máy tính đang phải
đối mặt. Chẳng hạn, hai doanh nghiệp muốn thực hiện việc sáp nhập với nhau thành
một doanh nghiệp có quy mô lớn hơn. Về mặt kỹ thuật, những doanh nghiệp này
phải tích hợp các cơ sở dữ liệu của họ. Để tích hợp cơ sở dữ liệu, các xử lý kỹ thuật
2
thường thực hiện theo hai bước (1) xác định những phần tử (như các thuộc tính,
kiểu dữ liệu,…) tương ứng ngữ nghĩa giữa các thực thể có liên quan với nhau của
hai lược đồ, đây là quá trình so khớp lược đồ, (2) tích hợp hai cơ sở dữ liệu ban đầu
dựa vào kết quả xử lý ở bước 1.
Vậy, so khớp lược đồ là quá trình xác định các cặp phần tử tương ứng ngữ
nghĩa giữa các thực thể có liên quan với nhau của hai lược đồ, các phần tử này được
gọi là so khớp với nhau.
Ví dụ 1.1
Cho hai lược đồ, mỗi lược đồ có một quan hệ chứa thông tin về khách hàng,
ví dụ về so khớp hai lược đồ này được mô tả ở Hình 1.1. So khớp lược đồ là xác
định tập các ánh xạ thể hiện sự so khớp giữa các phần tử của hai lược đồ. Thuộc
tính Mã KH trong lược đồ thứ nhất so khớp với thuộc tính Mã Khách hàng trong
lược đồ thứ hai, tập thuộc tính {Họ, Tên lót, Tên} trong lược đồ thứ nhất so khớp
với thuộc tính Họ tên trong lược đồ thứ hai, thuộc tính Ngày sinh so khớp với Năm
sinh và hai thuộc tính địa chỉ trong hai lược đồ so khớp với nhau.
Hình 1.1- Ví dụ về so khớp lược đồ
So khớp lược đồ là thao tác cơ bản trong nhiều ứng dụng khác nhau như tích
hợp lược đồ, kho dữ liệu (Data warehouses), thương mại điện tử (E-commerce), xử
3
lý truy vấn ngữ nghĩa (Semantic query processing),… Vì vậy trong hai thập kỷ qua
đã có nhiều nghiên cứu về so khớp lược đồ.
1.2. Một số ứng dụng của bài toán so khớp lược đồ
1.2.1. Tích hợp lược đồ
Nhóm tác giả J. Euzenat và P.Shvaiko[12] đưa ra một kịch bản tích hợp lược
đồ như sau: Cho hai cơ sở dữ liệu CSDL1 và CSDL2 lưu trữ dữ liệu về các đầu sách
của hai thư viện. Khi hai thư viện này được sáp nhập lại với nhau, yêu cầu được đặt
ra là phải xây dựng một lược đồ toàn cục cung cấp giao diện thống nhất và trong
suốt với người dùng khi truy cập hai cơ sở dữ liệu cục bộ CSDL1 và CSDL2. Quá
trình xử lý tích hợp lược đồ được minh họa trong Hình 1.2
Hình 1.2 – Ví dụ ứng dụng so khớp lược đồ trong lĩnh vực tích hợp lược đồ
Khi người dùng tìm kiếm thông tin về một quyển sách, câu truy vấn được
viết trên lược đồ toàn cục. Câu truy vấn toàn cục này được gởi đến bộ xử lý trung
4
gian, bộ xử lý trung gian lại chuyển cho bộ so khớp lược đồ để tìm các phần tử
trong lược đồ cục bộ tương ứng với các phần tử trong câu truy vấn toàn cục, khi
nhận được kết quả so khớp, bộ xử lý trung gian biến đổi câu truy vấn toàn cục thành
câu truy vấn cục bộ và gởi đến cơ sở dữ liệu cục bộ. Kết quả truy vấn trên cơ sở dữ
liệu lại được trả về bộ so khớp trung gian, thực hiện so khớp lược đồ và biến đổi kết
quả truy vấn cục bộ thành kết quả toàn cục và gởi kết quả lại cho lược đồ toàn cục
tổng hợp kết quả và trả về cho người dùng.
1.2.2. Kho dữ liệu
Một biến thể của bài toán tích hợp lược đồ đã trở nên phổ biến từ những năm
1990 là tích hợp các nguồn dữ liệu vào một kho dữ liệu. Kho dữ liệu là một cơ sở
dữ liệu hỗ trợ ra quyết định được rút trích từ một tập nguồn dữ liệu. Quá trình rút
trích đòi hỏi phải biến đổi dữ liệu từ định dạng nguồn sang định dạng của kho dữ
liệu. Thao tác so khớp được ứng dụng trong việc thiết kế các phép biến đổi. Cho
một nguồn dữ liệu, việc tạo ra những phép biến đổi thích hợp bắt đầu bằng cách tìm
những phần tử của nguồn dữ liệu có trong kho dữ liệu, đây là một thao tác so khớp.
Sau khi thực hiện so khớp lược đồ, với mỗi cặp phần tử tương ứng, người thiết kế
kho dữ liệu xác định ngữ nghĩa của mỗi phần tử của nguồn dữ liệu và biến đổi
tương ứng với ngữ nghĩa của phần tử của kho dữ liệu tương ứng.
1.2.3. Thương mại điện tử
Thương mại điện tử ứng dụng so khớp lược đồ trong quá trình dịch thông
điệp. Các đối tác kinh doanh thường xuyên trao đổi thông điệp mô tả các giao dịch
kinh doanh. Thông thường, mỗi đối tác sử dụng một định dạng thông điệp riêng,
định dạng của mỗi thông điệp có thể khác nhau về cấu trúc, như cấu trúc EDI
(electronic data interchange – trao đổi dữ liệu điện tử), XML, … Họ cũng có thể sử
dụng những lược đồ thông điệp khác nhau.
Khi doanh nghiệp cần chuyển một thông điệp cho đối tác của họ, vì hai
doanh nghiệp sử dụng định dạng thông điệp khác nhau nên cần xây dựng một
5
bộ dịch thông điệp để giúp các đối tác hiểu được thông điệp của nhau. Mô hình dịch
thông điệp được minh họa trong Hình 1.3.
Hình 1.3 -Ví dụ ứng dụng so khớp lược đồ trong lĩnh vực thương mại điện tử
Khi doanh nghiệp cần chuyển một thông điệp cho đối tác, doanh nghiệp sẽ
gởi thông điệp đến bộ dịch thông điệp. Bộ dịch thông điệp chuyển thông điệp cho
bộ so khớp lược đồ để thực hiện việc so khớp các phần tử trong định dạng thông
điệp của doanh nghiệp và đối tác. Khi có kết quả so khớp lược đồ, bộ dịch thông
điệp biến đổi định dạng của thông điệp ban đầu thành định dạng thông điệp của đối
tác.
1.3. Một...
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
D Cấu trúc nghiệm của một số lớp phương trình vi phân khoảng và ứng dụng Khoa học Tự nhiên 0
D Ứng dụng phương pháp hồi quy phân vị phân tích chênh lệch tiền lương ở Việt Nam Luận văn Kinh tế 0
D nghiên cứu các phương pháp phân lớp dữ liệu và ứng dụng trong bài toán dự báo thuê bao rời mạng viễn thông Công nghệ thông tin 0
D Ứng dụng PLC điều khiển tự động băng chuyền đếm, phân loại sản phẩm theo màu sắc Khoa học kỹ thuật 0
D Nghiên cứu, phân tích giải pháp mobile backhaul và ứng dụng triển khai trên mạng viễn thông của VNPT tuyên quang Công nghệ thông tin 0
D PHÂN TÍCH ỨNG DỤNG CỦA MÔ HÌNH CROSS-DOCKING. LIÊN HỆ THỰC TẾ Luận văn Kinh tế 0
D Nghiên cứu nâng cao chất lượng điện năng và giảm tổn thất trong lưới điện phân phối, ứng dụng vào lưới điện của công ty điện lực Lào Khoa học kỹ thuật 0
D Ứng dụng mô hình phân tích SWOT dể hoạch định chiến lược phát triển trong lĩnh vực internet tại tổng công ty viễn thông quân đội Luận văn Kinh tế 0
D Phép biến đổi Laplace và ứng dụng trong phương trình vi phân Luận văn Sư phạm 0
D Phép biến đổi Laplace và ứng dụng trong việc giải phương trình vi phân thường Luận văn Sư phạm 0

Các chủ đề có liên quan khác

Top