xuanmai_et

New Member
Download Luận văn Đối sánh tự động lược đồ XML

Download miễn phí Luận văn Đối sánh tự động lược đồ XML





Mục lục
Danh mục từviết tắt, thuật ngữ..
Danh mục bảng biểu ..
Danh mục hình vẽ..
Mở đầu ..
1. Giới thiệu chung..
2. Nội dung luận văn..
Chương 1 Đối sánh lược đồ..
1.1 Tổng quan về đối sánh lược đồ..
1.1.1 Các khái niệm cơbản về đối sánh lược đồ..
1.1.2 Các lĩnh vực ứng dụng đối sánh lược đồ..
1.2 Các tiếp cận đối sánh lược đồ..
1.2.1 Phân loại các tiếp cận đối sánh lược đồ..
1.2.2 Các tiếp cận đối sánh lược đồ..
1.2.3 Các phương pháp đối sánh lược đồ..
1.3 Các hệthống đối sánh lược đồXML..
1.3.1 Cupid (trung tâm nghiên cứu Microsoft)..
1.3.2 Similarity Flooding (Đại học Stanford và đại học Leipzig)..
1.3.3 LSD (Đại học Washington)..
1.3.4 Clio (IBM Almaden và đại học Toronto)..
1.3.5 Một sốhệthống đối sánh lược đồkhác..
1.4 Kết chương..
Chương 2 Các định nghĩa hình thức ..
2.1 Vấn đề đối sánh lược đồXML..
2.1.1 Đối sánh ngữnghĩa và đối sánh cú pháp..
2.1.2 Thông tin đầu vào của tiến trình đối sánh..
2.1.3 Thông tin đầu ra của tiến trình đối sánh..
2.1.4 Các định nghĩa hình thức..
2.2 Mô hình hóa lược đồXML..
2.2.1 Các nút đồthịlược đồ..
2.2.2 Các cạnh đồthịlược đồ..
2.2.3 Các ràng buộc đồthịlược đồ..
2.2.4 Các định nghĩa hình thức..
2.3 Ánh xạnguồn–đích..
2.4 Kết chương..
Chương 3 Đối sánh tự động lược đồXML ..
3.1 Tổng quan về đối sánh tự động lược đồXML..
3.2 Đo độtương đồng ngôn ngữ..
3.2.1 WordNet và quan hệngữnghĩa giữa các từ..
3.2.2 Thuật toán của Hirst và St-Onge..
3.2.3 Giải pháp của hệthống Cupid..
3.3 Xét tính tương thích kiểu dữliệu lược đồXML và phân tích phân cấp kiểu
người thiết kế..
3.3.1 Xét tính tương thích kiểu dữliệu lược đồXML..
3.3.2 Phân tích phân cấp kiểu người thiết kế..
3.4 Đo độtương đồng cấu trúc..
3.4.1 Định nghĩa ngữcảnh nút..
3.4.2 Đo độtương tự đường dẫn..
3.4.3 Đo độtương đồng ngữcảnh nút..
3.5 Đo độtương đồng nút và tạo ánh xạgiữa các phần tử..
3.5.1 Đo độtương đồng nút..
3.5.2 Tạo ánh xạgiữa các nút và cạnh đối sánh..
3.6 Đánh giá tiến trình đối sánh lược đồXML..
3.6.1 Các phương pháp đánh giá..
3.6.2 Đánh giá giải pháp..
3.7 Áp dụng đối sánh lược đồtrong bài toán chuyển đổi tài liệu có cấu trúc.Error!
3.7.1 Tổng quan vềtài liệu có cấu trúc..
3.7.2 Chuyển đổi tự động tài liệu có cấu trúc..
3.7.3 Mô hình cho hệthống chuyển đổi tự động tài liệu XML..
3.8 Kết chương..
Kết luận và hướng phát triển ..
1. Đóng góp chính của luận văn..
2. Hướng phát triển..
Danh mục tài liệu tham khảo ..
Phụlục.



Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

một tên ràng buộc (chẳng hạn như ràng buộc
duy nhất, số yếu tố), Ccategory là một danh mục ràng buộc (ràng buộc trên nút,
Chương 2: Các định nghĩa hình thức
Võ Sỹ Nam. Luận văn cao học – ngành công nghệ thông tin
41
ràng buộc trên cạnh, ràng buộc trên tập cạnh), Capply-to định nghĩa các thành
phần áp dụng ràng buộc (ví dụ tên nút trong trường hợp ràng buộc trên nút) và
Cvalue là giá trị của ràng buộc (nếu nó tồn tại, nếu không thì lấy giá trị mặc
định ∅).
Ta không cần kiểm tra tính hợp khuôn dạng của đồ thị lược đồ (ví dụ nếu
nhãn cạnh là thuộc tính thì kiểm tra rằng nút nguồn là một nút phức hợp và
nút đích là một nút nguyên tố). Điều này là do ta xây dựng đồ thị lược đồ trên
cơ sở các lược đồ XML hợp lệ đã có. Dựa trên các khái niệm nút và cạnh, ta
đưa ra thêm các khái niệm đường dẫn, đường dẫn nguyên thủy như sau:
Định nghĩa 2.7 (Đường dẫn) Một đường dẫn từ một nút n1 tới nút nk là một
dãy n1, n2, … , nk, trong đó n1, n2, … , nk ∈NG, và với bất kỳ hai nút liên tiếp
ni and ni+1 (1 ≤ i ≤ k-1), tồn tại một cạnh ei (l, ni , ni+1) ∈ EG – {Ea}. Một
đường dẫn chỉ bao gồm các cạnh chứa và cạnh thuộc-tính-của. Ta gọi n1 và nk
lần lượt là nút bắt đầu và nút kết thúc của đường dẫn. Đường dẫn được xem là
đi qua nút ni (1 ≤ i ≤ k). Độ dài của đường dẫn là tổng số nút mà đường dẫn đi
qua, tức là, k với đường dẫn P = (n1, n2, … , nk), biểu thị như length(P)= k.
Định nghĩa 2.8 (Đường dẫn nguyên thủy) Một đường dẫn từ nút n1 tới nút
nk, là một đường dẫn nguyên thủy khi và chỉ khi nút bắt đầu n1 không có cạnh
vào (nghĩa là nút bắt đầu là gốc của đồ thị lược đồ).
Khái niệm đồ thị lược đồ được mô tả ở trên không bao gồm các chức năng
như thừa kế kiểu và kiểu trừu tượng. Các vấn đề này sẽ được xem xét trong
chương 3. Chú ý rằng đồ thị lược đồ được xây dựng bằng cách mở rộng các
kiểu chia sẻ trong lược đồ XML. Dựa trên việc hình thức hóa đồ thị lược đồ,
ta đưa ra thêm một số định nghĩa về việc chuyển đổi khởi dựng nguồn thành
khởi dựng đích (khái niệm khởi dựng ở đây nhằm nói đến nút và cạnh trong
đồ thị lược đồ). Một phần tử ánh xạ liên kết một khởi dựng từ S tới một khởi
Chương 2: Các định nghĩa hình thức
Võ Sỹ Nam. Luận văn cao học – ngành công nghệ thông tin
42
dựng tương đồng ngữ nghĩa từ T (lần lượt là các đồ thị lược đồ nguồn và
đích). Mặc dù một nguồn có thể không có một khởi dựng tương ứng trực tiếp
tới một khởi dựng đích, các khởi dựng đích có thể được dẫn xuất từ các khởi
dựng nguồn bằng cách áp dụng một tập các phép toán đã định nghĩa trước. Cơ
chế này có những điểm tương đồng với việc tạo khung nhìn ảo trong tích hợp
dữ liệu, ở đó một khung nhìn ảo trên nguồn phải đối sánh với một lược đồ
trung gian (ví dụ ghép nối của các phần tử nguồn FirstName và LastName
thành một phần tử ảo Name mà đối sánh với phần tử đích Name). Khung nhìn
ảo cũng áp dụng được cho cạnh (ví dụ hai cạnh Author→FirstName và
Author→LastName được hợp nhất với nhau thành một cạnh ảo
Author→Name đối sánh với cạnh Author→Name trong lược đồ đích). Dựa
trên các định nghĩa trong [20] cho vấn đề tạo khung nhìn ảo, ta có thể đưa ra
các định nghĩa hình thức ánh xạ giữa các lược đồ nguồn và đích như sau:
Định nghĩa 2.9 (Bảng ký tự lược đồ) Cho một lược đồ K (tuân theo hình
thức đồ thị lược đồ), ta gọi bảng ký tự lược đồ của K hay ΣK là hợp của các
nút và các cạnh trong đồ thị lược đồ của K: ΣK = NK ∪EK.
Định nghĩa 2.10 (Khung nhìn ảo) Cho một lược đồ nguồn S và bảng ký tự
ΣS của nó, một khung nhìn ảo υS trên S là một dẫn xuất từ bảng ký tự ΣS áp
dụng một tập các phép toán đã định nghĩa trước O ={o1,…on.}.
Định nghĩa 2.11 (Phần tử ánh xạ, ánh xạ trực tiếp, ánh xạ phức hợp) Cho
VS là tập các khung nhìn ảo có thể được xây dựng trên ΣS. Một phần tử ánh xạ
là một hàm mst: ΣS∪VS → ΣT, nối kết một phần tử s trong ΣS∪VS tới một
phần tử t trong ΣT. Một phần tử ánh xạ là một ánh xạ trực tiếp nếu nó nối kết
một phần tử trong ΣS (⊆VS) tới một phần tử trong ΣT và là một ánh xạ phức
hợp nếu nó nối kết một phần tử ảo υS ∈VS tới một phần tử đích trong ΣT qua
một biểu thức ánh xạ đã định nghĩa trên O.
Chương 2: Các định nghĩa hình thức
Võ Sỹ Nam. Luận văn cao học – ngành công nghệ thông tin
43
2.3 Ánh xạ nguồn–đích
Một trong những ứng dụng cơ bản của đối sánh lược đồ là vấn đề chuyển
đổi giữa các nguồn dữ liệu có cấu trúc tuân theo các lược đồ tương đồng. Vấn
đề này đòi hỏi ta phải thiết lập các ánh xạ thích hợp giữa các phần tử tương
đồng trong hai lược đồ nguồn và đích đã cho, hay còn gọi là ánh xạ nguồn–
đích. Các nghiên cứu trong lĩnh vực CSDL đã đưa ra mô hình đại số quan hệ
khá hoàn chỉnh, do vậy ta có thể mở rộng mô hình này cho vấn đề ánh xạ
nguồn–đích trong đối sánh lược đồ. Nhiều nghiên cứu khác nhau (chủ yếu
trong lĩnh vực tích hợp dữ liệu) đã mô tả các phép toán tạo khung nhìn ảo trên
các lược đồ. Để giải quyết vấn đề này, họ chỉ ra một tập các phép toán sử
dụng như là các chuyển đổi truy vấn để tích hợp thông tin nguồn vào khung
nhìn đích. Một mở rộng của nghiên cứu này đã được đề xuất trong [20] nhằm
công thức hóa lại các truy vấn trong hệ thống tích hợp dữ liệu. Tuy vậy, các
nghiên cứu này chỉ quan tâm đến các lược đồ quan hệ và chúng không hoàn
toàn áp dụng được cho lược đồ XML. Các nghiên cứu về đối sánh cây, chẳng
hạn như [19] lại chú ý đến vấn đề phát hiện thay đổi cho cây gán nhãn. Họ
đưa ra ba phép toán trong đối sánh cây: delete, insert, relabel. Kịch bản thao
tác "rẻ nhất" cho việc chuyển đổi cây nguồn thành một cây đích là kết hợp các
phép toán này. Tuy vậy, trong các tiếp cận này, nhãn của nút không quan
trọng. Phép toán gán lại nhãn được xem là “rẻ” hơn phép xóa theo sau là một
phép toán chèn. Trong thực tế, nhãn là tên tổng quát của thẻ XML mang
thông tin ngữ nghĩa nên việc gán lại nhãn một nút thành một nút khác không
liên quan về ngữ nghĩa có thể cho ra một kết quả không mong muốn trong đối
sánh lược đồ XML.
Dựa vào các nghiên cứu trên và xuất phát từ các phép toán cơ bản đã
được mô tả trong đại số quan hệ chuẩn, ta có thể đưa ra các phép toán ánh xạ
nguồn–đích áp dụng cho đối sánh lược đồ XML. Sau đây chúng tui sẽ xem
Chương 2: Các định nghĩa hình thức
Võ Sỹ Nam. Luận văn cao học – ngành công nghệ thông tin
44
xét những vấn đề cần giải quyết trong đối sánh lược đồ XML, từ đó mô
tả các phép toán này. Các vấn đề mô tả ở đây về cơ bản dựa trên nghiên cứu
về đại số ánh xạ nguồn–đích đã được đưa ra trong [22].
● Người thiết kế lược đồ có thể mô tả các khái niệm tương tự về mặt ngữ
nghĩa bằng cách sử dụng các tên khác nhau. Để giải quyết vấn đề này, ta cần
một phép toán ...
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
L Phương pháp tìm cặp không đồng nghĩa tự động áp dụng cho bài toán đối sánh ontology Hệ Thống thông tin quản trị 0
T Áp dụng kỹ thuật phân tích ngữ nghĩa tiềm ẩn trong đối sánh văn bản Công nghệ thông tin 0
L Ghép ảnh Panorama dựa trên đối sánh các đặc trưng bất biến Công nghệ thông tin 0
J Xây dựng mô hình phân loại cảnh quan đô thị và nông thôn (đối sánh cảnh quan nông thôn Hoàng Liên Sơ Luận văn Sư phạm 0
J Truyền thuyết và lễ hội về Tứ vị Thánh Nương ở Đền Lộ (Hà Nội) qua đối sánh với truyền thuyết và lễ Văn học dân gian 3
D So sánh đối chiếu đặc trưng ngôn ngữ văn hóa giữa các yếu tố chỉ đồ vật trong thành ngữ tiếng Hán và Tiếng Việt Văn hóa, Xã hội 6
Q Nghiên cứu so sánh đối chiếu âm Hán Hàn với âm Hán Việt ( các vần mở ) Tiếng Trung 3
N So sánh đối chiếu trợ từ ngữ khí trong tiếng Hán và tiếng Việt Văn hóa, Xã hội 2
G Trạng ngữ phương thức, trạng ngữ so sánh và trạng ngữ điều kiện trong tiếng Anh (Có đối chiếu với ti Văn hóa, Xã hội 3
N Nghiên cứu đối sánh mức độ hoạt động kiến tạo hiện đại đới đứt gãy sông Hồng và Điện Biên - Lai Châu Khoa học Tự nhiên 0

Các chủ đề có liên quan khác

Top