meo1311

New Member
Download miễn phí Khóa luận Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá Query Log



Mục lục
Tóm tắt nội dung . i
Mục lục . ii
Danh sách bảng . iv
Danh sách hình vẽ . v
Lời mở đầu . 1
Chương 1. Tổng quan về hệ tư vấn . 3
1.1. Giới thiệu về hệ tư vấn . 3
1.2. Bài toán tư vấn . 4
1.3. Phân loại hệ tư vấn . 5
1.3.1. Phương pháp dựa trên nội dung . 5
1.3.2. Phương pháp cộng tác . 7
1.3.3. Phương pháp lai ghép . 10
1.4. Sơ bộ về hệ tư vấn trong khóa luận . 12
Chương 2. Bài toán khai phá query log và ứng dụng . 14
2.1. Cấu trúc query log . 14
2.2. Khai phá query log . 16
2.2.1. Một số dạng thống kê . 16
2.2.2. Khai phá luật . 20
2.3. Ứng dụng của khai phá query log . 22
Chương 3. Mô hình . 24
3.1. Các công trình liên quan . 24
3.1.1. Phân cụm query . 24
3.1.2. Phân tích chủ đề ẩn . 27
3.2. Mô hình . 31
3.2.1. Mô hình tổng quan . 31
3.2.2. Phần xử lý ngoại tuyến . 33
3.2.3. Phần xử lý online . 34
Chương 4. Thực nghiệm và đánh giá . 36
4.1. Môi trường . 36
4.2. Dữ liệu và công cụ . 36
4.3. Thực nghiệm . 38
4.3.1. Lọc nội dung query . 38
4.3.2. Xử lý offline . 39
4.3.3. Xử lý online . 41
4.4. Đánh giá . 42
Kết luận và định hướng . 44
Tài liệu tham khảo . 45
Tiếng việt . 45
Tiếng Anh . 45
Lời mở đầu
Trong thời đại bùng nổ thông tin, khi người dùng thường bị ngập trong khối lượng
thông tin khổng lồ thì hệ tư vấn ngày càng có vai trò quan trọng. Có khá nhiều hệ
thống tư vấn nổi tiếng, nhưng hầu hết chỉ tập trung vào một số lĩnh vực hẹp như: sách,
phim, ca nhạc…Các hệ thống đó thường dựa vào đánh giá của các chuyên gia
(reviewer) với những bộ tiêu chuẩn cụ thể, hay dựa trên việc chấm điểm sản phẩm
bởi người dùng. Nhưng các lĩnh vực trong cuộc sống rất phong phú, số lượng chủng
loại sản phẩm rất lớn. Để có hệ tư vấn dựa trên chuyên gia hay những bộ tiêu chuẩn cụ
thể như vậy trên mọi lĩnh vực, mọi sản phầm là điều không thể.
Khi cần tìm thông tin về một sản phẩm nào đó, giải pháp được hầu hết người
dùng sử dụng là đưa câu hỏi vào máy tìm kiếm thay vì tìm đến những website/forum
chuyên ngành. Tuy nhiên, máy tìm kiếm không phải lúc nào cũng hiệu quả. Máy tìm
kiếm chỉ có thể đưa ra một danh sách các lựa chọn (có thể lên đến hàng triệu) chứ
không thể nói được lựa chọn nào là tốt nhất.
Ví dụ, một du khách lần đầu đến Hà Nội, muốn tìm khách sạn bằng query:
“hanoi hotel”, sẽ nhận được từ Google gần hai triệu kết quả trả về. Hầu hết mọi khách
sạn trong danh sách kết quả đều xa lạ và tự quảng cáo mình là tốt nhất, làm cho du
khách bối rối trong biển thông tin. Không thể có thời gian để tìm hiểu lại về từng
khách sạn (dù chỉ là trong 10-20 kết quả đầu); người khách cần lời khuyên cho trường
hợp này. Những nhu cầu như vậy có thể bắt gặp rất nhiều trong cuộc sống hàng ngày,
ngay cả khi người ta tìm kiếm những sản phầm đơn giản như một chiếc đầu DVD, một
hãng sơn, một công ty taxi …, mà vì không có thông tin nên với họ mọi thương hiệu
đều như nhau. Cần có một phương pháp có thể đưa ra gợi ý, tư vấn cho người dùng đủ
tốt để áp dụng cho những chủ đề rất đa dạng của cuộc sống.
Một giải pháp rất tốt và hiệu quả là gợi ý dựa trên chính kinh nghiệm của những
người đã từng tìm về chủ đề này trước đó. Những thông tin được lưu lại trong log của
máy tìm kiếm sẽ cho biết những người tìm về chủ đề đó thường hay truy cập vào
website nào. Những website này đã qua hai lần ―lọc‖, một của máy tìm kiếm và một
của người dùng (không phải ngẫu nhiên mà nhiều người dùng lại có cùng một lựa
chọn). Đôi khi những kết quả này còn tốt hơn cả kết quả máy tìm kiếm trả lại. Ví dụ:
những website tin tức lớn,được nhiều người tìm & truy cập nhất của Vietnam như:
VnExpress, Vietnamnet, Dân Trí… đều không xuất hiện trong top 10 khi tìm “vietnam
news” trên cả Yahoo & Live Search (phiên bản mới của MSN).
Vì lí do đó, khóa luận đề xuất việc xây dựng một hệ thống tư vấn website cho
máy tìm kiếm dựa trên khai phá query log. Bài toán khai phá query logs là bài toán
phải xử lý khối lượng dữ liệu rất lớn (lên tới hàng gigabyte) nên việc chọn được một
thuật toán tốt và hiệu quả về thời gian là rất khó khăn. Hệ thống này được phát triển từ
đề tài nghiên cứu khoa học về hệ tư vấn website của nhóm chúng tui [1] (thuộc phòng
thí nghiệm Sislab – đại học Công Nghệ). [1] tập trung vào việc thống kê website và
khai phá mẫu có thứ tự (tìm ra quy luật giữa từ khóa trong query và url được click) để
đưa ra tư vấn. Khác với [1], hệ thống được đề xuất trong khóa luận tập trung vào việc
xác định tập website có giá trị và xếp hạng lại chúng theo query người dùng đưa vào.
Ý tưởng chính của hệ thống gồm ba bước:
Bước một: nhóm các query tương đồng vào các cụm. Mỗi cụm tương ứng với
một chủ đề.
Bước hai: tìm ra tập những website (url) tốt, thay mặt cho từng cụm. Tập website
này gọi là tập website tư vấn.
Bước ba: khi người dùng đưa vào một query mới, query này sẽ được phân cụm.
Hệ thống sẽ phân tích, và đưa ra các website trong tập website tư vấn thích hợp nhất
với query đó.

Phần còn lại của khóa luận được chia thành bốn chương:
Chương 1. Tổng quan về hệ tư vấn: Trình bày những nội dung cơ bản về hệ tư
vấn (các hệ thống nổi tiếng, mô tả bài toán tư vấn, phân loại các hệ tư vấn theo phương
pháp xây dựng). Giới thiệu hệ tư vấn website được xây dựng trong khóa luận.
Chương 2. Khai phá query log và ứng dụng: Giới thiệu về cấu trúc query log của
máy tìm kiếm, các thông tin có thể khai phá, phương pháp khai phá và các ứng dụng
của việc khai phá query log.
Chương 3. Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá query
log: Trình bày mô hình hệ thống tư vấn website do chúng tui đưa ra và các công trình
liên quan.
Chương 4. Thực nghiệm và đánh giá: Xây dựng, thử nghiệm và đánh giá hệ
thống với các query liên quan tới miền sản phẩm điện tử.
Phần kết luận tổng kết nội dung chính của khóa luận, các vấn đề còn tồn tại và
định hướng phát triển của hệ thống.
Chương 1. Tổng quan về hệ tư vấn
1.1. Giới thiệu về hệ tư vấn
Trong cuộc sống hàng ngày, trong rất nhiều trường hợp, người ta đưa ra các lựa chọn
dựa trên những ý kiến hay lời khuyên của mọi người xung quanh, có thể qua lời nói,
các bản đánh giá sản phẩm, khảo sát thị trường, thư giới thiệu …v..v. Nhưng trong kỉ
nguyên thông tin, hàng triệu thông tin được đưa lên internet mỗi ngày, điều này dẫn
tới yêu cầu phải có các phương pháp tự động thu thập thông tin và đưa ra lời khuyên
để hỗ trợ cho các phương pháp truyến thống trên . Hệ tư vấn (recommender system) là
một giải pháp như vậy. Hệ thống này đưa ra gợi ý dựa trên những gì người dùng đã
làm trong quá khứ, hay dựa trên tổng hợp ý kiến của những người dùng khác. Hệ tư
vấn đã trở thành một ứng dụng quan trọng và thu hút được sự quan tâm lớn của các
nhà nghiên cứu cũng như các doanh nghiệp.
Một vài hệ tư vấn nổi tiếng [8] :
o Phim / TV/ âm nhạc: MovieLens, EachMovie, Morse, Firefly, Flycasting,
Ringo…
o Tin tức / báo chí: Tapestry, GroupLens, Lotus Notes, Anatagonomy…
o Sách / Tài liệu: Amazon.com, Foxtrot, InfoFinder…
o Web: Phoaks, Gab, Fab, IfWeb, Let's Browse …
o Nhà hàng: Adaptive Place Advisor, Polylens, Pocket restaurent finder…
o Du lịch: Dietorecs, LifestyleFinder …
Link Download bản DOC
Do Drive thay đổi chính sách, nên một số link cũ yêu cầu duyệt download. các bạn chỉ cần làm theo hướng dẫn.
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link để tải:

 

tctuvan

New Member
Re: [Free] Hệ thống tư vấn website cho máy tìm kiếm dựa trên khai phá Query Log

LInk đã update cho bạn
 
Các chủ đề có liên quan khác
Tạo bởi Tiêu đề Blog Lượt trả lời Ngày
D Thiết kế sơ đồ tư duy hệ thống hóa lý thuyết hóa hữu cơ phổ thông Luận văn Sư phạm 0
D Một số giải pháp cải thiện hệ thống quản trị chất lượng dịch vụ tư vấn ở Công ty cổ phần Tư vấn xây dựng Vĩnh Phúc Khoa học kỹ thuật 0
D Xây dựng và sử dụng hệ thống bài tập theo các mức độ tư duy trong dạy học chương Anđehit – xeton – axit cacboxylic lớp 11 THPT Ngoại ngữ 0
P Thực trạng và một số giải pháp nhằm hoàn thiện hệ thống phân phối ở công ty cổ phần vật tư bảo vệ th Luận văn Kinh tế 0
P Nghiên cứu hệ thống trợ giúp quyết định trong tư vấn nghề nghiệp cho học sinh trung học phổ thông Công nghệ thông tin 3
Y Đặc điểm hệ thống kế toán tại công ty đầu tư xây dựng và xuất nhập khẩu Hà Nội Luận văn Kinh tế 0
D Hệ thống không xác định được vật tư nào là vật tư mới, vật tư nào là vật tư cũ, dẫn tới chi phí quản Luận văn Kinh tế 0
D Lý thuyết hệ thống và vận dụng tư duy hệ thống trong đổi mới quản lý giáo dục Luận văn Sư phạm 0
D Phân tích hệ thống thông tin hỗ trợ cho công tác quản lý lương của một công ty tư nhân Công nghệ thông tin 0
T Hệ thống kênh phân phối tại Công ty TNHH Thương mại và Vật tư Nam Hải Luận văn Kinh tế 0

Các chủ đề có liên quan khác

Top