By nhoxsa001
#968501 Link tải miễn phí luận văn
Luận văn ThS. Hệ thống thông tin -- Trường Đại học Công nghệ: 60 48 05. Đại học Quốc gia Hà Nội, 2013
Nghiên cứu liên quan về thu thập thông tin (Information Retrieval), lọc thông tin (Information Filtering), tìm hiểu về các hệ thống gợi ý (Recommendation Systems) cũng như những đặc tính riêng, cần biết của tin tức so với các dạng thông tin khác. Mô tả quá trình tui ứng dụng hướng tiếp cận chọn lọc thông tin dựa trên nội dung vào thực tế, thông qua hệ thống gợi ý tin tức tiếng Việt xenoNews. Trình bày các thử nghiệm nhằm đánh giá hiệu quả hoạt động tổng thể của hệ thống gợi ý dựa trên nội dung, với thành phần then chốt là hồ sơ người dùng kết hợp, đề xuất hướng nghiên cứu để hoàn thiện hệ thống trong tương lai.

Mục lục


Lời Thank 3
Lời cam đoan 4
Lời mở đầu 5
Danh mục hình minh hoạ . 6
Danh mục Bảng biểu và Đồ thị 7
Chương 1: Đặt vấn đề . 8
1.1 Bài toán 8
1.2 Bố cục luận văn . 10
1.3 Phương pháp nghiên cứu . 11
1.4 Kết quả thu được . 12
Chương 2: Các nghiên cứu có liên quan 13
2.1 Báo điện tử 13
2.2 Gợi ý tin tức . 14
2.2.1 Thu thập thông tin (Information Retrieval) 14
2.2.2 Lọc thông tin (Information Filtering) . 15
2.2.3 Phân loại các hệ thống gợi ý 15
2.2.3.1 Các hệ thống dựa trên nội dung 18
2.2.3.2 Các hệ thống lọc có hợp tác . 22
2.2.3.3 Các hệ thống lai . 25
2.2.4 Các đặc trưng riêng của tin tức 28
Chương 3: Hệ thống gợi ý tin tức tiếng Việt xenoNews. 30
3.1 Hướng tiếp cận và Kiến trúc hệ thống . 30
3.1.1 Hướng tiếp cận . 30
3.1.2 Kiến trúc hệ thống 31
3.2 Yêu cầu hệ thống . 32
3.2.1 Các yêu cầu chức năng . 33
3.2.2 Các yêu cầu phi chức năng . 35
3.3 Thiết kế và cài đặt chi tiết các thành phần hệ thống . 36
3.3.1 Hồ sơ đối tượng tin tức (News Item Profile) . 36
3.3.2 Hồ sơ người dùng (User profile) 37
3.3.2.1 Mô hình hoá Sở thích ngắn hạn với thuật toán Láng giềng gần nhất 39
3.3.2.2 Mô hình hoá Sở thích dài hạn với Bộ phân lớp Naïve Bayes 40
3.3.2.3 Thông tin tự mô tả của người dùng 43
3.3.2.4 Kết hợp các mô hình vào quy trình ra quyết định . 45
3.3.3 Lõi xử lý - Back-end 46
3.3.4 Tầng giao tiếp trung gian – Middle-level . 48
3.3.5 Ứng dựng Web – Front-end . 49
3.3.5.1 Công nghệ Web được sử dụng để xây dựng Front-end 49
3.3.5.2 Thiết kế giao diện và Thiết kế tương tác Web – con người là yếu tố trung tâm 52
Chương 4: Các thử nghiệm và kết quả . 56
4.1 Các độ đo và Quá trình chuẩn bị thử nghiệm 56
4.1.1 Các độ đo dùng để đánh giá . 56
4.1.2 Quá trình chuẩn bị thử nghiệm . 57
4.2 Hiệu quả gợi ý của Hồ sơ người dùng kết hợp 58
4.3 Cơ chế phản hồi ẩn time-coded . 61
Kết luận . 63
Phụ lục 64
Tài liệu tham khảo 66


Chương 1: Đặt vấn đề

Chương đầu tiên sẽ bắt đầu từ việc giải thích lý do, động lực thực hiện đề tài luận
văn này. Nội dung của chương xoay quanh trình bày bối cảnh và sự cần thiết của một Hệ
thống gợi ý tin tức tiếng Việt, mô tả các nội dung nghiên cứu trong luận văn, cùng với sơ
lược các kết quả đã đạt được.
1.1 Bài toán
Kể từ khi ra đời cho đến nay, Internet vẫn liên tục phát triển với tốc độ đáng kinh
ngạc, song hành và đóng vai trò to lớn vào sự tiến bộ của nhân loại, đặc biệt là trong
những lĩnh vực như khoa học, công nghệ, giao lưu văn hoá, . Quan trọng nhất là Internet
đã tạo nên một “thế giới phẳng”, cho phép mọi cá nhân, tổ chức có thể dễ dàng kết nối với
nhau bất chấp thời gian hay khoảng cách địa lý.
Tuy vậy, trở thành một công dân Internet thường đồng nghĩa với yêu cầu (hay nhu
cầu) tiếp nhận, xử lý một lượng lớn thông tin hằng ngày, từ rất nhiều nguồn khác nhau.
Điển hình nhất trong các loại thông tin này phải kể đến tin tức được cập nhật từ báo điện
tử, vốn xuất hiện ngày một nhiều những năm gần đây. Báo điện tử có rất nhiều ưu điểm
so với báo in truyền thống, không những sinh động hơn với hình ảnh, video, hay các liên
kết tới bài viết khác, mà còn cho phép người dùng chủ động hơn trong việc nắm bắt thông
tin mọi lúc mọi nơi, miễn là có Internet. Các trang báo điện tử thường xuyên cập nhật
nhanh chóng tin tức mới, và người sử dụng thì có thể nhận thông báo khi có tin mới thông
qua RSS, hay đọc trực tiếp trên website. Vài năm gần đây, rất nhiều tờ báo/tạp chí lâu
đời đã buộc phải thay đổi vì sự phát triển như vũ bão của công nghệ số và sự thay đổi nhu
cầu đọc của độc giả. Hầu hết các báo giấy lớn bây giờ đều đã điện tử hoá phiên bản giấy
của mình. Sự tương tác giữa độc giả và báo điện tử cũng dễ dàng hơn, bởi vì độc giả có
thể để lại những phản hồi dưới mỗi bài, hay chia sẻ cho nhiều người khác cùng đọc, …
Đó chỉ là một vài trong số rất nhiều ưu điểm khiến cho báo điện tử ngày càng phát triển
mạnh. Hệ quả tất yếu là, gần đây rất nhiều tờ báo giấy đã phải ngừng hoạt động hay phá
sản do thua lỗ, hay chuyển hoàn toàn sang báo điện tử. Một ví dụ điển hình là tạp chí
Newsweek danh tiếng của Mỹ, kết thúc năm 2012 đã chính thức đóng cửa báo in để tập
trung phát triển phiên bản điện tử. Điều này phản ảnh xu thế của nền báo chí thế giới
trong kỷ nguyên công nghệ số, không thay đổi sẽ bị đào thải.
Link Download bản DOC
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link tải, không dùng IDM để tải:

Bấm vào đây để đăng nhập và xem link!
Kết nối đề xuất:
Learn Synonym
Advertisement