p3_c0j

New Member
Link tải luận văn miễn phí cho ae Kết nối
„ Sự gia tăng bùng nổ của dữ liệu: Từ mức độ terabytes đến
mức độ petabytes
‰ Th h u thập dữ liệu và sự tồn tại của dữ liệu
„ Các công cụ thu thập dữ liệu tự động, các hệ thống cơ sở dữ
liệu, World Wide Web, xã hội số
‰ Các nguồn dữ liệu ph hú ong phú
„ Kinh doanh: Internet, thương mại điện tử, giao dịch thương
mại, chứng khoán,…
„ Khoa học: Tín hiệu cảm biến tin sinh thí nghi , tin sinh, thí nghiệm mô
phỏng/giả lập,…
„ Xã hội: Tin tức, máy ảnh số, các mạng xã hội
„ Chúng ta bị tràn ngập trong dữ liệu – Nhưng lại thiếu (cần) tri
thức
„ Khai phá dữ liệu: Giúp tự động phân tích các tập dữ liệu rất
lớn, để khám phá ra các tri thức
phá dữ liệu – Định ng
„ Khai phá dữ liệu (Data mining – DM) – Khám phá tri thức
từ dữ liệu (Knowledge discovery from data)
‰ Là việc trích rút ra được các mẫu hay tri thức quan trọng từ một
lượng dữ liệu (rất) lớn
„ quan trọng = không tầm thường, ẩn, chưa được biết đến, và
có thể hữu ích
„ Các tên gọi khác
‰ Khám phá tri thức trong các cơ sở dữ liệu (Knowledge discovery
in databases - KDD)
‰ Trích rút tri thức (Knowledge extraction)
‰ Phân tích mẫu/dữ liệu (Data/pattern analysis)
‰ …
„ Khai phá dữ liệu khác với…
‰ Tìm kiếm thông tin (Information retrieval)
‰ Xử lý các câu truy vấn (SQL) đối với các cơ sở dữ liệu
ịch sử p
„ 1989 IJCAI Workshop on Knowledge Discovery in Databases
‰ Knowledge Discovery in Databases (G. Piatetsky-Shapiro and W.
Frawley, 1991)
„ 1991-1994 Workshops on Knowledge Discovery in Databases
‰ Advances in Knowledg y g ( yy , e Discovery and Data Mining (U. Fayyad, G.
Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, 1996)
„ 1995-1998 International Conferences on Knowledge Discovery in
Databases and Data Mining (KDD 95 ’95-98)
‰ Journal of Data Mining and Knowledge Discovery (1997)
„ ACM SIGKDD conferences since 1998 and (Journal) SIGKDD Explorations
„ More conferences on data mining
‰ PAKDD (1997), PKDD (1997), SIAM-Data Mining (2001), (IEEE) ICDM
(2001), etc.
„ ACM Transactions on KDD starting in 2007
1.Tìm hiểu lĩnh vực của bài toán (ứng dụng)
‰ Các mục đích của bài toán, các tri thức cụ thể của lĩnh vực
2.Tạo nên (thu thập) một tập dữ liệu phù hợp
3.Làm sạch và tiền xử lý dữ liệu
4.Giảm kích thước của dữ liệu, chuyển đổi dữ liệu
‰ Xác định các thuộc tính quan trọng, giảm số chiều (số thuộc tính),
biểu diễn bất biến
5.Lựa chọn chức năng khai phá dữ liệu
‰ Tóm tắt hóa (s mmari ation) phân lo ummarization), phân loại/phân lớp h , hồi q /d uy/dự
đoán, kết hợp, phân cụm
6.Lựa chọn/Phát triển (các) giải thuật khai phá dữ liệu phù hợp
7.Tiến hành quá trình khai phá dữ liệu
8.Đánh giá mẫu thu được và biểu diễn tri thức
‰ Hiển thị hóa, chuyển đổi, bỏ đi các mẫu dư thừa, …
9.Sử dụng các tri thức được khám phá

Link Download bản DOC
Do Drive thay đổi chính sách, nên một số link cũ yêu cầu duyệt download. các bạn chỉ cần làm theo hướng dẫn.
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link để tải:

 

Các chủ đề có liên quan khác

Top