Link tải luận văn miễn phí cho ae Kết Nối
 Weka là môi trường thử nghiệm KPDL do các nhà khoa học thuộc trường Đại học Waitako, NZ, khởi xướng và được sự đóng góp của rất nhiều nhà nghiên cứu trên thế giới. Weka là phần mềm mã nguồn mở, cung cấp công cụ trực quan và sinh động cho mọi người tìm hiểu về KPDL. Weka còn cho phép các giải thuật học mới phát triển có thể tích hợp vào môi trường của nó. Hệ thống được viết bằng java. Nó chạy được hầu hết trên tất cả hệ điều hành.
 Weka cung cấp nhiều giải thuật khác nhau với nhiều cách cho quá trình xử lý để ước lượng kết quả bằng sơ đồ cho bất kì một dữ liệu nào.
 Weka cung cấp những chức năng chính sau:
 Bao gồm nhiều công cụ đa dạng để thay đổi tập dữ liệu, xử lý dữ liệu, giải thuật học và phương pháp đánh giá.
 Giao diện đồ họa người dùng (trực quan hóa dữ liệu).
 Môi trường để so sánh các giải thuật học.
 Bạn có thể xử lý trước tập dữ liệu, cho vào trong một sơ đồ, và phân chia các lớp kết quả và thực hiện nó mà không cần viết bất cứ một chương trình nào.
 Weka lấy dữ liệu từ các file có định dạng .arff, nó được phát sinh từ một file hay một bảng cơ sở dữ liệu.
 Cách sử dụng Weka là thông qua giao diện đồ họa của nó

Hình 1: Giao diện đồ họa của Weka
 Các phiên bản của Weka
 WEKA 3.0: “book version”: Chỉ cho phép viết các câu lệnh.
 WEKA 3.2: “GUI version”- Graphical User interfaces (Phiên bản giao diện đồ họa) : Ngoài việc viết các câu lệch có thể sử dụng giao diện đồ họa.
 WEKA 3.3: “Development version” (Phiên bản phát triển) :Với nhiều cải tiến.

Trong phần Applications có 4 phần:
1. Explorer: Sử dụng menu lựa chọn. Explorer chỉ sử dụng cho những bộ dữ liệu vừa và nhỏ.
2. Experimeter: Cho phép người dùng thực hiện những bài tập cơ bản khi ứng dụng phân lớp và kĩ thuật hồi quy, với những công việc có giá trị, phương pháp và tham số tốt nhất cho vấn đề đã cho.
Cho phép bạn tự động hóa xử lý, làm cho nó phân lớp và lọc dễ dàng với những cách thiết lập tham số khác nhau trên toàn thể bảng dữ liệu
3. KnowledgeFlow: cho phép người dùng kéo thả những chiếc hộp tượng trưng cho các giải thuật và dữ liệu để kết nối chúng lại với nhau và đưa ra cấu trúc.
4. Simple CLI: Sử dụng câu lệnh

II. EXPLORER
Trong giao diện của Explorer có 6 tab

Hình 2: Giao diện đồ họa của Exporer
 Preprocess: Tiền xử lý dữ liệu.
 Classify: Tạo ra những chương trình để phân loại.
 Cluster: Tạo phân cụm cho cơ sở dữ liệu.
 Associate: Tạo luật kết hợp cho dữ liệu và đánh giá chúng.
 Select attributes: Lựa chọn những thuộc tính liên quan nhất trong tập dữ liệu.
 Visualize: (Nhìn thấy sự khác nhau hai chiều của dữ liệu và sự tương tác giữa chúng)View different two-dimensional plots of the data and interact with them.
1. Đưa dữ liệu vào
Trong tab Preprocess có:
 Nút mở các file có sẵn trên máy.
 Nút mở file từ máy khác.
 Nút đọc dữ liệu từ một cơ sở dữ liệu.
 Nút Phần mềm tự tạo ra dữ liệu cho bạn theo những sự lựa chọn của bạn.
Sử dụng nút bạn có thể đọc các tập tin ở nhiều định dạng như: định dạng ARFF, định dạng CSV, định dạng C4.5.
Khi bạn mở một file từ mục open file sẽ hiện ra một cửa sổ như sau:

Click Ok sau đó click vào button để tạo luật kết hợp, kết quả sẽ hiện thị ở vùng Associator output như sau:

=== Run information ===
Scheme: weka.associations.Apriori -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -A -c -1
Relation: BANK-DATA-SUA
Instances: 101
Attributes: 11
TUOI
GIOI TINH
KHU VUC
THU NHAP
KET HON
CON
XE
TKTK
TK_HIEN TAI
THE CHAP
CHO VAY
=== Associator model (full training set) ===
Apriori
=======
Minimum support: 0.1 (10 instances)
Minimum metric : 0.9
Number of cycles performed: 18
Generated sets of large itemsets:
Size of set of large itemsets L(1): 42
Size of set of large itemsets L(2): 172
Size of set of large itemsets L(3): 131
Size of set of large itemsets L(4): 19
Size of set of large itemsets L(5): 1
Best rules found:
1. CON=1_con TK_HIEN TAI=C 16 ==> CHO VAY=C 15 conf:(0.94)
2. CON=1_con TKTK=C 13 ==> CHO VAY=C 12 conf:(0.92)
3. CON=1_con THE CHAP=K 13 ==> CHO VAY=C 12 conf:(0.92)
4. CON=1_con XE=K 12 ==> CHO VAY=C 11 conf:(0.92)
5. CON=1_con TKTK=C TK_HIEN TAI=C 12 ==> CHO VAY=C 11 conf:(0.92)
6. CON=1_con TK_HIEN TAI=C THE CHAP=K 12 ==> CHO VAY=C 11 conf:(0.92)
7. CON=0_con TKTK=C THE CHAP=C 12 ==> CHO VAY=K 11 conf:(0.92)

Kết quả: Tạo được 7 luật kết hợp:
1. CON=1_con TK_HIEN TAI=C 16 ==> CHO VAY=C 15 conf:(0.94)
2. CON=1_con TKTK=C 13 ==> CHO VAY=C 12 conf:(0.92)
3. CON=1_con THE CHAP=K 13 ==> CHO VAY=C 12 conf:(0.92)
4. CON=1_con XE=K 12 ==> CHO VAY=C 11 conf:(0.92)
5. CON=1_con TKTK=C TK_HIEN TAI=C 12 ==> CHO VAY=C 11 conf:(0.92)
6. CON=1_con TK_HIEN TAI=C THE CHAP=K 12 ==> CHO VAY=C 11 conf:(0.92)
7. CON=0_con TKTK=C THE CHAP=C 12 ==> CHO VAY=K 11 conf:(0.92)


Link Download bản DOC
Do Drive thay đổi chính sách, nên một số link cũ yêu cầu duyệt download. các bạn chỉ cần làm theo hướng dẫn.
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link để tải:

 
Last edited by a moderator:

Các chủ đề có liên quan khác

Top