danghieu2511

New Member
Em đang làm báo cáo tìm hiểu về Big data, anh chị nào đã làm nghiên cứu về nó rồi thì cho em xin với ạ :cry: :cry: :clap: :clap:
 

tctuvan

New Member
Big Data nguồn mở, Hướng dẫn Hadoop

Có file này, bạn dùng xem
Big Data nguồn mở, Phần 1: Hướng dẫn Hadoop: Tạo ứng
dụng Hello World với Java, Pig, Hive, Flume, Fuse, Oozie và
Sqoop với Informix, DB2 và MySQL
Có rất nhiều điều thú vị về Big Data và cũng có rất nhiều sự nhầm lẫn về nó. Bài
này sẽ cung cấp một định nghĩa về Big Data và sau đó thực hiện một loạt các ví dụ
để bạn có thể có được những hiểu biết ban đầu về một số khả năng của Hadoop,
công nghệ nguồn mở hàng đầu trong lĩnh vực Big Data. Cụ thể, ta tập trung vào
những câu hỏi sau:.
 Big Data, Hadoop, Sqoop, Hive và Pig là gì và tại sao lĩnh vực này lại có
nhiều điều thú vị?
 Hadoop liên quan đến DB2 và Informix của IBM như thế nào? Các công
nghệ này có thể chạy với nhau không?
 tui có thể bắt đầu với Big Data như thế nào? Có ví dụ nào dễ để thử chạy
trên máy tính không?
 Nếu bạn đã biết khái niệm về Hadoop rồi và muốn vào thẳng công việc với
các ví dụ mẫu, thì hãy làm như sau.
1. Hãy bắt đầu chạy một thể hiện Informix hay DB2 của bạn.
2. Tải về file ảnh cho máy ảo VMWare từ Trang web của Cloudera và
tăng thông số RAM máy ảo lên thành 1,5 GB.
3. Chuyển đến mục chứa các ví dụ mẫu.
4. Có một thể hiện MySQL đã được xây dựng sẵn trong máy ảo
VMWare này. Nếu bạn đang làm các bài thực hành mà không kết nối
mạng, hãy sử dụng các ví dụ MySQL này.
Ngoài ra, xin vui lòng xem tiếp...
Big Data là gì?
Big Data lớn về số lượng, được bắt giữ với tốc độ nhanh, có cấu trúc hay không
có cấu trúc, hay là bao gồm các yếu tố ở trên. Những yếu tố này làm cho Big Data
khó bắt giữ lại, khai phá và quản lý nếu dùng các cách truyền thống. Có rất
nhiều ý kiến về lĩnh vực này, đến nỗi có thể cần đến một cuộc tranh luận kéo dài
chỉ để định nghĩa thế nào là Big Data.
Sử dụng công nghệ Big Data không chỉ giới hạn về các khối lượng lớn. Bài này sử
dụng các ví dụ mẫu nhỏ để minh họa các khả năng của công nghệ này. Tính đến
năm 2012, các hệ thống được coi là lớn nằm trong phạm vi 100 Petabyte.
Link Download bản DOC
Do Drive thay đổi chính sách, nên một số link cũ yêu cầu duyệt download. các bạn chỉ cần làm theo hướng dẫn.
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link để tải:

 

Các chủ đề có liên quan khác

Top