daigai

Well-Known Member
Link tải luận văn miễn phí cho ae
Lời giới thiệu
Ngày nay, Big Data đang ngày càng trở nên một xu hướng trên toàn thế giới. Đây là
cơ hội cũng như thách thức cho các nhà khoa học máy tính hiện nay. Báo cáo này sẽ
trình bày về sự bùng nổ thông tin, Big Data và tính toán lưới - giải pháp cho Big Data.
4
I. Big Data
1. Sự bùng nổ dữ liệu và Big Data
Trong cuộc sống hiện đại ngày nay, công nghệ thông tin đang đóng một vai trò hết sức
quan trọng. Chúng ta có thể thấy công nghệ được áp dụng mọi nơi trong cuộc sống, từ
giải trí, liên lạc đến xử lý những bài toán lớn của giới khoa học như dự báo thời tiết,
mô phỏng thí nghiệm hạt nhân, đoán kinh tế… Cùng với sự xâm nhập của công
nghệ vào cuộc sống con người, lượng dữ liệu được con người tạo ra hay thu thập cũng
bùng nổ một cách chóng mặt.
Đầu tiên phải kể đến lượng dữ liệu phát sinh bởi hoạt động của con người hàng ngày.
Ở lĩnh vực kinh tế, Amazon bán 306 hàng hóa mỗi giây (năm 2012). Trong khi đó với
eBay, hơn 1 tỉ lượt truy cập và 44 tỉ giao tác SQL được thực thi mỗi ngày. Đồng thời,
hãng này còn quản lý 248 triệu người dùng cùng hơn 1 tỉ ảnh.
Hình 1: Lượng dữ liệu được hỗ trợ bởi những doanh nghiệp Oracle ngày nay
5
Ở lĩnh vực giải trí, Facebook quản lý hơn 750 triệu thành viên (tính đến 2011), 2.5 tỉ
mẩu nội dung được chia sẽ, 2.7 tỉ lượt like, 300 triệu lượt upload ảnh mỗi ngày. Với
Youtube, một website hàng đầu trong lĩnh vực chia sẽ video, trong mỗi phút có 100
giờ video được upload lên, 6 tỉ giờ video được xem mỗi tháng.
Hình 2: Thống kê tỉ lệ các loại dữ liệu
Bên cạnh lượng dữ liệu lớn được phát sinh bởi hoạt động con người hàng ngày,
số lượng nguồn dữ liệu ngày càng đa dạng cũng góp phần trong quá trình bùng nổ
thông tin hiện nay. Dữ liệu từ một lượng rất lớn các sensor thời tiết ghi lại thông tin về
thời tiết: độ ẩm, nhiệt độ… Dữ liệu video từ hàng chục đến hàng trăm ngàn camera
quan sát trong những thành phố, dữ liệu GPS được ghi lại từ các phương tiện người
dùng, dữ liệu ảnh vệ tinh chụp bề mặt trái đất… Tất cả đã và đang tạo nên một bức
tranh bùng nổ dữ liệu trong thời đại ngày nay.
Sự bùng nổ dữ liệu dẫn đến những cách lưu trử cũng như xử lý mới. Khái
niệm Big Data ra đời từ những đòi hỏi đó.
6
Định nghĩa: Big Data đề cập tới những bộ dữ liệu có kích thước vượt quá khả năng
của những phần mềm, công cụ lưu trữ, xử lý phổ biến hiện nay. Kích cỡ mục tiêu của
big data thay đổi liên tục theo thời gian. Ví dụ, vào năm 2012, kích cỡ vào khoảng từ
vài chục terabyte đến vài petabyte cho một bộ dữ liệu. Kích cỡ mục tiêu thay đổi liên
tục vì sự phát triển không ngừng của những hệ quản trị cơ sở dữ liệu truyền thống
Có 4 đặc tính chính của big data:
• Dung lượng: Các doanh nghiệp lớn hiện nay có một lượng lớn dữ liệu được
sinh ra, thu thập hàng ngày, lên đến hàng terabyte, thậm chí hàng petabyte. Ví
dụ như việc phân tích 350 số ghi điện hàng năm để phân tích nhu cầu tiêu thụ
điện hay phân tích 12 terabyte Tweet được tạo ra mỗi ngày để phân tích đánh
giá về sản phẩm của người dùng
• Vận tốc: Có những ứng dụng sử dụng big data cần tốc độ xử lý trong thời gian
thực như phân tích tình hình chứng khoán dựa trên một lượng lớn dữ liệu
chứng khoán thu thập được trong thời gian vừa qua.
• Sự đa dạng: Big Data không ám chỉ một loại dữ liệu cụ thể nào. Nó có thể là dữ
liệu có cấu trúc, không có cấu trúc, dữ liệu văn bản, dữ liệu thu thập từ các cảm
biến, dữ liệu đa phương tiện như audio, video,… Các thông tin, tri thức có thể
được khám phá khi phân tích những loại dữ liệu này cùng với nhau
• Tính xác thực: Vì Big Data có số lượng rất lớn và được thu thập từ rất nhiều
nguồn khác nhau, do đó độ tin cậy của Big Data là một vấn đề rất quan trọng.
Những dữ liệu sai có thể dẫn đến những quyết định sai lầm, gây hậu quả lớn
2. Giá trị của Big Data
7
Big Data có thể được xem như là tương lai của ngành điện toán. Lượng dữ liệu khổng
lồ của Big Data cho phép chúng ta phân tích và có được những thông tin, tri thức quý
giá từ bên trong nó.
Với Big Data, chúng ta có thể có được những câu trả lời cho những câu hỏi mà trước
đây không thể giải quyết được: Các tổ chức tài chính có thể tìm ra cách phát hiện gian
lận tốt hơn, các công ty bảo hiểm có thể biết được khách hàng tiềm năng của mình,
những nhà đầu tư chứng khoán có thể đoán xu thế cổ phiếu trong tương lai, việc dự
báo thời tiết sẽ chính xác hơn, những nghi phạm khủng bố được phát hiện nhanh
chóng hơn,…
3. Những thách thức

Link Download bản DOC
Do Drive thay đổi chính sách, nên một số link cũ yêu cầu duyệt download. các bạn chỉ cần làm theo hướng dẫn.
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link để tải:

 
Top