By qwe_jkl
#968220 Link tải luận văn miễn phí cho ae Kết nối
Luận văn ThS. Hệ thống thông tin -- Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội, 2011
Tổng quan về Hệ thông tin Địa lý (GIS) và khai phá dữ liệu không gian. Khái quát về phân cụm dữ liệu và một số phương pháp phân cụm dữ liệu không gian. Xây dựng chương trình thử nghiệm ứng dụng phân cụm dữ liệu không gian hỗ trợ tìm vị trí tối ưu đặt máy ATM trong khu vực nội thành Hà Nội, đánh giá các kết quả đạt được cũng như những hạn chế còn tồn tại
MỤC LỤC
CHƢƠNG 1. MỞ ĐẦU ...............................................................................................1
CHƢƠNG 2. TỔNG QUAN HỆ THÔNG TIN ĐỊA LÝ VÀ KHAI PHÁ DỮ LIỆU
KHÔNG GIAN............................................................................................................3
2.1. Tổng quan về Hệ thông tin địa lý ...................................................................3
2.1.1. Một số định nghĩa về hệ thông tin địa lý....................................................3
2.1.2. Các thành phần của hệ thông tin địa lý .......................................................4
2.1.3. Biểu diễn dữ liệu địa lý..............................................................................7
2.1.4. Phân tích và xử lý dữ liệu không gian.......................................................14
2.1.5. Ứng dụng của hệ thông tin địa lý.............................................................19
2.2. Tổng quan về khai phá dữ liệu .....................................................................21
2.2.1. Khái niệm.................................................................................................21
2.2.2. Tiến trình khai phá dữ liệu........................................................................21
2.2.3. Các mô hình khai phá dữ liệu ...................................................................23
2.2.4. Các hƣớng tiếp cận và kỹ thuật sử dụng trong khai phá dữ liệu ................24
2.2.5. Các dạng dữ liệu có thể khai phá ..............................................................25
2.2.6. Các ứng dụng của khai phá dữ liệu...........................................................25
2.3. Khai phá dữ liệu không gian ........................................................................26
2.3.1. Các đặc trƣng của khai phá dữ liệu không gian.........................................26
2.3.2. Kho dữ liệu không gian và các chiều dữ liệu ............................................27
2.3.3. Một số ứng dụng của khai phá dữ liệu không gian....................................28
CHƢƠNG 3. PHÂN CỤM DỮ LIỆU KHÔNG GIAN ..............................................32
3.1. Khái quát về phân cụm dữ liệu.....................................................................32
3.1.1. Phân cụm phân hoạch..............................................................................32
3.1.2. Phân cụm phân cấp..................................................................................35
3.1.3. Phân cụm dựa trên mật độ .......................................................................36
3.1.4. Phân cụm dựa trên lƣới............................................................................49
3.2. Phân cụm dữ liệu không gian .......................................................................50
3.2.1. Các đặc trƣng của dữ liệu không gian.......................................................50
3.2.2. Các quan hệ/thuộc tính không gian của dữ liệu không gian ......................51
3.2.3. Các độ đo tƣơng đồng trong phân cụm dữ liệu không gian .......................53
CHƢƠNG 4. ỨNG DỤNG PHÂN CỤM KHÔNG GIAN TRONG BÀI TOÁN XÁC
ĐỊNH VỊ TRÍ TỐI ƢU LẮP ĐẶT MÁY ATM .........................................................62
4.1. Phân tích bài toán .........................................................................................62
4.1.1. Nguồn dữ liệu đầu vào và phạm vi bài toán..............................................62
4.1.2. Phƣơng pháp kỹ thuật giải quyết bài toán .................................................63
4.2. Xây dựng chương trình ứng dụng ................................................................64
4.2.1. Phân tích thiết kế hệ thống........................................................................64
4.2.2. Cài đặt chƣơng trình.................................................................................68
4.3. Thử nghiệm và đánh giá các thuật toán phân cụm .....................................71
CHƢƠNG 5. KẾT LUẬN .........................................................................................75
TÀI LIỆU THAM KHẢO..........................................................................................76
Khai phá dữ liệu không gian hay còn gọi là khai phá tri thức từ dữ liệu không
gian là một lĩnh vực có nhu cầu rất cao. Bởi lẽ dữ liệu đầu vào ở đây bao gồm một
khối lượng dữ liệu không gian lớn đã được thu thập từ nhiều ứng dụng khác
nhau, từ thiết bị viễn thám đến hệ thống thông tin địa lý, từ bản đồ số, từ các hệ thống
quản lý và đánh giá môi trường, …Việc phân tích và khai thác lượng thông tin khổng
lồ này ngày càng tạo ra các thách thức và khó khăn, đòi hỏi phải có các nghiên cứu sâu
hơn để tìm ra các kỹ thuật khai phá dữ liệu hiệu quả hơn.
Trong những năm gần đây, việc nghiên cứu về khai phá dữ liệu đã có xu hướng
chuyển từ cơ sở dữ liệu quan hệ và cơ sở dữ liệu giao dịch sang cơ sở dữ liệu không
gian. Sự thay đổi này không những giúp hiểu được dữ liệu không gian mà còn giúp
khám phá được mối quan hệ giữa dữ liệu không gian và phi không gian, các mô hình
dựa trên tri thức không gian, phương pháp tối ưu câu truy vấn, tổ chức dữ liệu trong cơ
sở dữ liệu không gian, ... Khai phá dữ liệu không gian được sử dụng nhiều trong các hệ
thống thông tin địa lý (GIS), viễn thám, khai phá dữ liệu ảnh, ảnh y học, rô bốt dẫn
đường, … Khám phá tri thức từ dữ liệu không gian có thể được thực hiện dưới nhiều
hình thức khác nhau như sử dụng các quy tắc đặc trưng và quyết định, trích rút và mô
tả các cấu trúc hay cụm nổi bật, kết hợp không gian, …
Các bài toán truyền thống của một hệ thông tin địa lý có thể trả lời các câu hỏi
kiểu như:
- Những con phố nào dẫn đến Nhà hát lớn Hà Nội ?
- Những căn nhà nào nằm trong vùng quy hoạch mở rộng phố?
Khai phá dữ liệu không gian có thể giúp trả lời cho các câu hỏi dạng:
- Xu hướng của các dòng chảy, các đứt gãy địa tầng ?
- Nên bố trí các trạm tiếp sóng điện thoại di động như thế nào?
- Những vị trí nào là tối ưu để đặt các máy ATM ?
Một trong những bài toán liên quan đến dữ liệu không gian, cụ thể là dữ liệu địa
lý có ý nghĩa thực tế cao là bài toán xác định vị trí tối ưu cho việc đặt các máy ATM
của các ngân hàng. Hiện nay, cùng với chủ trương xây dựng Chính phủ điện tử và thúc
đẩy giao dịch điện tử ở Việt Nam, việc thanh toán đang chuyển dần từ sử dụng tiền
mặt sang thanh toán qua tài khoản, đồng thời với nhu cầu sử dụng thẻ tín dụng ngày
càng tăng, các ngân hàng trong nước sử dụng tối đa mọi lợi thế để cạnh tranh, thu hút
khách hàng. Một trong các cách để cạnh tranh hiệu quả là thông qua việc thiết lập các
trạm ATM để khách hàng có thể tự thực hiện các giao dịch của mình một cách thuận
tiện.
Tính đến cuối năm 2010, số lượng trạm ATM đã đạt gần 8000 máy, số thẻ ATM
được phát hành là hơn 12 triệu thẻ bởi hơn 40 tổ chức ngân hàng. Tuy nhiên, việc phát
triển hệ thống các trạm ATM chưa được quy hoạch theo chiến lược bài bản, vị trí đặt
các trạm ATM vẫn còn nhiều bất cập như tình trạng thừa hay thiếu ATM ở một số
khu vực, do đó chưa khai thác được hết tiềm năng của hình thức giao dịch này.
Xuất phát từ nhu cầu thực tế đó, luận văn giới thiệu một số phương pháp phân
cụm dữ liệu trong khai phá cơ sở dữ liệu không gian được sử dụng hiện nay. Trên cơ
sở đó cài đặt thử nghiệm một ứng dụng sử dụng kỹ thuật phân cụm dữ liệu địa lý,
trong đó khai thác thông tin địa lý của các đối tượng địa lý có tầm ảnh hưởng quan
trọng đến vị trí đặt các máy ATM như: các siêu thị, trung tâm thương mại, khách sạn,
nhà hàng, khu đông dân cư, đường giao thông… để hỗ trợ giải quyết bài toán tìm vị trí
tối ưu đặt các máy ATM trong thành phố Hà Nội.
Luận văn được chia thành các chương mục sau:
- Chương 1: Mở đầu, giới thiệu bài toán
- Chương 2: Tổng quan về Hệ thông tin Địa lý (GIS) và khai phá dữ liệu không
gian.
- Chương 3: Một số phương pháp phân cụm dữ liệu không gian
- Chương 4: Xây dựng chương trình thử nghiệm ứng dụng phân cụm dữ liệu
không gian hỗ trợ tìm vị trí tối ưu đặt máy ATM trong khu vực nội thành Hà
Nội.
Chương 5: Kết luận, đánh giá
Tính lân cận
Ngoài các thuộc tính nội tại của các kiểu dữ liệu, các mối quan hệ giữa các đối
tượng với nhau, đặc biệt là các đối tượng lân cận nhau đóng vai trò rất quan trọng
trong phân tích dữ liệu không gian, như phát biểu của Nguyên lý thứ nhất của Tobler
trong Địa lý học:“Mọi thứ đều liên quan tới nhau, nhưng những thứ gần nhau sẽ liên
quan nhiều hơn những thứ xa nhau” [TOB79]. Chẳng hạn, những khu vực ven biển sẽ
mang nhiều nét tương đồng nhau về kiểu khí hậu, hay các tỉnh thuộc miền trung du sẽ
có đặc điểm về chất đất giống nhau.
Tính tương quan không gian
Khác với các kiểu dữ liệu truyền thống, dữ liệu không gian, đặc biệt là dữ liệu địa
lý thường có mối quan hệ mật thiết về mặt không gian. Chẳng hạn, một đối tượng dạng
vùng có thể hàm chứa (về mặt không gian) một số đối tượng khác. hay một số đối
tượng dạng điểm có mối quan hệ về mạng lưới với nhau, ví dụ các cột điện. Các mối
quan hệ này có thể gọi chung là quan hệ topology. Đặc tính này không có hay không
thể biểu diễn được trong các mô hình dữ liệu thông thường.
Những đặc điểm trên của dữ liệu không gian đòi hỏi một cách tiếp cận riêng sử
dụng trong phân tích dữ liệu không gian nói chung và phân cụm dữ liệu không gian
nói riêng. Ở mục tiếp theo, dựa trên các đặc điểm riêng của dữ liệu không gian này,
chúng ta sẽ chỉ ra các thuộc tính/quan hệ không gian cần sử dụng trong phân cụm dữ
liệu không gian.
3.2.2. Các quan hệ không gian của dữ liệu không gian
Phân cụm dữ liệu nói chung đòi hỏi phải xác định được thuộc tính dùng để phân
cụm và các độ đo khoảng cách (độ tương đồng) của các mẫu dữ liệu.Với các đặc
trưng riêng của mình như đã đề cập ở mục trên, dữ liệu không gian ngoài việc có thể
được phân cụm theo các thuộc tính phi không gian của nó, còn có thể được phân cụm
theo các thuộc tính không gian hay kết hợp sử dụng cả hai loại thuộc tính này trong
phân cụm. Các thuộc tính thể hiện quan hệ không gian giữa các đối tượng dữ liệu
không gian bao gồm:
- Quan hệ về khoảng cách
- Quan hệ về hướng
- Quan hệ về Topology
Mục 3.2.3 sẽ trình bày về độ đo khoảng cách dựa trên các mối quan hệ này.
Khoảng cách
Khái niệm khoảng cách dùng trong dữ liệu không gian đơn thuần là khoảng
cách hình học giữa hai đối tượng không gian. Giá trị khoảng cách này mang nhiều hay
Link Download bản DOC
Password giải nén nếu cần: ket-noi.com | Bấm trực tiếp vào Link tải, không dùng IDM để tải:

Bấm vào đây để đăng nhập và xem link!
Hình đại diện của thành viên
By rica17
#1031828 Link mới update, mời bạn xem lại bài đầu để tải
Kết nối đề xuất:
Learn Synonym
Advertisement