bachdiep1210

New Member

Download miễn phí Luận văn Tìm hiểu bài toán nhận dạng kí tự viết tay và phát triển ứng dụng





MỤC LỤC
 
Trang
Lời nói đầu 1
Nhận xét của giáo viên 2
Phần I: Tổng quan và cơ sở lý thuyết tiền xử lý ảnh kí tự 3
Chương I: Tổng quan 4
I. Giới thiệu bài toán 4
II. Cấu trúc nội dung của đồ án 5
Chương II: Cơ sở lý thuyết tiền xử lý ảnh kí tự 6
I. Lọc mịn ảnh 6
II. Nhị phân ảnh 6
III. Đánh nhãn thành phần liên thông 8
1. Tách liên thông bằng kỹ thuật đệ quy 8
2. Giải thuật cải tiến 9
IV. Chỉnh nghiêng 11
V. Chuẩn kích thước 12
VI. Lấp khoảng trống ảnh bằng phép đóng
morphology 12
1. Một số định nghĩa 12
2. Phép giãn 13
3. Phép co 13
4. Phép đóng 13
VII. Lấy đường biên và làm trơn đường biên 14
1. Phát hiện biên 14
2. Dò biên và mã hoá đường biên 14
3. Xác định hướng của điểm biên 15
4. Làm trơn đường biên 15
Chương III: Rút đặc trưng 18
I. Giới thiệu đặc trưng hướng 18
II. Chia ô 18
III. Đặc trưng hướng của đường biên 19
Phần II: Các mô hình nhận dạng 20
Chương I: Giới thiệu các mô hình phân lớp, nhận dạng 21
I. Khái quát tình hình nghiên cứu, ứng dụng lý thuyết
nhận dạng 21
II. Một số khái niệm về nhận dạng 22
1. Nhận dạng 22
2. Tập mẫu nhận dạng 22
3. Độ đồng dạng và dị dạng 22
4. Khoảng cách đối tượng 22
III. Một số thuật toán phân lớp 23
1. Xếp lớp khoảng cách cực tiểu 23
2. Thuật toán hàm thế 23
3. Phương pháp LDA
(Linear Discriminant Analysis) 24
Chương II: Phân lớp dựa trên mạng nơron lan truyền ngược 28
I. Giới thiệu 28
II. Hoạt động 29
1. Trạng thái ánh xạ 29
2. Trạng thái học 32
a. Phương pháp giảm gradient 32
b. Cập nhật trọng số theo phương pháp
giảm gradient 32
c. Quy tắc tính đạo hàm lỗi 33
3. Một vài kỹ thuật luyện mạng 36
a. Học theo lô 36
b. Ngăn chặn quá khớp 36
Phần III: Kết quả thử nghiệm 37
Chương I: Minh hoạ ứng dụng giải thuật tách thành phần liên
thông trong bài toán nhận dạng ảnh văn bản 38
I. Nhận dạng một văn bản 38
II. Minh hoạ chương trình 39
Chương II: Chương trình nhận dạng kí tự viết tay 40
I. Giới thiệu chương trình 40
II. Thực hiện chương trình 40
1. Tiền xử lý 41
2. Trích chọn đặc trưng 41
3. Bộ phân lớp 41
III. Minh hoạ một số kết quả 46
Chương III: Ứng dụng xử lý phiếu đăng kí môn học 52
I. Giới thiệu 52
II. Thực hiện chương trình 54
1. Định dạng và lấy thông tin từ biểu mẫu 54
a. Tìm dấu hiệu định vị biểu mẫu 54
b. Loại bỏ thông tin in trước bằng cách so
khớp với mặt nạ mẫu 56
c. Lấy thông tin vùng dữ liệu 56
2. Xác định véctơ đặc trưng của ký tự 56
3. Nhận dạng véc tơ đặc trưng 57
III. Minh hoạ một số kết quả 58
Chương IV: Đánh giá kết luận và hướng phát triển của
đề tài 62
I. Nhận xét chung 62
II. Hướng phát triển 62
III. Lời cám ơn 63
Phần IV: Phụ lục giới thiệu giao diện chương trình 64
A. Chương trình thử nghiệm nhận dạng kí tự viết tay
và phiếu đăng kí môn học 65
B. Chương trình thử nghiệm nhận dạng văn bản tiếng Việt
chữ in. 67
Tài liệu tham khảo:. 68
Mục lục:. 69
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 



Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

tập trung vào nghiên cứu các đối tượng mà có thể coi như tập hợp các đối tượng sơ cấp liên hệ với nhau bởi một số liên kết chuẩn.
Gần đây, một số nhà toán học có cố gắng xây dựng cấu trúc đại số cho đối tượng và thuật toán nhận dạng, những công trình này cho thấy triển vọng của một lý thuyết đại số về nhận dạng đang hình thành ngày càng rõ nét .
Do nhu cầu cấp bách phải giải quyết các vấn đề thực tiễn hoạt động sản xuất, nghiên cứu khoa học kỹ thuật hiện đại đặt ra, cùng với các kỹ thuật tin học mới phát triển (đặc biệt là máy tính điện tử ), nhiều chuyên gia thuộc các lĩnh vực hoạt động khác nhau cũng đã đề xuất và sử dụng các mô hình, thuật toán nhận dạng trên cơ sở thực nghiệm, theo cách tiếp cận heuristic.
Song song với việc xây dựng cơ sở lý thuyết nhận dạng, các hoạt động nghiên cứu ứng dụng lý thuyết nhận dạng cũng tiến hành mạnh mẽ và rộng khắp trên nhiều lĩnh vực khác nhau ở nhiều nước trên thế giới.
II. Một số khái niệm về nhận dạng:
1.Nhận dạng:
Một biểu diễn là giá đỡ (cái mang) thông tin, thường biểu diễn dưới dạng sau:
Mỗi xi biểu diễn kết quả của một phép đo. Tập hợp các biểu diễn xác định X được gọi là không gian biểu diễn. Ví dụ không gian vectơ.
Giải thích một biểu diễn nghĩa là cho một kết quả chẳng hạn một cái tên.
Giả sử: ta có tập hợp các tên là:
Không gian giải thích là một tập thoả các luật, thao tác nào đấy.
Một định danh là một ánh xạ của không gian biểu diễn vào không gian giải thích.
Mục đích nhận dạng là thực hiện ánh xạ này và tìm thuật toán để thực hiện trên toàn X. Một thuật toán như vậy gọi là toán tử nhận dạng.
2. Tập mẫu nhận dạng:
Dữ liệu cho bài toán nhận dạng thường được biểu diễn qua tập mẫu học T với
T={(xq, w)} là tập các cặp (dữ liệu - tên).
3. Độ đồng dạng và dị dạng:
Là hai chỉ số thường dùng để xây dựng trên quan hệ gần thứ tự trên các cặp đặc biệt khoảng cách giữa hai đối tượng là một chỉ số dị dạng thoả mãn 3 tiên đề:
- r(x, y)³ 0 , r(x, x)=0
- r(x, y)= r(y, x)
- r(x, z)£ r(x, y)+ r(y, z)
4. Khoảng cách đối tượng:
Các hàm đặc trưng quan sát có thể dẫn đến một quan hệ gần thứ tự giữa 1 đối tượng X và các khái niệm Ai, nghĩa là với mọi i, j có thể thiết lập một quan hệ : 
(X, Ai) £ (X, Aj)
Quan hệ này thường được thiết lập nhờ một khoảng cách đối tượng, ký hiệu: D(X, A).
Nếu muốn phân lớp hay định danh X có thể dùng thông tin này. Giả sử Ci là lớp phân hoạch tương ứng với khái niệm thay mặt Ai ; X được gán vào Ci nếu D(X, Ai) là nhỏ nhất.
III. Một số thuật toán phân lớp:
Có nhiều giải pháp phân lớp, trong thời gian qua em đã tìm hiểu và thử nghiệm một số giải pháp sau:
1. Xếp lớp khoảng cách cực tiểu:
Giả thiết là mỗi lớp mẫu được biểu diễn bằng một vectơ đơn (hay trung bình).
Trong đó Nj là số vectơ mẫu từ lớp wj, M là số lớp cần phân biệt và tổng được xác định từ các vectơ này, cách xác định lớp của một vectơ mẫu x chưa biết là chỉ định nó cho lớp đơn điệu gần nhất. Dùng khoảng cách Euclid để xác định độ gần sẽ giảm được tính toán.
Trong đó || a ||=(aTa )1/2 là dạng Euclid. Sau đó ta chỉ định x cho lớp wj nếu Dj(x) là khoảng cách ngắn nhất. Đó là khoảng cách ngắn nhất dùng trong biểu diễn. Ta dễ dàng nhìn thấy nó tương đương với việc đánh giá bằng hàm số
Và chỉ định x cho lớp wj, nếu dj(x) cho giá trị số lớn nhất.
2. Thuật toán hàm thế:
Phương pháp nhận dạng theo hàm thế được ứng dụng nhiều trong thực tiễn. Việc sử dụng hàm thế được được xuất phát từ nghĩa thế điện trong trường điện từ:
Trong không gian có điện tích q tại A thì xung quanh nó có điện trường theo mọi phía. Tại điểm M của không gian ta có thế gây ra bởi q là:
a : hằng số
q: độ lớn điện tích q
r: khoảng cách từ M tới q
Các dạng hàm thế thường dùng trong thuật toán nhận dạng:
Ở đây µ, C1, C2 là các hằng số cho trước. rµ(S, S’) là khoảng cách S và S’ (µ=0, 1, 2..)
Cách tính thế đối với mỗi lớp:
mj: số mẫu của Kj
St: mẫu thuộc Kj
Ta có luật quyết định:
Chú ý :
Việc tính thế đối với mỗi lớp, có thể bổ sung trọng số mẫu g(St) :
Nhận xét:
Nếu chọn r là hàm khoảng cách Euclid thì giải thuật hàm thế này gần giống với cách xếp lớp theo khoảng cách cực tiểu.
3. Phương pháp LDA (Linear Discriminant Analysis):
Phương pháp LDA cho trường hợp phân biệt 2 lớp, LDA sẽ tìm một phương chiếu mà phân biệt tốt nhất các mẫu thuộc hai lớp khác nhau trong tập mẫu. Giả sử ta có một tập gồm n mẫu học X bao gồm các vectơ cột d chiều:
Trong đó n1 mẫu thuộc về lớp C1 và nằm trong tập con X1, n2 mẫu thuộc về lớp C2 và nằm trong tập con X2.
Giả sử ta có một vectơ d chiều w, tích vô hướng y=wTx biểu diễn hình chiếu của vectơ x lên phương w. Ta sẽ tìm một phương chiếu w nhằm tối ưu hoá độ phân biệt giữa các mẫu thuộc 2 lớp C1 và C2. Điều này tương đương với việc giảm số chiều của vectơ đặc trưng xuống còn 1 chiều.
Ta gọi mi, i=1, 2 là trị trung bình của các mẫu tương ứng với 2 lớp C1 và C2.
Và tương ứng là trung bình của các mẫu được chiếu lên phương w:
Trong đó y là hình chiếu của x lên w. Yi là tập các hình chiếu của các x Ỵ Xi lên w.
Ta có thể xem là một độ đo cho tính phân biệt giữa hai tập Y1 và Y2 . Tuy nhiên để có được sự phân biệt tốt giữa hai tập khi chiếu lên phương w, ta cần có độ sai khác giữa hai trị trung bình này khá lớn hơn so với độ lệch chuẩn nội tại của mỗi tập ( có thể xem như độ rộng của đám mây các mẫu).
Thay vì sử dụng phương sai của mỗi tập ta sẽ sử dụng một độ đo khác, gọi là độ rải (scatter) cho các hình chiếu của các mẫu thuộc lớp Ci như sau:
Phương pháp LDA sẽ tìm giá trị w để cực đại hoá hàm tiêu chuẩn sau đây:
Để thấy J(w) là một hàm theo w ta định nghĩa các ma trận SB và Sw như sau:
SW được gọi là ma trận rải nội lớp (within-class scatter matrix)
SB được gọi là ma trận rải liên hợp (between-class scatter matrix)
Ta có:
=
=
= wTSWw
Nên
Tương tự ta cũng có:
= wTSBw.
Do đó:
J(w) = .
Để xác định w sao cho J(w) cực đại ta cho đạo hàm riêng J(w) theo w bằng 0 kết quả ta sẽ được:
SB w = lSW w
Với l là trị riêng, giải bài toán tìm trị riêng ta sẽ có:
Đây là kết quả tìm được của phương pháp LDA đối với trường hợp chỉ có 2 lớp.
Sau khi đã tìm được w, mỗi vectơ x cần nhận dạng sẽ được xử lý như sau: lấy x trừ đi trung bình của mẫu học rồi chiếu lên phương w ta được một giá trị vô hướng, tính khoảng cách từ giá trị vô hướng này trên của mỗi lớp này chia cho độ lệch chuẩn ta được một độ đo khoảng cách từ x đến các cụm ứng với mỗi lớp.
i=1..2
x sẽ được gán vào lớp ứng với cụm gần nhất.
Để phân biệt được n lớp ta xây dựng n bộ phân loại 2 lớp theo phương pháp nêu trên. Mỗi bộ phân loại sẽ phân biệt một lớp với n-1 lớp còn lại. Nếu một vectơ đầu vào được xếp vào cả hai lớp thì ta sẽ sử dụng khoảng cách di nêu trên để quyết định nó thuộc vào lớp nào. Nếu một vectơ không được xếp vào lớp nào thì coi như không nhận dạng được.
Phần ti
 

thuymv

New Member
CHào bạn, mình đang tìm tài liệu này, nhưng không download được, mong bạn cho mình xin.
Thank bạn nhiều.
Bạn gửi vào mail giúp mình với!
Email: [email protected]
 

tctuvan

New Member
Trích dẫn từ thuymv:
CHào bạn, mình đang tìm tài liệu này, nhưng không download được, mong bạn cho mình xin.
Thank bạn nhiều.
Bạn gửi vào mail giúp mình với!
Email: [email protected]



Các file đính kèm theo tài liệu này:
  • CUONGTN.DOC
  • BCTN.PPT
  • chương trình.rar
Link download cho bạn

Nhớ thank cho tác giả nhé
 

Các chủ đề có liên quan khác

Top