Verrall

New Member
Download Luận văn Tìm hiểu phương pháp phân tích bằng bên trong tài liệu ảnh

Download miễn phí Luận văn Tìm hiểu phương pháp phân tích bằng bên trong tài liệu ảnh





MỤC LỤC
Trang phụ bìa
Lời cảm ơn
MỤC LỤC ------------------------------------------------------------------------------- i
THUẬT NGỮ TIẾNG ANH:--------------------------------------------------------- iii
DANH MU ̣ C CA ́ C HI ̀NH VE ̃ -------------------------------------------------------- iv
CHưƠNG I: MỞ ĐẦU ---------------------------------------------------------------- 1
1.1. Cơ sở nghiên cứu và mục đích của luận văn ---------------------------- 3
1.2. Tổ chức của luận văn: -------------------------------------------------------- 4
CHưƠNG II: TỔNG QUAN VỀ HỆ PHÂN TÍCH TÀI LIỆU ẢNH --------- 5
2.1. Tài liệu ảnh --------------------------------------------------------------------- 5
2.2. Hệ phân tích trang tài liệu -------------------------------------------------- 5
2.3. Thu thập dữ liệu ảnh --------------------------------------------------------- 6
2.4. Tiền xử lý điểm ảnh ----------------------------------------------------------- 9
2.4.1. Xử lý nhị phân ---------------------------------------------------------- 10
2.4.2. Giảm nhiễu--------------------------------------------------------------- 11
2.4.3. Phân đoạn ảnh ----------------------------------------------------------- 12
2.4.4. Làm mảnh và xác định vùng ----------------------------------------- 12
2.4.5. Mã hóa CC và véctơ hóa ---------------------------------------------- 13
2.5. Phân ti ́ ch đă ̣ c trưng cu ̉ a ta ̀ i liê ̣ u a ̉ nh ------------------------------------- 15
2.6. Phân ti ́ ch đô ́ i tươ ̣ ng văn ba ̉ n trong ta ̀ i liê ̣ u ----------------------------- 15
2.6.1. Xác định góc nghiêng của văn bản ---------------------------------- 16
2.6.2. Phân ti ́ ch bô ́ cu ̣ c cu ̉ a trang ta ̀ i liê ̣ u a ̉ nh ------------------------------ 18
2.7. Nhận dạng ký tự quang học (OCR) --------------------------------------- 19
2.7.1. Thuâ ̣ t toa ́ n OCR ----------------------------------------------------- 20
2.7.1.1. Trích chọn đặc trưng --------------------------------------- 20
2.7.1.2. Phân loại ------------------------------------------------------ 21
2.7.2. Nhận dạng ký tự dựa trên ngữ cảnh ------------------------------ 21
2.8. Phân tích các đối tượng ảnh trong tài liệu ------------------------------ 22
CHưƠNG 3: THUẬT TOÁN TÁCH VĂN BẢN - ẢNH TỪ TRANG TÀI
LIỆU ẢNH ------------------------------------------------------------------------------ 24
3.1. Tô ̉ng quan vê ̀ phân ta ́ ch văn ba ̉ n – ảnh --------------------------------- 24
3.2. Những đặc trưng chung của một tệp tài liệu ảnh --------------------- 27
3.3. Thuật toán phân tách văn bản - ảnh -------------------------------------- 30
3.3.1. Xoá bỏ các đối tượng tuyến tính --------------------------------- 31
3.3.2. Phân tích các thành phần liên thông của nét bút --------------- 32
3.3.3. Kết hợp các nét ký tự tạo thành các chuỗi văn bản ------------ 34
3.3.4. Thực hiện các phép toán hình thái ------------------------------- 35
3.3.5. Phân tích các thành phần liên thông mới ----------------------- 35
3.3.6. Biểu diễn cấu trúc thông tin của các chuỗi văn bản ----------- 36
CHưƠNG IV: PHưƠNG PHÁP PHÂN TÍCH BẢNG T-RECS TRONG
TRANG TA ̀ I LIÊ ̣ U A ̉ NH ------------------------------------------------------------ 39
4.1. Giới thiệu -------------------------------------------------------------------- 39
4.2. Thuật toán phân đoạn khởi tạo ---------------------------------------- 41
4.2.1. Trường hợp thuật toán nhận dạng sai cột ----------------------- 42
4.2.2. Cải tiến các bước của thuật toán phân đoạn khởi tạo T - Recs++ 44
4.2.3. Những ưu điểm của thuật toán ----------------------------------- 46
4.2.4. Những mặt hạn chế của thuật toán khởi tạo -------------------- 47
4.3. Các bước xử lý khối sau khi phân đoạn ------------------------------ 48
4.3.1. Trộn các khối phân đoạn sai -------------------------------------- 48
4.3.2. Phân tách các cột bị trộn vào một khối -------------------------- 49
4.3.3. Nhóm các từ bị phân tách ----------------------------------------- 52
4.4. Phân tích khối -------------------------------------------------------------- 53
4.5. Xác định cấu trúc các cột, hàng ---------------------------------------- 54
CHưƠNG 5 CHưƠNG TRI ̀NH THư ̉ NGHIỆM VA ̀ MINH HO ̣ A THUÂ ̣ T
TOÁN T-RECS++ --------------------------------------------------------------------- 56
5.1. Mô tả chương trình ------------------------------------------------------- 56
5.2. Mô ̣ t sô ́ kê ́ t qua ̉ ------------------------------------------------------------- 58
KÊ ́ T LUÂ ̣ N VA ̀ ĐÊ ̀ XUÂ ́ T ---------------------------------------------------------- 61



Để tải bản DOC Đầy Đủ xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung:

ích của việc nhận dạng
ảnh là lấy ra được các thông tin mang ý nghĩa xuất hiện bên trong nội dung
của ảnh.
Phân tích tài liệu ảnh càng trở nên quan trọng hơn khi mà tài liệu hầu
như được tạo ra và xử lý bằng máy tính thì việc Những người làm việc trên
máy tính liên quan đến việc truyền tải và chuyển đổi tệp dữ liệu nhận thấy
một điều rằng các tệp dữ liệu thường ít khi tương thích với nhau. Bởi vì có sự
khác nhau về ngôn ngữ, đặc điểm của hệ thống, và sự thay đổi của các phiên
bản CAD và các gói định dạng văn bản, do đó các tệp dữ liệu của những hệ
thống khác nhau thường không tương thích với nhau. Một hệ thống xử lý tài
liệu có thể chuyển đổi một định dạng tài liệu ảnh kỹ thuật này sang định dạng
khác, nhưng mục đích của hệ thống cũng phải có khả năng chuyển đổi được
những tài liệu ảnh vẽ bằng tay. Điều này cũng giống như việc nhận dạng chữ
viết tay và văn bản trong OCR. Khi máy tính có khả năng phân tích được
những hình vẽ tay phức tạp một cách nhanh chóng và chính xác thì vấn đề
nhận dạng ảnh sẽ được giải quyết, tuy nhiên để đến khi đạt được điều đó thì
vẫn còn nhiều cơ hội và thách thức đối với lĩnh vực nghiên cứu này.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
23
Trong các bước xử lý đối tượng ảnh có những bước xứ lý chung cũng
giống như đối với nhận dạng văn bản. Các phương pháp tiền xử lý, phân
đoạn, và trích chọn đặc trưng được mô tả trước đây sẽ được thực hiện trước
tiên. Thuật toán phân đoạn khởi tạo thường để áp dụng cho tài liệu có lẫn đối
tượng văn bản và ảnh nhằm tách riêng thành hai phần văn bản và ảnh.
Hầu hết các hệ thống OCR thương mại có khả năng nhận dạng các
đường biên dài và đường kẻ trong bảng khác so với cách nhận dạng ký tự, do
đó việc cố gắng nhận dạng các đối tượng đó như là ký tự không xảy ra. Hệ
phân tích ảnh cho các bản vẽ kỹ thuật phải phân biệt được đâu là văn bản và
đâu là ảnh. Thông thường các hệ thống đều có khả năng nhận dạng tốt các đối
tượng ảnh ngoại trừ một số trường hợp đặc biệt chẳng hạn khi ký tự nối liền
với các hình vẽ gây ra nhầm lẫn đây là một đối tượng ảnh; hay có những biểu
tượng qua nhỏ và được coi như là một ký tự. Tách đoạn và phân tích ảnh màu
với nhiều lớp của bản đồ, nhận dạng đối tượng ảnh ba chiều trong ảnh kỹ
thuật, và những bản vẽ kiến trúc 3 – D là những thí dụ cho thấy còn nhiều
thách thức đối với những người làm nghiên cứu trong lĩnh vực nhận dạng. Rõ
ràng rằng rất nhiều miền ứng dụng phụ thuộc tri thức cũng được áp dụng vào
trong tất cả những hệ thống nhận dạng, phân tích ảnh.
Hệ phân tích tài liệu ảnh và các thành phần chung đã được mô tả tổng
quan trong chương này . Trong đó đã trình bày các bước chính trong quá trình
xử lý ảnh từ khi thu nhận ảnh đến khi trích ra được nhữn g thông tin người
dùng mong muốn . Trong chương 3 sẽ mô tả chi tiết những thuật toán nhận
dạng đối tượng ảnh dựa vào thành phần liên thông trong tài liệu có lẫn ảnh và
văn bản.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
24
CHƢƠNG 3
THUẬT TOÁN TÁCH VĂN BẢN - ẢNH
TỪ TRANG TÀI LIỆU ẢNH
3.1. Tổng quan về phân tách văn bản – ảnh
Như chúng ta đã biết một trang tài liệu ảnh thường chứa đựng các
thông tin hỗn hợp như các đoạn văn bản và ảnh, chẳng hạn như các trang báo
được quét, bản đồ hay các tài liệu được quét từ máy quét. Do đó để lấy ra
được phần chứa đựng thông tin và phần chứa ảnh riêng rẽ và chính xác cần có
các kỹ thuật xử lý phức tạp. Các thuật toán tách văn bản - ảnh giúp chúng ta
lấy ra được các thông tin như vậy. Một thuật toán tách văn bản - ảnh sẽ phân
tách tài liệu thành hai lớp: lớp chứa văn bản và lớp chứa các đối tượng ảnh.
Chương này sẽ trình khái quát về các phương pháp tách văn bản - ảnh và trình
bày một thuật toán phân tách văn bản - ảnh hiệu quả. Tư tưởng cơ bản của
thuật toán là trước tiên đi xác định các vùng không phải là văn bản và lưu giữ
thông tin của vùng này vào lớp các đối tượng ảnh. Các vùng còn lại sẽ thuộc
lớp văn bản. Cách làm như vậy sẽ hiệu quả hơn là trước tiên đi xác định trực
tiếp các vùng văn bản.
Trong một hệ thống nhận dạng tài liệu, một tài liệu thường chứa nhiều
loại biểu tượng (các kiểu ký tự, ảnh) thông tin khác nhau. Chính vì có sự khác
nhau lớn giữa các đặc trưng của từng loại biểu tượng mà chúng sẽ được xử lý
theo từng kỹ thuật khác nhau. Hơn thế nữa, những yêu cầu cao đối với các kỹ
thuật xử lý ảnh như các phép véc tơ hóa đối tượng ảnh, nhận dạng các loại ký
tự Tiếng Anh, ký tự số, ký tự Trung Hoa đòi hỏi phải được nghiên cứu dựa
theo những cách thức khác nhau. Chính vì những lý do đó tách các thành
phần văn bản và ảnh từ những tệp tài liệu ảnh là một yêu cầu cần thiết đối với
máy tính.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
25
Có rất nhiều phương pháp tách văn bản và ảnh từ trang tài liệu ảnh
được công bố trước đây. Phương pháp được đưa ra trong tài liệu [3] dựa trên
khái niệm, đối tượng văn bản bao giờ cũng có kích thước nhỏ hơn đối tượng
ảnh, quá trình tách văn bản và ảnh được thực hiện sau khi đã làm mảnh các
đối tượng. Phương pháp trên khá đơn giản nhưng nó sẽ không hiệu quả khi
một ký tự tiếp xúc với một ký tự khác hay một đối tượng ảnh khác. Yamada
[6] giới thiệu một phương pháp tách các đối tượng từ bản đồ địa hình, trong
đó phương pháp có thể tách ra các đối tượng là đường đi và các toà nhà, phần
còn lại của bản đồ là các đối tượng văn bản. Một trong những phương pháp
được biết đến nhiều nhất là của Wong, Casey và Wahl [7], được điều chỉnh và
cải tiến trong [2] Tuy nhiên, một số chứng minh cho thấy phương pháp trên
chỉ hoạt động hiệu quả trên các tệp tài liệu chứa nhiều văn bản, ngược lại trên
các tài liệu ảnh chứa nhiều các đối tượng ảnh thì phương pháp không hiệu
quả. Một vài phương pháp dựa trên các khoảng trắng [15]. Phương pháp được
biết đến là hoạt động hiệu quả nhất trong kỹ thuật tách văn bản - ảnh được
đưa ra trong [4]. Phương pháp này dựa trên việc phân tích các thành phần liên
thông và dựa vào phép biến đổi Hough để nhóm các thành phần trong cùng
một chuỗi ký tự và tách chúng ra khỏi các đối tư...
 

Các chủ đề có liên quan khác

Top