moon_nontop_9x

New Member

Download miễn phí Đề tài Phương pháp mã hóa video theo đối tượng ứng dụng trong hệ thống thông tin video nén





MỤC LỤC
 
Chương 1 : Tổng quan về mã hóa video
1.1 Mục đích nghiên cứu video nén theo hướng đối tượng .6
1.2 Tổng quan về các chuẩn nén .6
1.3 Kĩ thuật mã hóa video nén theo hướng đối tượng MPEG-4 và ưu điểm .7
 
Chương 2 : Công nghệ mã hóa video trong MPEG-4 12
2.1 Mã hoá hình dạng ngoài (Shape Coder ). .15
2.1.1 Biến đổi Cosin rời rạc ( DCT ) . .16
2.1.2 Lượng tử hoá . . .18
2.1.3 Mã hóa . 20
2.2 Dự đoán và tổng hợp động . 21
2.2.1 Ước lượng chuyển động . . . .21
2.2.2 Kỹ thuật đệm . .22
2.2.3 Kỹ thuật chuyển động cơ bản . . . .22
2.2.3.1 Kỹ thuật thay đổi từng khối thích ứng với cấu trúc đa cạnh của VOP. . .22
2.2.3.2 ước lượng chuyển động của điểm ảnh . . . .23
2.2.3.3 chế độ INTRA / INTER . . . . 24
2.2.3.4 Tìm kiếm nửa điểm ảnh . . . . . 25
2.2.3.5 Dự đoán MV . . . .26
2.2.3.6 Chế độ vector chuyển động không giới hạn . . .26
2.2.3.7 Chế độ nâng cao chất lượng dự đoán . . . . 27
2.3 Mã hóa cấu trúc . . .27
2.4 Giải mã MPEG-4 VOP . . .28
2.5 Mã hóa theo lớp video . . .28
2.6 Đánh giá hiệu quả . .29
2.7 Điều khiển tốc độ .31
 
Chương 3 : Ứng dụng . 37
3.1 IP TV . . . 37
3.2Video yêu cầu . . . .39
3.3 Mobile TV . . .40
3.4 Truyền hình hội nghị . . . .41
 



Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

mã hoá và giải mã video MPEG-4
Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
- Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình scene.
- Bộ đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian.
- Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động.
Hình 2.2. Sơ đồ cấu trúc giải mã video MPEG-4
Hình 2 là một ví dụ về tổng hợp khung hình video sử dụng trong MPEG-4. Nhiều đối tượng được tách ra khỏi video đầu vào. Mỗi đối tượng video sau đó được mã hóa bởi bộ mã hoá đối tượng video VO (Video Object) và sau đó được truyền đi trên mạng. Tại vị trí thu, những đối tượng này được giải mã riêng rẽ nhờ bộ giải mã riêng VO và gửi tới bộ compositor. Người sử dụng có thể tương tác với thiết bị để cấu trúc lại khung hình gốc, hay để xử lý các đối tượng tạo ra một khung hình khác. Ngoài ra, người sử dụng có thể download các đối tượng khác từ các thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN, WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong khuôn hình gốc. Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngôn ngữ mô tả khung hình riêng, được gọi là định dạng nhị phân cho khung hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào các đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt động của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng lên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác. Trong MPEG-4 tất cả các đối tượng có thể được mã hoá với sơ đồ mã hoá riêng của nó - video được mã hoá theo kiểu video, text được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ - thay vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động. Do các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình.
2.1 Mã hoá hình dạng ngoài (Shape Coder )
-Khung hình : là thành phần mã hoá chính. Thường thường chúng ta có thể phân biệt sự thay đổi về độ sáng của ảnh tốt hơn so với sự thay đổi về màu. Do đó trước hết các sơ đồ nén Mpeg sẽ tiến hành chia khung hình thành các thành phần độ sáng Y và thành phần độ màu Cb, Cr (một thành phần về độ sáng và hai thành phần về độ màu). Một khung hình sẽ gồm có 3 ma trận ứng với các thành phần về độ sáng (Y) và hai thành phần về độ màu Cb và Cr.
Ma trận Y có số hàng và cột bằng nhau (ma trận vuông). Ma trận Cb và Cr có số hàng và cột bằng nửa ma trận Y. Hình 3 cho thấy quan hệ và vị trí của Y và các thành phần Cb và Cr. Lưu ý rằng cứ 4 giá trị Y lại có 2 giá trị kết hợp một của Cb và một của Cr (Vị trí của giá trị Cb và Cr là tương đương). Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệu Video và những thông tin khó mã hoá nhưng không quan trọng cho sự cảm thụ của mắt người. Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các khung hình trong một cảnh Video dường như có liên quan mật thiết với nhau theo thời gian: Mỗi khung hình tại một thời điểm nhất định sẽ có nhiều khả năng giống với các khung hình đứng ngay phía trước và ngay phía sau nó. Do vậy ở phía bộ mã hoá, chỉ cần gửi những khung hình có thay đổi so với những khung hình trước, sau đó dùng phương pháp nén về không gian để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác này. Trong MPEG-4 là yếu tố ít có sự thay đổi nhất, các bước mã hóa khung hình cũng tương tư như mã hóa ảnh. Thuật toán mã hoá biến đổi gồm các bước:
+Biến đổi Cosine rời rạc (DCT). +Lượng tử hoá.
+Mã hóa
2.1.1 Biến đổi Cosin rời rạc ( DCT )
Sơ đồ thuật toán nén và giải nén được mô tả dưới đây:
Hình 2.3 sơ đồ thuật toán nén ảnh (a)
Quá trình giải nén sẽ được làm ngược lại, người ta giải mã từng phần ảnh nén tương ứngvới phương pháp nén đã sử dụng trong phần nén nhờ các thông tin liên quan ghi trong phần header của file nén. Kết quả thu được là hệ số đã lượng tử. Các hệ số này được khôi phục về giá trị trước khi lượng tử hóa bằng bộ tương tự hóa. Tiếp đó đem biến đổi Cosin ngược ta được ảnh ban đầu với độ trung thực nhất định.
Bảng mã và bảng lượng tử trong sơ đồ giải nén được dựng lên nhờ những thông tin ghi trong phần cấu trúc đầu tệp ( Header) của tệp ảnh nén. Quá trình nén chịu trách nhiệm tạo ra và ghi lại những thông tin này. Phần tiếp theo sẽ phân tích tác dụng của từng khối trong sơ đồ 2.3
+ Phần khối
Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có giá trị từ 0 đến 255. Việc phân khối này sẽ làm giảm được một phần thời gian tính toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra.
Hình 2.4 sơ đồ thuật toán nén ảnh (b)
Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi. 2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi khối ảnh có kích thước 8 x 8. Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trong miền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miền tần số.
+ Biến đổi
Biến đổi là một trong những công đoạn lớn trong các phương pháp nén sử dụng phép biến đổi. Nhiệm vụ của công đoạn biến đổi là tập trung năng lượng vào một số ít các hệ số biến đổi. Công thức biến đổi cho mỗi khối là:

Thuật toán biến đổi DCT cho mỗi khối trong trường hợp này sẽ bao gồm 16 phép biến đổi DCT. Đầu tiên, người ta biến đổi nhanh Cosin một chiều cho các dãy điểm ảnh trên mỗi hàng. Lần lượt thực hiện cho 8 hàng. Sau đó đem biến đổi nhanh Cosin một chiều theo từng cột của ma trận vừa thu được sau 8 phép biến đổi trên. Cũng lần lượt thực hiện cho 8 cột. Ma trận cuối cùng sẽ là ma trận hệ số biến đổi của khối tương ứng.Trong sơ đồ giải nén ta phải dùng phép biến đổi Cosin ngược. Công thức biến đổi ngượccho khối 8x8:

2.1.2 Lượng tử hoá
Khối lượng tử hóa trong sơ đồ nén đóng vai trò quan trong và quyết định tỉ lệ nén củachuẩn nén. Đầu vào của khối lượng tử hóa là các ma trận hệ số biến đổi Cosin của các khối điểm ảnh.Sau khi thực hiện biến đối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên một bảng lượng tử gồm 64 phần tử Q(u,v) với 0≤u, v≤7. Bảng này được định nghĩa bởi từng ứng công cụ thể. Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được gọi là các bước nhảy cho các hệ số DCT. Quá trình lượng tử được coi như...
 

Duranjaya

New Member

Download miễn phí Đề tài Phương pháp mã hóa video theo đối tượng ứng dụng trong hệ thống thông tin video nén





MỤC LỤC
 
Chương 1 : Tổng quan về mã hóa video
1.1 Mục đích nghiên cứu video nén theo hướng đối tượng .6
1.2 Tổng quan về các chuẩn nén .6
1.3 Kĩ thuật mã hóa video nén theo hướng đối tượng MPEG-4 và ưu điểm .7
 
Chương 2 : Công nghệ mã hóa video trong MPEG-4 12
2.1 Mã hoá hình dạng ngoài (Shape Coder ). .15
2.1.1 Biến đổi Cosin rời rạc ( DCT ) . .16
2.1.2 Lượng tử hoá . . .18
2.1.3 Mã hóa . 20
2.2 Dự đoán và tổng hợp động . 21
2.2.1 Ước lượng chuyển động . . . .21
2.2.2 Kỹ thuật đệm . .22
2.2.3 Kỹ thuật chuyển động cơ bản . . . .22
2.2.3.1 Kỹ thuật thay đổi từng khối thích ứng với cấu trúc đa cạnh của VOP. . .22
2.2.3.2 ước lượng chuyển động của điểm ảnh . . . .23
2.2.3.3 chế độ INTRA / INTER . . . . 24
2.2.3.4 Tìm kiếm nửa điểm ảnh . . . . . 25
2.2.3.5 Dự đoán MV . . . .26
2.2.3.6 Chế độ vector chuyển động không giới hạn . . .26
2.2.3.7 Chế độ nâng cao chất lượng dự đoán . . . . 27
2.3 Mã hóa cấu trúc . . .27
2.4 Giải mã MPEG-4 VOP . . .28
2.5 Mã hóa theo lớp video . . .28
2.6 Đánh giá hiệu quả . .29
2.7 Điều khiển tốc độ .31
 
Chương 3 : Ứng dụng . 37
3.1 IP TV . . . 37
3.2Video yêu cầu . . . .39
3.3 Mobile TV . . .40
3.4 Truyền hình hội nghị . . . .41
 


http://cloud.liketly.com/flash/edoc/jh2i1fkjb33wa7b577g9lou48iyvfkz6-swf-2014-01-18-de_tai_phuong_phap_ma_hoa_video_theo_doi_tuong_ung.iAw2vyS1AQ.swf /tai-lieu/de-tai-ung-dung-tren-liketly-55175/
Để tải bản Đầy Đủ của tài liệu, xin Trả lời bài viết này, Mods sẽ gửi Link download cho bạn sớm nhất qua hòm tin nhắn.
Ai cần download tài liệu gì mà không tìm thấy ở đây, thì đăng yêu cầu down tại đây nhé:
Nhận download tài liệu miễn phí

Tóm tắt nội dung tài liệu:

mã hoá và giải mã video MPEG-4
Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:
- Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình scene.
- Bộ đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian.
- Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động.
Hình 2.2. Sơ đồ cấu trúc giải mã video MPEG-4
Hình 2 là một ví dụ về tổng hợp khung hình video sử dụng trong MPEG-4. Nhiều đối tượng được tách ra khỏi video đầu vào. Mỗi đối tượng video sau đó được mã hóa bởi bộ mã hoá đối tượng video VO (Video Object) và sau đó được truyền đi trên mạng. Tại vị trí thu, những đối tượng này được giải mã riêng rẽ nhờ bộ giải mã riêng VO và gửi tới bộ compositor. Người sử dụng có thể tương tác với thiết bị để cấu trúc lại khung hình gốc, hay để xử lý các đối tượng tạo ra một khung hình khác. Ngoài ra, người sử dụng có thể download các đối tượng khác từ các thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN, WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong khuôn hình gốc. Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngôn ngữ mô tả khung hình riêng, được gọi là định dạng nhị phân cho khung hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào các đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt động của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng lên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác. Trong MPEG-4 tất cả các đối tượng có thể được mã hoá với sơ đồ mã hoá riêng của nó - video được mã hoá theo kiểu video, text được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ - thay vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động. Do các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình.
2.1 Mã hoá hình dạng ngoài (Shape Coder )
-Khung hình : là thành phần mã hoá chính. Thường thường chúng ta có thể phân biệt sự thay đổi về độ sáng của ảnh tốt hơn so với sự thay đổi về màu. Do đó trước hết các sơ đồ nén Mpeg sẽ tiến hành chia khung hình thành các thành phần độ sáng Y và thành phần độ màu Cb, Cr (một thành phần về độ sáng và hai thành phần về độ màu). Một khung hình sẽ gồm có 3 ma trận ứng với các thành phần về độ sáng (Y) và hai thành phần về độ màu Cb và Cr.
Ma trận Y có số hàng và cột bằng nhau (ma trận vuông). Ma trận Cb và Cr có số hàng và cột bằng nửa ma trận Y. Hình 3 cho thấy quan hệ và vị trí của Y và các thành phần Cb và Cr. Lưu ý rằng cứ 4 giá trị Y lại có 2 giá trị kết hợp một của Cb và một của Cr (Vị trí của giá trị Cb và Cr là tương đương). Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệu Video và những thông tin khó mã hoá nhưng không quan trọng cho sự cảm thụ của mắt người. Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các khung hình trong một cảnh Video dường như có liên quan mật thiết với nhau theo thời gian: Mỗi khung hình tại một thời điểm nhất định sẽ có nhiều khả năng giống với các khung hình đứng ngay phía trước và ngay phía sau nó. Do vậy ở phía bộ mã hoá, chỉ cần gửi những khung hình có thay đổi so với những khung hình trước, sau đó dùng phương pháp nén về không gian để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác này. Trong MPEG-4 là yếu tố ít có sự thay đổi nhất, các bước mã hóa khung hình cũng tương tư như mã hóa ảnh. Thuật toán mã hoá biến đổi gồm các bước:
+Biến đổi Cosine rời rạc (DCT). +Lượng tử hoá.
+Mã hóa
2.1.1 Biến đổi Cosin rời rạc ( DCT )
Sơ đồ thuật toán nén và giải nén được mô tả dưới đây:
Hình 2.3 sơ đồ thuật toán nén ảnh (a)
Quá trình giải nén sẽ được làm ngược lại, người ta giải mã từng phần ảnh nén tương ứngvới phương pháp nén đã sử dụng trong phần nén nhờ các thông tin liên quan ghi trong phần header của file nén. Kết quả thu được là hệ số đã lượng tử. Các hệ số này được khôi phục về giá trị trước khi lượng tử hóa bằng bộ tương tự hóa. Tiếp đó đem biến đổi Cosin ngược ta được ảnh ban đầu với độ trung thực nhất định.
Bảng mã và bảng lượng tử trong sơ đồ giải nén được dựng lên nhờ những thông tin ghi trong phần cấu trúc đầu tệp ( Header) của tệp ảnh nén. Quá trình nén chịu trách nhiệm tạo ra và ghi lại những thông tin này. Phần tiếp theo sẽ phân tích tác dụng của từng khối trong sơ đồ 2.3
+ Phần khối
Vì ảnh gốc có kích thước rất lớn cho nên trước khi đưa vào biến đổi DCT, ảnh được phân chia thành các khối vuông, mỗi khối này thường có kích thước 8 x 8 pixel và biểu diễn các mức xám của 64 điểm ảnh, các mức xám này là các số nguyên dương có giá trị từ 0 đến 255. Việc phân khối này sẽ làm giảm được một phần thời gian tính toán các hệ số chung, mặt khác biến đổi cosin đối với các khối nhỏ sẽ làm tăng độ chính xác khi tính toán với dấu phẩy tĩnh, giảm thiểu sai số do làm tròn sinh ra.
Hình 2.4 sơ đồ thuật toán nén ảnh (b)
Biến đổi DCT là một công đoạn chính trong các phương pháp nén sử dụng biến đổi. 2 công thức ở đây minh hoạ cho 2 phép biến đổi DCT thuận nghịch đối với mỗi khối ảnh có kích thước 8 x 8. Giá trị x(n1, n2) biểu diễn các mức xám của ảnh trong miền không gian, X(k1, k2) là các hệ số sau biến đổi DCT trong miền tần số.
+ Biến đổi
Biến đổi là một trong những công đoạn lớn trong các phương pháp nén sử dụng phép biến đổi. Nhiệm vụ của công đoạn biến đổi là tập trung năng lượng vào một số ít các hệ số biến đổi. Công thức biến đổi cho mỗi khối là:

Thuật toán biến đổi DCT cho mỗi khối trong trường hợp này sẽ bao gồm 16 phép biến đổi DCT. Đầu tiên, người ta biến đổi nhanh Cosin một chiều cho các dãy điểm ảnh trên mỗi hàng. Lần lượt thực hiện cho 8 hàng. Sau đó đem biến đổi nhanh Cosin một chiều theo từng cột của ma trận vừa thu được sau 8 phép biến đổi trên. Cũng lần lượt thực hiện cho 8 cột. Ma trận cuối cùng sẽ là ma trận hệ số biến đổi của khối tương ứng.Trong sơ đồ giải nén ta phải dùng phép biến đổi Cosin ngược. Công thức biến đổi ngượccho khối 8x8:

2.1.2 Lượng tử hoá
Khối lượng tử hóa trong sơ đồ nén đóng vai trò quan trong và quyết định tỉ lệ nén củachuẩn nén. Đầu vào của khối lượng tử hóa là các ma trận hệ số biến đổi Cosin của các khối điểm ảnh.Sau khi thực hiện biến đối DCT, 64 hệ số sẽ được lượng tử hoá dựa trên một bảng lượng tử gồm 64 phần tử Q(u,v) với 0≤u, v≤7. Bảng này được định nghĩa bởi từng ứng công cụ thể. Các phần tử trong bảng lượng tử có giá trị từ 1 đến 255 được gọi là các bước nhảy cho các hệ số DCT. Quá trình lượng tử được coi như...
 

Các chủ đề có liên quan khác

Top