Tổng quan về MPEG-4

MPEG-4 là chuẩn ISO/IEC được phát triển bởi nhóm MPEG (Moving Picture Expert Group), nhóm này cũng đã xây dựng các chuẩn MPEG-1 và MPEG-2. Các chuẩn này mô tả phương pháp tương tác hình ảnh trên CD-ROM, DVD và truyền hình số. MPEG-4 với tên gọi chính thức do ISO/IEC đặt tên là “ISO/IEC 14496″ hoàn thành 10/1998 và trở thành tiêu chuẩn quốc tế 1/1999.


MỞ ĐẦU

MPEG-4 là chuẩn ISO/IEC được phát triển bởi nhóm MPEG (Moving Picture Expert Group), nhóm này cũng đã xây dựng các chuẩn MPEG-1 và MPEG-2. Các chuẩn này mô tả phương pháp tương tác hình ảnh trên CD-ROM, DVD và truyền hình số. MPEG-4 với tên gọi chính thức do ISO/IEC đặt tên là “ISO/IEC 14496″ hoàn thành 10/1998 và trở thành tiêu chuẩn quốc tế 1/1999. Các mở rộng để tương thích hoàn toàn với các chuẩn trước đó được hoàn thành vào cuối năm 1999, phiên bản này được gọi là MPEG-4 Version 2, được công nhận là chuẩn quốc tế đầu năm 2000. Một số mở rộng được các nhóm làm việc trong MPEG tiếp tục đưa vào kể từ đó đến nay. MPEG-4 dựa vào sự thành công của ba lĩnh vực:

–         Truyền hình số

–         Các ứng dụng tương tác đồ hoạ (tổng hợp nội dung)

–         Tương tác đa phương tiện (World Wide Web, phân phối và truy cập nội dung)

Tiêu chuẩn MPEG-4 về hình ảnh bao gồm một số các công cụ dùng để mã hoá các hình ảnh tự nhiên như chuỗi các ảnh liên tục (Video) cũng như các ảnh tĩnh (Visual Texture – cấu trúc nghe nhìn). Ở đây, việc mã hoá video được dựa trên cơ sở của sơ đồ mã hoá DCT lai có bù chuyển động, còn mã hoá cấu trúc nghe nhìn (Visual texture) – VTC thì dựa trên cơ sở chuyển đổi Wavelet và mã hoá cây Z

ero. Mã hoá MPEG-4 ngoài việc quan tâm đến các hiệu quả mã hoá giống như các tiêu chuẩn mã hoá trước đây còn bổ xung thêm một số công cụ cho các chức năng khác như: Mã hoá các đối tượng có hình dạng bất kỳ; nén hiệu quả của các tín hiệu video liên tục và hình ảnh tĩnh trên một phạm vi rộng của tỷ lệ bít; phân cấp về không gian thời gian và chất lượng; khả năng truyền dẫn tốt trong môi trường truyền dẫn khắc nhiệt.

Mã hoá video theo tiêu chuẩn MPEG-4 là đề tài phức tạp có phạm vi rộng, chúng ta đề cập về nguyên lý cơ bản của mã hoá video theo tiêu chuẩn MPEG-4, có thể được sử dụng làm cơ sở cho việc xem xét, nghiên cứu các kỹ thuật nén video theo MPEG-4 cụ thể.

TỔNG QUAN VỀ MPEG-4

Nhu cầu truyền phát các dịch vụ Multimedia mới trên hạ tầng kỹ thuật mạng Internet đã làm nảy sinh các yêu cầu chức năng không có trong các chuẩn MPEG-1, MPEG-2 và các chuẩn nén video trước đó. Sự xuất hiện của chuẩn MPEG-4 (10/1998 ) đã tạo ra một phương thức thiết lập và tương tác mới với truyền thông nghe nhìn trên mạng internet, tạo ra một phương thức sản xuất, cung cấp và ứng dụng mới các nội dung video trên cơ sở nội dung và hướng đối tượng (content/object-based). Đây chính là một công nghệ trình diễn truyền thông đa phương tiện phức hợp, có khả năng truyền thông trong các môi trường băng thông rất khác nhau nhờ kết hợp tốt 3 môi trường: Truyền hình số, đồ hoạ tương tác và World Wide Web. So sánh MPEG-4 với MPEG-2, có thể thấy sự hỗ trợ mang tính bản chất cho các hoạt động tương tác là sự khác nhau chủ yếu, thể hiện tính ưu việt của công nghệ MPEG-4 so với MPEG-2 là chuẩn hiện đang được áp dụng rộng rãi trong các hệ thống truyền hình số. Trên thực tế đa số các hãng cung cấp dịch vụ truyền thông theo dòng Multimedia đều đã hỗ trợ chuẩn MPEG-4 trong các cấu trúc hạn tầng và sản phẩm đang triển khai của mình, cụ thể là:

· Apple đã chấp nhận Profile Visual Simple MPEG-4 và mã hoá Audio tiên tiến (Advanced Audio Coding) cho nền chuẩn Quicktime, Apple hỗ trợ MPEG-4 miễn phí trong các máy chủ Darwin Streaming Server và trong New Quicktime 6 của mình;

· Realworks có hỗ trợ giải mã nội dung MPEG-4 và hỗ trợ chuẩn MPEG-4 trên các máy chủ Helix của RealNetworks;

· DivX5 của DivXNetworks chính là sự triển khai của MPEG-4 Advance Simple Visual Profile. Các mã hoá phổ cập DivX hiện nay của DivXNetworks cũng đang làm việc trên sự tương thích định dạng file MPEG-4.

· Các chuyên gia mã hoá video đều biết tới đóng góp của của Microsoft về chuẩn MPEG-4 trong MPEG-4 Reference Software, Microsoft là một trong các công ty đầu tiên triển khai mã hoá video MPEG-4 trong định dạng Platform Windows Media (trừ Windows Media 9). Gần đây những nhà bán thiết bị MPEG-4 đã tiếp tục đưa ra thiết bị Plug-In cho Microsoft’s Windows Media Player, cho phép người dùng xem các nội dung MPEG-4 trong các thiết bị này.

So sánh MPEG-4 với một số định dạng Multimedia được sử dụng phổ biến trên Internet hiện nay.

MPEG-4

Windows Media

Real

Flash

Mã hoá Audio /Video Trên cơ sở các chuẩn, hỗ trợ các nhà cung cấp sản phẩm Bản quyền Bản quyền, nhưng hỗ trợ download tự động các thiết bị MPEG-4 cắm thêm vào Bản quền và các định dạng độc quyền của Real và Quicktime
Tương tác Tương tác cao bị hạn chế được, thông qua SMIL Tương tác cao
Quản lý bản quyền số DRM (Digital Rights Management) Các giao diện để quản lý bản quyền số DRM. Nhiều quản lý bản quyền số DRM dưới sự phát triển của MPEG-4 và MPEG-21 Microsoft DRM kiểm soát truy cập nội dung không
Kiểm soát dòng thời gian thực được được được được
Đồng bộ Audio, video và tất cả các đối tượng khác có thể được đồng bộ chặt chẽ với độ chính xác cao Đồng bộ chặt chẽ giữa Audio và video Đồng bộ chặt chẽ giữa Audio và video Không đồng bộ giữa khung hình scene và các dòng.
Khả năng broadcast Được, bao gồm cả các tính năng tương tác chỉ Audio/video Khung hình scene cần phải là unicast không
Hỗ trợ kiểu đối tượng Video/audio và truyền thông hỗn hợp 2D/3D phong phú, các hình đồ hoạ tổng hợp. DRM trên các dòng riêng biệt Audio/video Video/audio và truyền thông hỗn hợp thông qua giao thức trên cơ sở SMIL. Không tạo dòng các truyền thông hỗn hợp. Video/audio và truyền thông hỗn hợp thông qua giao thức bản quyền riêng.
Đối tượng đồ hoạ không không
Giao vận Có hỗ trợ HTTP, UDP, RTP/RTSP, MPEG-2TS, di động HTTP, UDP, RTP/RTSP, di động HTTP, RTP/RTSP, di động HTTP
PC, Hộp Set top box, không dây Không

Hiện nay, các nhà sản xuất thiết bị điện tử và các công ty bán dẫn đang chế tạo các thiết bị MPEG-4 cho các hệ thống sản xuất video và giải trí tại nhà bao gồm các video camera, hộp set top box và các thiết bị hiển thị DVD, điện thoại di động … sử dụng MPEG-4 (cũng như khả năng hiển thị với MPEG-1 và MPEG-2). Sony đã đưa ra thiết bị DVCams và PDA với MPEG-4. Nhiều camera số của Sonny có sẵn trên thị trường cho phép thu MPEG-4 trên các bộ nhớ Flash media; Station Ingest của Snell & Wilcox cũng được trang bị một hệ thống trình duyệt trên cơ sở MPEG-4. Cả hệ trình duyệt và bộ mã hoá truyền tải (Transcoder) đã được phát triển với sự hợp tác với nhà cung cấp thiết bị mã hoá Discas; DVD Forum đang xem xét sử dụng MPEG-4 cho thế hệ tiếp theo của lưu trữ truyền thông… MPEG-4 đang được triển khai bởi nhiều nhà vận hành mạng và dịch vụ trên thế giới với các dịch vụ mới đang được bổ xung để chiếm các lợi thế cấu trúc hạ tầng băng rộng đang phát triển.

CÔNG NGHỆ MÃ HOÁ VIDEO TRONG MPEG-4

MPEG-4 là sản phẩm của nhóm MPEG (Moving Picture Expert Group) được thành lập tháng 1/1988 với nhiệm vụ phát triển các chuẩn xử lý, mã hoá và hiển thị các ảnh động, audio và các tổ hợp của chúng. Sản phẩm đầu tiên của nhóm này là MPEG-1 được sử dụng cho việc mã hoá các dữ liệu nghe nhìn với tốc độ 1,5 Mbps. Sản phẩm thứ hai của nhóm là chuẩn MPEG-2 nổi tiếng hiện nay, mang tính tổng quát hơn và đang được áp dụng cho một loạt các ứng dụng nghe nhìn trong phạm vi tốc độ từ 3-40 Mbps.

Không giống các chuẩn MPEG trước đó, ví dụ như trong MPEG-2, nơi mà nội dung được tạo ra từ nhiều nguồn như video ảnh động, đồ họa, văn bản… và được tổ hợp thành chuỗi các khung hình phẳng, mỗi khung hình (bao gồm các đối tượng như người, đồ vật, âm thanh, nền khung hình…) được chia thành các phần tử ảnh pixels và xử lý đồng thời, giống như cảm nhận của con người thông qua các giác quan trong thực tế. Các pixels này được mã hoá như thể tất cả chúng đều là các phần tử ảnh video ảnh động. Tại phía thu của người sử dụng, quá trình giải mã diễn ra ngược với quá trình mã hoá không khó khăn. Vì vậy có thể coi MPEG-2  là một công cụ hiển thị tĩnh, và nếu một nhà truyền thông truyền phát lại chương trình của một nhà truyền thông khác về một sự kiện, thì logo của nhà sản xuất chương trình này không thể loại bỏ được. Với MPEG-2, bạn có thể bổ xung thêm các phần tử đồ hoạ và văn bản vào chương trình hiển thị cuối cùng (theo phương thức chồng lớp), nhưng không thể xoá bớt các đồ hoạ và văn bản có trong chương trình gốc.

Chuẩn MPEG-4 khắc phục được hạn chế này và là một chuẩn động dễ thay đổi. Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể được mô tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES (Elementary Stream) khác nhau. Cũng nhờ xác định, tách và xử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng ảnh video như con người hay động vật, nền khung hình …), nên người sử dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình. Sự tổ hợp lại thành khung hình chỉ được thực hiện sau khi giải mã các đối tượng này.

Trên hình 1 thể hiện một trường hợp điển hình của tổ hợp khuôn hình MPEG-4, cho thấy nhiều đối tượng (bàn, quả cầu, bảng đen, người hướng dẫn và audio) được đặt vào một hệ thống toạ độ không gian 3 chiều (3-D) đối với vị trí người xem giả định. Các thiết bị mã hoá và giải mã video đều áp dụng sơ đồ mã hoá như nhau cho mỗi đối tượng video VO (Video Object) riêng biệt (hình 2), nhờ vậy người sử dụng có thể thực hiện các hoạt động tương tác riêng với từng đối tượng (thay đổi tỷ lệ, di chuyển, kết nối, loại bỏ, bổ xung các đối tượng …) ngay tại vị trí giải mã hay mã hoá.

Hình 1. Sự tổ hợp khung hình trong MPEG-4

Các bộ phận chức năng chính trong các thiết bị MPEG-4 bao gồm:

· Bộ mã hoá hình dạng ngoài Shape Coder dùng để nén đoạn thông tin, giúp xác định khu vực và đường viền bao quanh đối tượng trong khung hình scene;

· Bộ dự đoán và tổng hợp động để giảm thông tin dư thừa theo thời gian.

· Bộ mã kết cấu mặt ngoài Texture coder dùng để xử lý dữ liệu bên trong và các dữ liệu còn lại sau khi đã bù chuyển động.

Hình 2. Cấu trúc của bộ mã hoá và giải mã video MPEG-4

Hình 3. Sơ đồ cấu trúc giải mã video MPEG-4

Hình 3 là một ví dụ về tổng hợp khung hình video sử dụng trong MPEG-4. Nhiều đối tượng như người, bản đồ, bản tin, được tách ra khỏi video đầu vào. Mỗi đối tượng video sau đó được mã hóa bởi bộ mã hoá đối tượng video VO (Video Object) và sau đó được truyền đi trên mạng. Tại vị trí thu, những đối tượng này được giải mã riêng rẽ nhờ bộ giải mã riêng VO và gửi tới bộ compositor. Người sử dụng có thể tương tác với thiết bị để cấu trúc lại khung hình gốc, hay để xử lý các đối tượng tạo ra một khung hình khác. Ngoài ra, người sử dụng có thể download các đối tượng khác từ các thư viện cơ sở dữ liệu (có sẵn trên thiết bị hay từ xa thông qua mạng LAN, WAN hay Internet) để chèn thêm vào hay thay thế các đối tượng có trong khuôn hình gốc.

Để có thể thực hiện việc tổ hợp khung hình, MPEG-4 sử dụng một ngôn ngữ mô tả khung hình riêng, được gọi là định dạng nhị phân cho khung hình BiFS (Binary Format for Scenes). BiFS không chỉ mô tả ở đâu và khi nào các đối tượng xuất hiện trong khung hình, nó cũng mô tả cách thức hoạt động của đối tượng (làm cho một đối tượng xoay tròn hay chồng mờ hai đối tượng lên nhau) và cả điều kiện hoạt động đối tượng và tạo cho MPEG-4 có khả năng tương tác. Trong MPEG-4 tất cả các đối tượng có thể được mã hoá với sơ đồ mã hoá riêng của nó – video được mã hoá theo kiểu video, text được mã hoá theo kiểu text, các đồ hoạ được mã hoá theo kiểu đồ hoạ – thay vì việc xử lý tất cả các phần tử ảnh pixels như là mã hoá video ảnh động. Do các quá trình mã hoá đã được tối ưu hoá cho từng loại dữ liệu thích hợp, nên chuẩn MPEG-4 sẽ cho phép mã hoá với hiệu quả cao tín hiệu ảnh video, audio và cả các nội dung tổng hợp như các bộ mặt và cơ thể hoạt hình.

CÁC PROFILE VÀ LEVEL TRONG CHUẨN MPEG-4

Chuẩn MPEG-4 bao gồm nhiều tính năng ưu việt khác nhau, không phải bất kỳ ứng dụng nào cũng đòi hỏi tất cả các tính năng của MPEG-4. Để sử dụng công cụ MPEG-4 một cách hiệu quả nhất, mỗi thiết bị chuẩn MPEG-4 sẽ chỉ được trang bị một số tính năng phù hợp với một phạm vi ứng dụng nhất định, và để tạo điều kiện cho người sử dụng lựa chọn công cụ MPEG-4, các thiết bị MPEG-4 chia thành các nhóm công cụ gọi là các profile, mỗi nhóm (profile) chỉ chứa một vài tính năng cần thiết của chuẩn mã hoá thích hợp cho một phạm vi ứng dụng nào đó. Điều này cho phép người sử dụng dễ dàng lựa chọn bộ công cụ hỗ trợ các tính năng mà họ cần từ vô số các bộ công cụ MPEG-4 khác nhau. Mỗi profile lại có các mức levels khác nhau, thể hiện mức độ phức tạp xử lý tính toán dữ liệu của công cụ đó (thông qua việc định rõ tốc độ bit, con số tối đa của các đối tượng trong khung hình, độ phức tạp của quá trình giải mã audio …)

CÁC BỘ PHẬN CẤU THÀNH CHUẨN MPEG-4

MPEG-4 bao gồm các bộ phận riêng rẽ, có quan hệ chặt chẽ với nhau và có thể được triển khai ứng dụng riêng hay tổ hợp với các phần khác. Các phần cơ bản là:

· Phần 1: System;

· Phần 2: Visual;

· Phần 3: Audio;

· Phần 4: Conformance xác định việc triển khai một MPEG-4 sẽ như thế nào;

· Phần 5: Các phần mềm tham chiếu, đưa ra một nhóm các phần mềm tham chiếu quan trọng, được sử dụng để triển khai MPEG-4 và phục vụ như một ví dụ demo về các bước phải thực hiện khi triển khai;

· Phần 6: Khung chuẩn cung cấp truyền thông đa phương tiện tích hợp DMIF (Delivery Multimedia Integration Framework), xác định một giao diện giữa các ứng dụng và mạng/lưu trữ;

· Phần 7: Các đặc tính của một bộ mã hoá video tối ưu (bổ xung cho các phần mềm tham chiếu, nhưng không phải là các triển khai tối thiểu cần thiết).

Các phần mới bổ xung tiếp cho chuẩn MPEG-4 sau này là:

· Phần 8: Giao vận (về nguyên tắc không được xác định trong chuẩn, nhưng phần 8 xác định cần ánh xạ như thế nào các dòng MPEG-4 vào giao vận IP);

· Phần 9: Mô tả phần cứng tham chiếu (Reference Hardware Description);

· Phần 10: MPEG-4 Advanced Video Coding/H.264 là thành tựu mới nhất về nén video, trên cơ sở đồng bộ với khả năng tính toán và dung lượng bộ nhớ của các máy tính PC hiện nay, ứng dụng các phương pháp mã hoá phức tạp hơn nhiều các phương pháp trước đó và có thể thực hiện trong cả môi trường phần mềm và phần cứng, do nhóm chuyên gia MPEG hợp tác với nhóm IUT Study Group phát triển và có nhiều khả năng sẽ trở thành chuẩn mã hoá video quy mô toàn cầu, duy nhất của ITU và ISO;

· Phần 11: Mô tả khung hình (Scene Description – được tách ra từ phần 1);

· Phần 12: Định dạng file truyền thông ISO (ISO Media File Format);

· Phần 13: Quản lý bản quyền nội dung IPMP (Intellectual Property Management and Protection Extentions);

· Phần 14: Định dạng file MP4 (trên cơ sở phần 12);

· Phần 15: Định dạng file AVC (cũng trên cơ sở phần 12);

· Phần 16: AFX (Animation Framwork eXtensions) và MuW (Multi-user Worlds)

MỘT SỐ ỨNG DỤNG CHUẨN MPEG-4

Khả năng phân cấp và phân chia độc lập các khung hình thành các đối tượng khiến cho MPEG-4 trở thành một công cụ hữu hiệu trong việc tạo thuận lợi cho các ứng dụng trên Internet nói riêng và trên môi trường mạng nói chung (kể cả các mạng LAN, WAN, Intranet…) đó là các ứng dụng:

· Truyền thông multimedia theo dòng (Multimedia stream), trong đó dòng audio và video sẽ được biến đổi thích nghi với yêu cầu băng thông và chất lượng hình nhờ loại bỏ những đối tượng (hình ảnh, âm thanh) không cần thiết khỏi dòng dữ liệu và đồng bộ các thông tin được nhúng trong dòng dữ liệu đó. Thêm vào đó, MPEG-4 sẽ cho phép người sử dụng khả năng tương tác trực tiếp với dòng dữ liệu (dừng tiến hay lùi nhanh, kích chuột để kích hoạt các tuỳ chọn video và audio…)

· Lưu giữ và phục hồi dữ liệu audio và video: do MPEG-4 phân chia các khung hình thành các đối tượng, việc trình duyệt Browser trên cơ sở nội dung (đối tượng) mong muốn sẽ được thực hiện một cách dễ dàng và nhờ vậy, các ứng dụng lưu giữ hay phục hồi thông tin trên cơ sở nội dung MPEG-4 sẽ được thuận lợi hơn;

· Truyền thông báo đa phương tiện: các thông báo dưới dạng text, audio và video MPEG-4 sẽ được truyền đi với yêu cầu băng thông ít hơn, và có khả năng tự điều chỉnh chất lượng cho phù hợp với khả năng băng thông của thiết bị giải mã;

· Thông tin giải trí: những sự trình diễn nghe nhìn tương tác (thế giới ảo, trò chơi tương tác …) có thể được triển khai trên cơ sở chuẩn MPEG-4 sẽ làm giảm yêu cầu về băng thông và làm cho thế giới ảo trở nên sinh động và giống như thực tế trên các trang web;

Ngoài các ứng dụng trên môi trường mạng nói chung và môi trường tương tác nói riêng – theo APB (04/2004) – các đài truyền hình Nhật Bản như NHK, TBS, NTV TV Asahi, Fuji và TV Tokyo đã chính thức chấp nhận đưa chuẩn MPEG-4/H.264 (Phần 10) cho phát sóng số mặt đất cho thu di động, đây cũng là một khả năng lớn còn tiềm ẩn trong chuẩn mã hoá và trình diễn video này.

Sưu tầm

3 phản hồi

  1. ky1233333334444444444645nbfsdhgvghc

  2. huyen ngu dien

  3. Em cảm ơn bác rất nhiều. Những bài viết và thông tin rất bổ ích. Em đang rất cần thông tin về MPEG4 để làm bài tập lớn.
    Thank u so much!

Gửi phản hồi

Mời bạn điền thông tin vào ô dưới đây hoặc kích vào một biểu tượng để đăng nhập:

WordPress.com Logo

Bạn đang bình luận bằng tài khoản WordPress.com Log Out / Thay đổi )

Twitter picture

Bạn đang bình luận bằng tài khoản Twitter Log Out / Thay đổi )

Facebook photo

Bạn đang bình luận bằng tài khoản Facebook Log Out / Thay đổi )

Google+ photo

Bạn đang bình luận bằng tài khoản Google+ Log Out / Thay đổi )

Connecting to %s

%d bloggers like this: