H.264編碼和基于H.264的移動服務(wù)
Emblaze Systems公司
翻譯:廣州富年電子科技有限公司 潘勇強 校對:姚薇
2004/07/23
緒論
H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2視頻壓縮標(biāo)準(zhǔn)發(fā)布以后的最新、最有前途的視頻壓縮標(biāo)準(zhǔn)。H.264是由ITU-T和ISO/IEC的聯(lián)合開發(fā)組共同開發(fā)的最新國際視頻編碼標(biāo)準(zhǔn)。通過該標(biāo)準(zhǔn),在同等圖象質(zhì)量下的壓縮效率比以前的標(biāo)準(zhǔn)提高了2倍以上,因此,H.264被普遍認(rèn)為是最有影響力的行業(yè)標(biāo)準(zhǔn)。
H.264簡介
H.264的發(fā)展歷史
H.264在1997年ITU的視頻編碼專家組(Video Coding Experts Group)提出時被稱為H.26L,在ITU與ISO合作研究后被稱為MPEG4 Part10(MPEG4 AVC)或H.264(JVT)。
H.264的高級技術(shù)背景
H.264標(biāo)準(zhǔn)的主要目標(biāo)是:與其它現(xiàn)有的視頻編碼標(biāo)準(zhǔn)相比,在相同的帶寬下提供更加優(yōu)秀的圖象質(zhì)量。
然而,H.264與以前的國際標(biāo)準(zhǔn)如H.263和MPEG-4相比,最大的優(yōu)勢體現(xiàn)在以下四個方面:
1. 將每個視頻幀分離成由像素組成的塊,因此視頻幀的編碼處理的過程可以達(dá)到塊的級別。
2. 采用空間冗余的方法,對視頻幀的一些原始塊進(jìn)行空間預(yù)測、轉(zhuǎn)換、優(yōu)化和熵編碼(可變長編碼)。
3. 對連續(xù)幀的不同塊采用臨時存放的方法,這樣,只需對連續(xù)幀中有改變的部分進(jìn)行編碼。該算法采用運動預(yù)測和運動補償來完成。對某些特定的塊,在一個或多個已經(jīng)進(jìn)行了編碼的幀執(zhí)行搜索來決定塊的運動向量,并由此在后面的編碼和解碼中預(yù)測主塊。
4. 采用剩余空間冗余技術(shù),對視頻幀里的殘留塊進(jìn)行編碼。例如:對于源塊和相應(yīng)預(yù)測塊的不同,再次采用轉(zhuǎn)換、優(yōu)化和熵編碼。
H.264的特征和高級優(yōu)勢
H.264是國際標(biāo)準(zhǔn)化組織(ISO)和國際電信聯(lián)盟(ITU)共同提出的繼MPEG4之后的新一代數(shù)字視頻壓縮格式,它即保留了以往壓縮技術(shù)的優(yōu)點和精華又具有其他壓縮技術(shù)無法比擬的許多優(yōu)點。
1.低碼流(Low Bit Rate):和MPEG2和MPEG4 ASP等壓縮技術(shù)相比,在同等圖像質(zhì)量下,采用H.264技術(shù)壓縮后的數(shù)據(jù)量只有MPEG2的1/8,MPEG4的1/3。
顯然,H.264壓縮技術(shù)的采用將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費。
2.高質(zhì)量的圖象:H.264能提供連續(xù)、流暢的高質(zhì)量圖象(DVD質(zhì)量)。
3.容錯能力強:H.264提供了解決在不穩(wěn)定網(wǎng)絡(luò)環(huán)境下容易發(fā)生的丟包等錯誤的必要工具。
4.網(wǎng)絡(luò)適應(yīng)性強:H.264提供了網(wǎng)絡(luò)適應(yīng)層(Network Adaptation Layer), 使得H.264的文件能容易地在不同網(wǎng)絡(luò)上傳輸(例如互聯(lián)網(wǎng),CDMA,GPRS,WCDMA,CDMA2000等)。
基于H.264的移動服務(wù)
雖然早期的視頻編碼標(biāo)準(zhǔn)如MPEG-4和H.263可以為移動應(yīng)用(如視頻流和下載服務(wù))提供充分的視頻圖象質(zhì)量,但最新的視頻編碼標(biāo)準(zhǔn)H.264可以將移動應(yīng)用面擴(kuò)大和提供更強有力的服務(wù)。
下面介紹幾種運用H.264高級編碼技術(shù)的應(yīng)用:
VOD下載應(yīng)用
VOD下載應(yīng)用是通過Wap或Web門戶提供給最終用戶的。最終用戶瀏覽媒體門戶的時候,當(dāng)他們找到一個要看的視頻短片,就會點擊該短片的鏈接。這樣,該短片就會保存到用戶移動終端的內(nèi)存里面,用戶可以直接使用移動終端離線觀看該短片。
現(xiàn)存的2.5G和3G移動網(wǎng)絡(luò),如GSM-GPRS,UMTS,CDMA 1XRTT和CDMA 1XEVDO,跟基于Internet寬帶的網(wǎng)絡(luò)帶寬相比,都非常糟糕。因此,下載一個使用原宥編碼技術(shù)(如MPEG-4和H.263)壓縮的視頻短片就非常慢了。舉個例子,以64Kbps的速率下載下載一個1~3M的視頻短片要花費好幾分鐘(平均4分鐘)。
正是因為這個原因,目前的視頻下載應(yīng)用都只是提供很小的視頻短片(一般不會超過幾百Kbytes)。如此小的視頻短片所包含的信息往往難以滿足最終用戶的需求。
跟以前的編碼標(biāo)準(zhǔn)如MPEG-4和H.263相比,H.264可以保證在同樣的圖象質(zhì)量下,將壓縮比提高一倍,這樣就使視頻下載應(yīng)用就更有吸引力了。服務(wù)供應(yīng)商和內(nèi)容所有者可以在不損失圖象質(zhì)量的情況下,提供的同樣大小的視頻短片,該短片所包含的信息量大約是以前的2倍。結(jié)果是大大縮小了下載時間或提供更多的數(shù)據(jù)量。
在H.264高級編碼技術(shù)的幫助下,視頻下載應(yīng)用無論是對服務(wù)供應(yīng)商還是對最終用戶都更加有吸引力。
流式視頻直播應(yīng)用
典型的流式視頻直播應(yīng)用包括3個組件:一端是連接到PC的視頻攝像機,中間是視頻分發(fā)平臺,另一端是配備移動設(shè)備的最終用戶。目的是使最終用戶訪問該直播的時候感覺視頻是直接從攝象機過來的,而視頻分發(fā)平臺對用戶是透明的。利用這樣一個視頻直播平臺,可以通過移動網(wǎng)絡(luò)實現(xiàn)無數(shù)的應(yīng)用,最終用戶可以通過手機來觀看需要看的地方,公共場所如迪斯科舞廳、娛樂中心和高速公路的車流等,私人場所如住房、后院等。
雖然這些應(yīng)用已經(jīng)在移動市場已經(jīng)推出,采用的是較少優(yōu)勢的視頻壓縮技術(shù)如 MPEG-4和H.263。因此,高級編碼技術(shù)H.264可以更加有力地推進(jìn)這些應(yīng)用,如視頻直播。
H.264的關(guān)鍵優(yōu)勢
高效率的帶寬利用:在典型的視頻流會話中,大部分的數(shù)據(jù)傳輸帶寬通常是被視頻成分占用的。在視頻會話連接期間,在不犧牲圖象質(zhì)量的前提下,由于一系列的原因,如終端用戶數(shù)量的增加(包括家庭PC用戶和移動用戶),都會引起數(shù)據(jù)流量的大幅波動。因此,為了使視頻流應(yīng)用在低帶寬下能夠傳輸高質(zhì)量的圖象,就必須使用高效率的視頻壓縮工具。
低處理延遲:為了保證解碼的視頻獲得很好的質(zhì)量,視頻數(shù)據(jù)的處理和傳輸延遲必須最小化。在編碼過程一個較大的處理延遲會導(dǎo)致視頻隊列重新組合的混亂。延遲是編碼、網(wǎng)絡(luò)和解碼延遲的總和。在實時交互應(yīng)用里,用戶會對延遲超過250ms的視頻感到非常厭惡。為了將延遲最小化,必須在編碼和解碼過程中進(jìn)行最小延遲的處理。
優(yōu)秀的圖象質(zhì)量:在直播應(yīng)用里,視頻圖象質(zhì)量的好壞受多方面因素的影響:包括在視頻源的噪聲和光線的改變、重新組合的視頻和網(wǎng)絡(luò)丟包的情況。
1. 預(yù)處理:視頻幀噪聲的存在和連續(xù)視頻幀的光線改變,對會嚴(yán)重地降低視頻編碼效率。因此,為了降低噪聲和光線改變對視頻編碼效率的影響,必須使用預(yù)處理工具。
2. 避免馬賽克:馬賽克通常由一系列運動物體的拖尾痕跡的點所組成,而且非常明顯。當(dāng)在非常低的帶寬下進(jìn)行圖象編碼,就會被迫丟棄大量有用的數(shù)據(jù)(例如:使用一個很大的量化因子),從而引起了馬賽克。因此,這樣的馬賽克應(yīng)該被消除或減少。
3. 容錯處理:被視頻編碼器壓縮過的數(shù)據(jù)流首先分成固定或不同長度的包,合成音頻和其它數(shù)據(jù)類型,然后通過網(wǎng)絡(luò)進(jìn)行傳輸。一些數(shù)據(jù)包在通過物理鏈路傳輸?shù)倪^程中會丟失或損壞,導(dǎo)致音頻和視頻數(shù)據(jù)變形。因此,為了保證最小限度的丟失和損壞,必須在編碼過程對數(shù)據(jù)進(jìn)行容錯處理。
MMS帶視頻附件的應(yīng)用
MMS服務(wù)已經(jīng)在全球范圍被多個移動運營商所提供,并且越來越多的用戶開始喜歡并大量使用該服務(wù)。然而,一個基本的特征如視頻短片附件應(yīng)用卻非常貧乏。主要原因是受設(shè)備的限制,大部分MMS終端不支持大于50Kbytes的附件(任何類型),而且,即使是配置較高的終端,配備了大容量的內(nèi)存,也不會支持大于100Kbytes的附件。
以上限制的原因是OMA委員會發(fā)布了統(tǒng)一文件,規(guī)定了MMS附件不能夠超出以上所規(guī)定的大小。
目前的視頻壓縮技術(shù)的主要限制是:使用移動終端的內(nèi)置攝像機錄一段10秒的視頻,視頻文件的大小平均為80~100Kbytes。采用目前的視頻壓縮技術(shù)(如MPEG-4和H.263),由于受文件大小的限制,最終用戶就難以通過MMS附件來發(fā)送視頻短片了。
由此可以清楚地看出,H.264可以很好地解決以上的這些問題,使MMS和視頻應(yīng)用有機地結(jié)合起來。
總結(jié)
H.264代表了當(dāng)前業(yè)界最先進(jìn)的視頻壓縮技術(shù)。
1.低碼流(Low Bit Rate):和MPEG2和MPEG4 ASP等壓縮技術(shù)相比,在同等圖像質(zhì)量下,采用H.264技術(shù)壓縮后的數(shù)據(jù)量只有MPEG2的1/8,MPEG4的1/3。
顯然,H.264壓縮技術(shù)的采用將大大節(jié)省用戶的下載時間和數(shù)據(jù)流量收費。
2.高質(zhì)量的圖象:H.264能提供連續(xù)、流暢的高質(zhì)量圖象(DVD質(zhì)量)。
3.容錯能力強:H.264提供了解決在不穩(wěn)定網(wǎng)絡(luò)環(huán)境下容易發(fā)生的丟包等錯誤的必要工具。
4. 網(wǎng)絡(luò)適應(yīng)性強:H.264提供了網(wǎng)絡(luò)適應(yīng)層(Network Adaptation Layer), 使得H.264的文件能容易地在不同網(wǎng)絡(luò)上傳輸(例如互聯(lián)網(wǎng),CDMA,GPRS,WCDMA,CDMA2000等)。
廣州富年電子公司供稿 CTI論壇編輯
相關(guān)鏈接: