視頻編碼方式
編碼方式(Codec)能夠對數字視頻進行壓縮或者解壓縮(視頻解碼)的程序或者設備。常見的編碼方式包括:
- H.26X 系列,由 ITU(國際電信聯盟)主導。該系列標準中,目前應用最廣泛的是 H.264,其繼任者為 H.265。同等畫質下,H.265 的壓縮率可以比 H.264 提高一倍,但受制于專利等因素,H.265 的應用尚未普及。
- MPEG 系列,由 ISO(國際標準組織機構)下屬的 MPEG(運動圖象專家組)主導。
- 其他系列,例如 Google 主導的 VP8、VP9,Real 公司主導的 RealVideo 等。
分辨率
分辨率(Resolution)是用以描述視頻對細節的分辨能力,通常表示為每一個方向上的像素數量,如640 x 480等。
幀率
幀率(Frame Rate)是單位時間內視頻顯示幀數的量度單位,測量單位為“每秒顯示幀數”(Frame Per Second,FPS)。
采樣率
采樣率(Sample Rate)是每秒從連續信號中提取并組成離散信號的采樣個數,單位為赫茲(Hz)。
音頻編碼方式
音頻編碼方式(Codec)是將聲音從模擬信號轉換為數字信號(或反向轉換)的方式。主要包括無損編碼和有損編碼兩種方式。根據采樣定理,音頻編碼只能“無限接近”自然信號,故而所有的音頻編碼方式實質上都是有損的。在計算機領域中,通常約定能夠達到最高保真水平的 PCM 編碼為無損編碼。互聯網中常見的音頻編碼均為有損編碼,常見的編碼格式有 MP3、AAC 等。
碼率
碼率(Bitrate)是單位時間播放連續媒體(如壓縮后的音頻或視頻)所需的比特數量,測量單位為“比特每秒”(bit/s 或 bps)。一般來說在相同分辨率下,文件的碼率越大,說明單位時間內取樣率越大,數據流精度就越高,畫面質量就越高,畫質越清晰,要求播放設備的解碼能力也越高。同樣,碼率越大,文件體積也越大,其計算公式是文件體積=時間×碼率/8。
封裝格式
封裝格式(Format)是將已經編碼壓縮好的視頻流和音頻流按照一定的格式規范,放到一個文件中。對于網絡點播而言,更加合適的術語應該叫“流媒體網絡傳輸協議”。在互聯網中使用最為廣泛的協議為:
- MP4:非常經典的文件格式,對 iOS、Android、PC Web 端支持度都很好。但是 MP4 的視頻文件頭太大,結構復雜。如果視頻較長(如長達數小時),則其文件頭會過大,影響視頻加載速度,所以其更適用于短視頻場景。
- HLS(HTTP Live Streaming):蘋果公司力推的標準,iOS、Android 端支持度較好,但 IE 的支持情況依賴 Flash 的二次開發工作。
- FLV:Adobe公司所推的標準,在 PC 端有 Flash 的強力支持,但在移動端只有App 實現播放器才有可能支持,大部分手機端瀏覽器均不支持。
視頻轉碼
視頻轉碼是指將一個視頻文件從一種編碼格式轉換為另一種編碼格式的過程。轉碼的目的可能是為了使視頻文件在特定設備或軟件上播放或編輯,或者為了減小視頻文件的大小以節省存儲空間或加快傳輸速度。在視頻轉碼過程中,可以調整視頻的分辨率、幀率、比特率、編碼方式等參數,以適應不同的需求。
視頻轉封裝
視頻轉封裝是指在不改變視頻編碼的情況下,將一個視頻文件的容器格式從一種類型轉換為另一種類型的過程。容器格式是指視頻文件中包含視頻和音頻流以及其他元數據的文件格式,常見的容器格式有MP4、AVI、MKV等。在視頻轉封裝的過程中,視頻和音頻的編碼格式不會改變,但是可以調整封裝格式的參數,如封裝方式、視頻幀率、音頻碼率、字幕等。轉封裝可以幫助適應不同的播放設備和軟件,提高視頻的兼容性和播放效果。
GOP
GOP是視頻編碼中的一個重要概念,是Group of Pictures的縮寫。在視頻編碼中,一幀畫面經過壓縮編碼后會被分為I幀、P幀和B幀三種類型,I幀是關鍵幀,也是獨立編碼的幀,P幀和B幀是參前后的幀進行預測編碼的幀。GOP是由一組連續的I幀、P幀和B幀組成的序列,整個序列被視為一個編碼單元,用于提高視頻編碼效率和減小文件大小。
在一個GOP中,第一個I幀被稱為GOP頭,最后一個B幀被稱為GOP尾,中間的P幀和B幀被稱為B幀組或P幀組。GOP的大小可以根據需要進行調整,通常選擇一個適當的GOP大小可以在保證視頻質量的同時減小視頻文件的大小。較小的GOP大小可以提高視頻的編碼效率,但同時也會增加編碼延遲和視頻文件的大小。
聲道數
聲道(Sound Channel)是指聲音在錄制(或播放)時,在不同空間位置采集(或播放)的相互獨立的音頻信號。所謂聲道數,也就是聲音錄制時的音源數量或播放時的揚聲器數量。