破壞性資料壓縮
本條目存在以下問題,請協助改善本條目或在討論頁針對議題發表看法。
|
破壞性資料壓縮(英語:lossy compression)是一種數據壓縮方法,經過此方法壓縮、解壓的數據會與原始數據不同但是非常接近。它是與無失真數據壓縮相對的壓縮方法。破壞性資料壓縮又稱有損數據壓縮、失真壓縮、失真壓縮、不可逆壓縮。
「破壞性資料壓縮」的各地常用名稱 | |
---|---|
中國大陸 | 有損數據壓縮 |
臺灣 | 破壞性資料壓縮 |
破壞性資料壓縮藉由將次要的數據捨棄,犧牲一些品質來減少數據量、提高壓縮比。這種方法經常用於壓縮多媒體數據(音頻、影片、圖片),尤其常用於串流媒體以及互聯網電話領域。根據各種格式設計的不同,破壞性資料壓縮都會有代間損失——每次壓縮與解壓檔案都會帶來漸進的品質下降。
無損與有損壓縮簡介
無損壓縮可以在不失去任何資訊的條件下,將資料壓縮得更小。例如,當一張圖片儲存成數碼檔案時,圖片會轉換成一連串的點,再分別儲存每個點的顏色資訊。如果某張圖片由200個紅點構成,它將會以類似「紅點、紅點、...(重複197次)...、紅點」的格式儲存起來。在這個例子中,無損壓縮會改成用「200個紅點」這樣的格式來儲存這張圖片,就能不失去任何資訊的完成壓縮。
然而,若要保留原始檔案的所有資訊,資訊理論說明了,無論使用任何壓縮方法,檔案大小都無法低於一個下界。一個直觀的例子:壓縮後得到的zip檔案會比原始檔案更小,但一直重複壓縮同一個檔案並不會讓檔案大小變成0,因為原始檔案終究含有一定量的資訊。
有損壓縮卻可以突破這個限制。在很多情況下,資料會包含比必要的還多的資訊。例如,一張解像度過高的相片,其中的細節肉眼可能已無法辨識;同理,在一個音量很高的音頻片段中,一些細節可能是人耳難以察覺的。捨棄這些人類無法察覺的細節,就可以用更小的資料量,提供與原始資料相差無幾的感官體驗。有時也允許失去一部分可以察覺的細節,來達到更好的壓縮率。
失真壓縮的類型
有兩種基本的失真壓縮機制:
- 一種是有損變換編解碼,首先對圖像或者聲音進行採樣、切成小塊、變換到一個新的空間、量化,然後對量化值進行熵編碼。
- 另外一種是預測編解碼,先前的數據以及隨後解碼數據用來預測當前的聲音採樣或者圖像幀,預測數據與實際數據之間的誤差以及其它一些重現預測的資訊進行量化與編碼。
有些系統中同時使用這兩種技術,變換編解碼用於壓縮預測步驟產生的誤差訊號。
有損與無損壓縮比較
有損方法的一個優點就是在有些情況下能夠獲得比任何已知無失真方法小得多的檔案大小,同時又能滿足系統的需要。
有損方法經常用於壓縮聲音、圖像以及影片。有損影片編解碼幾乎總能達到比音頻或者靜態圖像好得多的壓縮率(壓縮率是壓縮檔案與未壓縮檔案的比值)。音頻能夠在沒有察覺的品質下降情況下實現10:1的壓縮比,影片能夠在稍微觀察品質下降的情況下實現如300:1這樣非常大的壓縮比。有損靜態圖像壓縮經常如音頻那樣能夠得到原始大小的1/10,但是品質下降更加明顯,尤其是在仔細觀察的時候。
當用戶得到失真壓縮檔案的時候,譬如為了節省下載時間,解壓檔案與原始檔案在數據位的層面上看可能會大相逕庭,但是對於多數實用目的來說,人耳或者人眼並不能分辨出二者之間的區別。
一些方法將人體解剖方面的特質考慮進去,例如人眼只能看到一定頻率的光線。心理聲學模型描述的是聲音如何能夠在不降低聲音感知品質的前提下,實現最大壓縮。
人眼或人耳能夠察覺的失真壓縮帶來的缺陷稱為壓縮失真。
失真壓縮實例
上面的圖像展示了用不同的失真壓縮方法壓縮同一幅圖像得到的檔案大小。這幅圖像選自事實上的測試圖像工業標準蓮娜圖。
一些失真壓縮演算法能夠扔掉「不重要」的資訊並且能夠保留「關鍵」的資訊。[1]
失真壓縮方法
- 分形壓縮
- JPEG
- JPEG2000,使用小波的JPEG下一代,同時亦支援無失真數據壓縮。
- JPEG XR
- 小波壓縮
- Cartesian Perceptual Compression:也叫做CPC
- DjVu
- ICER, Mars Rovers使用:使用小波所以與JPEG2000相關
- H.261
- H.263
- H.264/MPEG-4 AVC
- H.265/MPEG-H HEVC
- MPEG-1 Part 2
- MPEG-2 Part 2
- MPEG-4 Part 2
- VP4
- VP5
- VP6
- VP7
- VP8
- VP9
- AV1
- VC-1
- WMV - 微軟開發
- Motion JPEG
- MNG(支援JPEG sprites)
- Flash(也支援JPEG sprites)
- Ogg Theora(由於沒有專利限制而知名)
- Sorenson video codec
音樂壓縮
- MP2
- MP3
- AAC - 蘋果電腦使用
- WMA - 微軟開發
- ADPCM
- ATRAC
- Dolby AC-3
- Musepack
- Ogg Vorbis(由於沒有專利限制而知名)
- Opus(由於沒有專利限制而知名)
- aptX/ aptX-HD[2]
- LDAC[3][4]
- MQA(在某些情況下,可以無失真復原)
其他類型數據
從技術的角度來講,去除文字母音字母也可以看作是破壞性資料壓縮的一種方法,只有子音的情況下根據上下文通常也仍然可以閱讀。研究人員也曾經半開玩笑地用字典中的短單詞替換長單詞或者使用生成文字技術(generative text techniques)[1] (頁面存檔備份,存於互聯網檔案館) 進行文字壓縮,儘管這種方法有時是屬於相關的(有損數據轉換領域。
參見
外部連結
- 有損音頻壓縮 (頁面存檔備份,存於互聯網檔案館),五種有損音頻格式壓縮速度與能力的比較。
- PNG image compression (research)有損PNG圖像壓縮
- using lossy GIF/PNG compression for the web (article) (頁面存檔備份,存於互聯網檔案館)用於網絡的有損GIF/PNG壓縮
參考文獻
- ^ Norris, Dennis; Kalm, Kristjan. Chunking and data compression in verbal short-term memory. Cognition. 2021-03-01, 208. ISSN 0010-0277. doi:10.1016/j.cognition.2020.104534.
- ^ aptX HD - lossless or lossy?. AVHub. 2016-11-22 [2018-01-13]. (原始內容存檔於2018-01-14).
- ^ Darko, John H. The inconvenient truth about Bluetooth audio. DAR__KO. 2017-03-29 [2018-01-13]. (原始內容存檔於2018-01-14).
- ^ What is Sony LDAC, and how does it do it?. AVHub. 2015-08-24 [2018-01-13]. (原始內容存檔於2019-10-20).