據悉,4 月 12 日,知名 IT 工程師法布里斯·貝拉研發并推出了新的音頻壓縮工具——TSAC。此工具能夠將音頻數據進行極高效的壓縮處理,其中針對 44.1 kHz 的音頻,其單聲道壓縮能力可達到 5.5kb/s,而立體聲則能達到 7.5kb/s,且極佳地保留了音質。據稱,TSAC 甚至可以將長達 3.5 分鐘的立體聲音樂壓縮成僅需 192KiB 的文件。(1 KiB = 1024 B)
TSAC 官方網站提供了一系列原始音頻與壓縮音頻的對比試聽資源:https://bellard.org/tsac/TSCA。該壓縮技術基于為立體聲擴展的 Descript 音頻編碼器以及Transformer 模型,旨在提升壓縮效率。這兩個模型均采用 8 位參數化設計。
由于壓縮過程中涉及到CUDA調用,因此建議使用英偉達GPU。若僅使用CPU,壓縮速度將會極為緩慢,并且要求CPU具備AVX2指令集支持。
TSCA 的創作者法布里斯·貝拉,作為業界知名的計算機程序員,IT之家對其有如下簡介:
法布里斯·貝拉,1972年出生于法國格勒諾布爾(Grenoble)。在高中時期,他就已成功開發出著名的LZEXE可執行壓縮程序,成為當時DOS系統上首款廣泛應用的文件壓縮軟件。畢業于巴黎綜合理工學院和巴黎高等電信學校。
1997年,他提出了世界上最快的計算圓周率的算法。2000年,他創立了FFmpeg項目,這是一個領先的開源多媒體框架,被眾多媒體播放器所采納。此外,他還撰寫了QEMU,這是一款高速且跨平臺的開源模擬器。
-
模型
+關注
關注
1文章
3243瀏覽量
48840 -
音頻編碼器
+關注
關注
0文章
14瀏覽量
9132 -
壓縮技術
+關注
關注
0文章
14瀏覽量
8385
發布評論請先 登錄
相關推薦
評論