最新版本為數百萬用戶實現一流的音頻效果。
人人都希望自己的話語得到有效傳達?,F在,越來越多的人會在居家辦公時進行視頻通話或直播。提高聲音在線體驗的關鍵在于提供豐富的音頻功能,并避免出現回聲卡點和狗叫聲等背景噪音。
NVIDIA Maxine 提供了 GPU 加速且支持 AI 軟件開發套件,可幫助開發者構建可擴展的低延遲音頻和視頻效果管線,提高通話質量和用戶體驗。
今天,NVIDIA 在 GTC 大會上宣布,為了實現更好的音質,將為 Maxine 添加回聲消除和基于 AI 的上采樣技術。
回聲消除可實時消除音頻流中的回聲,即使在模糊不清的通話過程中也能夠保持高質量語音。借助基于 AI 的技術,Maxine 實現了比傳統數字信號處理算法更有效的回聲消除。
音頻超分辨率可使用基于 AI 的技術恢復較高頻段中丟失的能量,提高低帶寬音頻信號的質量。Maxine 音頻超分辨率支持將音頻從 8 kHz(窄帶)到 16 kHz(寬帶)、從 16 kHz 到 48 kHz(超寬帶)以及從 8 kHz 到 48 kHz 的上采樣。較低的采樣率(例如 8 kHz)通常會導致聲音含糊不清,并會突出齒音等瑕疵,導致語音難以理解。
為了保持原始信號的保真度和清晰度,現代影視工作室通常使用 48 kHz(或更高)的采樣率錄制音頻。音頻超分辨率可幫助恢復時間久遠的音頻錄音(例如源自磁帶或其他低帶寬介質的音頻錄音)的保真度。
彌合音質差距
大多數現代電信都使用寬帶或超寬帶音頻。由于 NVIDIA 音頻超分辨率可以實時上采樣和恢復窄帶音頻,因此該技術可有效彌合傳統銅質電話線與現代 VoIP 寬帶通信系統之間的音質差距。
有了 Maxine,無論是在電話會議、呼叫中心還是各類直播中,實時通信都實現了巨大的飛躍。
自初次發布以來,Maxine 已為多家全球領先的視頻通信、內容創作和直播提供商所采用。
據 Fortune Business Insights 稱,預計到 2028 年,全球視頻會議市場將由 2021 年的 63 億美元增長到近 130 億美元。
WFH 已成為一種生活方式
居家工作(或 WFH)已經成為各公司普遍認可的常態,而且各公司也正在調整新的期望值。
據分析公司 Gartner 估計,到 2024 年,將僅有四分之一的企業會議采用現場召開的方式,低于疫情前的 60%。
在過去兩年的疫情期間,人們一直采用混合或遠程辦公,虛擬協作在美國發揮了重要作用。
但是,組織為了保持公司文化和工作場所體驗,需要更高質量的媒體互動,而風險也會隨之增加。
解決“雞尾酒會問題”
但是,有時工作與家庭生活會發生沖突。因此,會議時常會充斥著孩子的吵鬧聲、戶外施工聲或緊急車輛警報聲等背景噪音,導致電話會議出現短暫中斷。
Maxine 可幫助解決這個由來已久的稱為雞尾酒會問題的音頻問題。借助 AI,它可以過濾掉不需要的背景噪音,讓用戶無論是居家辦公還是在路上,都能讓通話另一方更清晰地聽到自己的聲音。
Maxine GPU 加速平臺提供了一個端到端的深度學習管道,它集成了可定制的一流模型,通過標準麥克風和攝像頭提供高質量功能。
展現你最佳的聲音效果
除了受背景噪音影響之外,虛擬活動中的音頻質量有時可能聽起來比較微弱、缺少中低頻率,甚至幾乎聽不見。
Maxine 支持實時上采樣音頻,因此聲音更加飽滿、深厚和清晰。
羅技:提升了耳機和 Blue Yeti 麥克風音效
為了更好地與熱門耳機和麥克風交互,領先的外設制造商羅技采用了 Maxine。
羅技利用 AI 庫將 Maxine 直接集成到 G HUB 音頻驅動中,無需額外軟件即可增強與設備的通信。Maxine 在 NVIDIA RTX GPU 中采用功能強大的 Tensor Core,讓消費者可以實時處理麥克風信號。
當前,羅技在其 G HUB 軟件中采用了 Maxine 先進的降噪技術。這使其可以消除干擾視頻會議或直播會話的回聲和背景噪音(例如風扇、鍵盤和鼠標點擊聲)。
羅技 G 總經理 Ujesh Desai 表示:“有了 NVIDIA Maxine,羅技 G 游戲玩家只需單擊一下即可快速輕松地清除麥克風信號和消除不必要的背景噪音。您甚至可以使用 G HUB 測試麥克風信號,確保已接入 Maxine 設置?!?/span>
騰訊云提高內容創作者效率
騰訊云通過提供 NVIDIA Maxine 技術,助力內容創作者的生產制作,幫助他們輕松快速地添加創意背景。
NVIDIA Maxine 具有 AI 綠屏功能,因此用戶無需使用傳統的綠屏,即可通過高質量的前景和背景分離打造更加身臨其境的臨場感。將真實背景分離后,可以輕松地將背景替換為虛擬背景,或進行模糊處理營造場景深度效果。騰訊云將這種新功能作為軟件即服務包提供給內容創作者。
“NVIDIA Maxine 的 AI 綠屏技術無需專用設備和照明,即可實現更加身臨其境的高質量體驗,幫助內容創作者創作作品?!?騰訊云音視頻平臺產品中心總監 Vulture Li 表示。
提升虛擬體驗
NVIDIA Maxine 具有一流的實時 AI 音頻、視頻和增強現實功能,可內置于可定制的端到端深度學習管道中。
Maxine 提供的 AI 驅動的 SDK 可幫助開發者創建應用,提供音頻和圖像降噪、超分辨率、視線校正、3D 人體姿態估計和翻譯功能。
Maxine 還能將語音實時翻譯為文本,而且支持的語種越來越多。在 GTC 大會上,NVIDIA 演示了使用 Maxine 在英語、法語、德語和西班牙語之間進行互翻。
這些效果將令數百萬人在任意設備上暢享引人入勝的高品質直播視頻。