NVIDIA A10 Tensor Core GPU 小型的單插槽 150W GPU 與 NVIDIA 虛擬化 GPU (vGPU) 軟件結合使用,易于管理、安全且有彈性(可依照各種需求進行調整),范圍涵蓋繪圖豐富的虛擬桌面基礎架構 (VDI) 以及人工智能,為設計師、工程師、藝術家和科學家提供高效能。
配置及亮點
1. 第三代 Tensor 核心
NVIDIA Tensor 核心技術最先運用在 NVIDIA Volta? 架構上,不只大幅加速人工智能,也將訓練時間從數周降至數小時,同時顯著提升推論速度。NVIDIA Ampere 架構以這些創新技術為基礎,采用全新精度標準 Tensor Float 32 (TF32))與 64 位浮點 (FP64),以加速并簡化人工智能應用,同時將 Tensor 核心效能拓展至高效能運算。
TF32 與 FP32 運作方式相同,無需更改任何程序代碼即可將人工智能速度提升至最高 20 倍。透過 NVIDIA 自動混合精度,研究人員只要多加幾行程序代碼,就可以利用自動混合精度和 FP16 將效能提升 2 倍。通過支持 bfloat16、INT8 與 INT4,更能為人工智能訓練和推論創造極致多元的加速器。
2. 第三代 NVLink
第三代 NVIDIA? NVLink? 可將 GPU 到 GPU 的直接帶寬翻倍,達到每秒 600 GB (GB/秒),比第二代 PCIe 速度快近 10 倍。搭配最新一代 NVIDIA NVSwitch? 使用時,服務器中的所有 GPU 都能透過 NVLink 全速相互交流,執行極高速的數據傳輸。
3. 結構化稀疏
現代人工智能網絡相當龐大且越來越大,有數百萬、甚至數十億個參數。精準預測與推論不需要用到所有參數,而有些參數可以轉換為零,以確保模型變「稀疏」的同時不會犧牲準確性。Tensor 核心最高可以將稀疏模型的效能提高 2 倍。將模型稀疏化對于人工智能推論有益,同時也能改善模型訓練效能。
4. 第二代 RT 核心
NVIDIA Ampere 架構的第二代 RT 核心可大幅提升電影作品的擬真渲染、建筑設計評估,以及產品設計的虛擬原型制作等工作負載的速度。RT 核心還能加速光線追蹤于動態模糊的渲染效果,以更快的速度獲得更高的視覺準確度。在執行著色或噪聲消除功能的同時,還能執行光線追蹤。
專業功能及應用
NVIDIA A10 Tensor Core GPU 集高性能與低功耗于一身,可成為企業在 AI 推理、訓練、圖形和傳統企業級計算工作負載等諸多方面的主流選擇。
1. 遠程協作
專為虛擬協作打造的開放式平臺 NVIDIA OmniverseTM,使用人員連接設計工具、資源和項目,在虛擬世界中進行協作式迭代,以往復雜的創作、設計和工程視覺工作流程也隨之改變。
2. 企業級
采用 NVIDIA RTX 虛擬化工作站軟件,達到與實體工作站無異的優化效能與穩定性。虛擬化工作站采用的是 RTX 企業級驅動程序,經過 100 多個獨立軟件供應商 (ISV)的多種產業應用程序和認證的廣泛測試。
3. 3D 可視化
運用 NVIDIA RTX? 虛擬化工作站 (vWS)軟件 來執行專業 3D 可視化。RTX 能以前所未有的速度完成無與倫比的 3D 設計、擬真模擬和令人驚艷的視覺效果。
4. 人工智能加速應用程序
運用 NVIDIA RTX. 將人工智能的強大功能運用于視覺運算。RTX 讓開發人員能夠創造人工智能應用程序,為終端用戶帶來前所未有的工作流程加速能力。如此一來就能透過智能操控影像、自動執行重復工作,以及優化需要高度運算的程序,來釋出時間和資源,大幅加速藝術家和設計師的創作過程。
5. 交互式渲染技術
通過連結一個或多個服務器來提升虛擬桌面效能,進而在應用程序檢視區中達到完整的互動與擬真可視化成果。運用共享的 GPU 加速數據中心資源集來執行虛擬化工作站和渲染節點,可提升生產力并更快速地完成項目。
規格
NVIDIA A10 Tensor Core GPU 采用單槽全長尺寸,被動式散熱設計,核心基于 GA102-890 SKU,擁有 72 組 SM 單元,9216 個 CUDA 核心,其基礎頻率為 855 MHz,可加速至 1695 MHz,384-bit 位寬,24 GB GDDR6 顯存、帶寬 600 GB/s,兼容 PCIe 4.0。顯卡的 TDP 為 150W,單 8-pin 供電接口。
* 與 NVIDIA 產品相關的圖片或視頻(完整或部分)的版權均歸 NVIDIA Corporation 所有。