8月27日下午,“機器人智能論壇”以線上分享的形式圓滿舉行。
該活動由中國人工智能學會主辦,中國人工智能學會認知系統與信息處理專委會、南京清湛人工智能研究院承辦,北京容天匯??萍加邢薰?、鎂客網協辦。
在歷時4個半鐘頭的分享環節,來自產業、學術和應用三個方向的嘉賓,構成了一個產學用全方位的“三方對話”,圍繞智能機器人相關主題帶來了各自的精彩分享。
陳學超 北京理工大學機電學院教授、博士生導師
——仿人機器人高動態跳躍運動關鍵
在陳學超看來,仿人機器人是智能機器人的一種高級形態,具有兩手、兩腿、頭部和軀干等人類外形顏色特征,整機有30至60個自由度,有著復雜的多體動力學系統,在公共安全、國防、社會服務等領域應用前景廣泛。
回顧仿人機器人發展歷程大事記,自1973年日本早稻田大學研發出首臺可行走仿人機器人之后,包括日本本田公司的ASIMO、波士頓動力公司的Altas等都是里程碑式的產品。
而從自身研究項目出發,陳學超表示跳躍能力對仿人機器人增長運動敏捷性和環境適應性有著重大意義,意味著機器人能夠在室內外、野外環境中做到跑得快、跳得高,同時能夠執行多種靈巧作業任務。其中所涉及的核心部件和多模態運動技術,也是其匯童仿人機器人項目當下的研究重點。
陳學超闡述道,經過對跳躍運動階段劃分并進行特點分析后得到總結,機器人:
起跳階段——要求硬件本體需要做到大力矩、高轉速,規劃、控制方面做到協全身、精跟隨;
落地階段——要求硬件本體需要做到強回驅,規劃、控制方面做到柔著地。
這一前提下,陳學超也指出,傳統仿人機器人關節(電機+諧波)力矩達到,但轉速低、回驅性弱,無法滿足需求,一般四足機器人關(電機+行星)也因為力矩小而難以適用。針對這一點,他也提出了一些解決方案,包括采用高磁能密度硬磁材料打造高扭矩密度電機,并基于多物理場綜合優化技術提升轉矩,以及模擬人體肌肉布局作仿生跨關節耦合驅動,同時優化變速結構比等等。
此外,針對特斯拉、小米等企業對仿人機器人的布局,陳學超表示這類企業的入局將推動人工智能技術在仿人機器人產品上的落地,進而推動仿人機器人整體產業的發展。與此同時他也指出,小米能夠在幾個月內打造一臺仿人機器人,并完成一些基本操作,也是從另一個角度告訴大家,仿人機器人研發的行業門檻較之前已經有所降低。
葛榮駿 東南大學計算機科學與工程學院副教授
——用算法彌補國產成像設備硬件不足
圍繞人工智能與機器人產業,醫學是一個繞不過去的細分市場,其中關于影像設備成像,更是一個重點研究方向。
葛榮駿表示,眼下國內醫學影像設備正被國外企業壟斷,國產設備則存在成像質量不足的問題。他以CT為例,常規CT存在輻射劑量較大、軟組織分辨率較低等問題,既會給孕婦、新生兒等高敏感人群帶來較大安全風險,也會對其臨床應用范圍造成諸多約束,同時不同診療場景的CT成像也受制于采集數據信噪比低或數據稀疏不全等問題。市場側,85%以上相關設備市場則是被國外公司GPS壟斷。
針對國產設備成像不足的問題,葛榮駿表示可以通過成像算法來進行彌補——基于不同臨床診療需求場景,非理想采樣條件的下優質CT成像算法。
圍繞這一研究,葛榮駿也指出傳統成影方法“解析重建”需要高質量且完整的投影數據,無法應對低劑量和不完備數據重建,且特征提取能力弱,容易引起二次偽影,同時迭代速度慢,科學挖掘點少。
在這一基礎上,基于特征學習的CT成像算法受到關注,包括基于單層特征學習的字典學習算法、基于深度特征學習的重建算法。其中,深度特征學習能快速、充分地利用單層特征和各級深度特征,在最終效果上優于單層特征學習。
李雨倩 NVIDIA自主機器技術專家
——基于Isaac Sim平臺為機器人訓練“提速”
不管是算法開發,還是智能機器人研究,過程中總是需要大量的數據處理與模型測試、驗證。而如果這些工作全部交由單個項目或企業來進行,將面臨時間長、挑戰大、成本高,以及相關場景中結構化環境缺失等問題。
針對這一點,李雨倩提出的解決方案是NVIDIA Isaac Sim,這是一個建立在數字孿生Omniverse平臺上的機器人模擬應用與合成數據生成工具,能夠提供真實準確的自然世界虛擬表示,允許導入各種對象類型,包括CAD文件,以生成在邏輯上與現實世界無法區分的模擬環境。
李雨倩表示,在Isaac平臺,僅需要4個步驟就可以完成一個閉環應用的開發:
模型訓練——通過Isaac Replicator(形成虛擬合成數據集)、Tao Toolkit(訓練預訓練的模型)工具對機器人進行訓練;
仿真——在整個Omniverse環境下,基于Isaac Sim對整機進行仿真和測試,模型訓練好,整機算法測試完成之后就到第三步搭建;
搭建——在機器人本體嵌入式計算平臺Jetson上,利用Iassc ROS GEMs、RIVA、Nova Orin等來做一個整個機器人的搭建;
部署&管理——利用Triton做多個資源的調動管理,利用CuOpt做大場景下機器人最優路徑的規劃……
“實際環境測試之后會暴露出機器人本身的一些問題和模型的不足,就可以回到第一步再完成一個訓練?!?/span>
此外,李雨倩也總結稱,該平臺有測試場景和樣本,可以直觀體驗Isaac Sim的一些功能;可以跟ROS生態進行互動;增加了AI的屬性,包括強化學習等都集成在里面,基于這些優勢,將能夠幫助大家快速搭建自己的應用,開發一個更智能的、具有AI屬性的機器人。
王亮 NVIDIA高級解決方案架構師
——硬件加速機器人仿真與訓練
面向海量數據處理與模型測試與驗證,除了平臺層面各類軟件工具的協助,背后的算力支撐也是不可或缺的。針對這一點,王亮主要從NVIDIA A40和A100兩款產品進行講解。
其中,提及A40就不得不提到“NVIDIA OVX”,這是為了在Omniverse中運行數字孿生模擬而創建的數據中心級計算系統,由8塊NvidiaA40 GPU、3塊Nvidia ConnectX-6 Dx200 Gbps網卡、雙Intel Ice Lake 8362 CPU、1TB系統內存和16TB NVMe存儲組成,啟用RDMA以實現最低延遲,支持精確計時 (PTP),可擴展以滿足工作負載需求。
并且,當使用Spectrum-3交換機連接時,OVX計算系統可以從包含8臺OVX服務器的單個Pod擴展到32臺OVX服務器的超級Pod。多個超級POD可以用于部署更大的仿真需求。
至于A100,王亮表示“A100 80GB PCIE”是世界上性能最高的AI超級計算GPU,也是主流EGX服務器的靈活部署選項。性能方面,相較于上一代產品,面對仿真、AI訓練等應用均得到了數倍的提升。
同時,王亮也提到了基于A100打造(20臺起步)的DGX SuperPOD系統,串聯后將形成一站式AI超級計算機,基于并行計算實現大規模AI模型的構建、訓練和部署。
孫玉潔 中國兵器工業集團高級工程師
——未來機器人作戰樣式
就分類來看,智能機器人可以分為多種類型,工業機器人體量最大,消費級商用機器人更為貼近日常生活,特種機器人則較為少見,其歸屬下的軍用機器人,更是“神秘”。
對此孫玉潔講到,軍用機器人依據作戰環境的不同分為地面軍用機器人、空中軍用機器人、其他軍用機器人(如無人艇、無人船等)。
提及需求,軍用機器人部隊則是需要做到三點,分別是能夠聚焦全維感知、街區突貫、要點奪控、樓宇清繳等城市作戰環境,實現信息主導、火力主戰、智能主控、體系致勝,做到多域精確跨域協同。
只是就目前來看,軍用機器人部隊在構建上還存在一些短板,這也對當前業界提出了幾點建議:
第一,發展機器人彈性算力和可拓展的硬件平臺,設計相關接口和標準協議,基于“軟硬解難”思路,提升硬件能力;
第二,完成地面軍用機器人、空中軍用機器人及其他機器人部隊體系要素的需求論證;
第三,統籌推進相關科技競賽,以及優質智能技術成果的轉化應用。
屆時,比如空中機器人,將能夠做到集偵查、監視、軟干擾和硬打擊于一體,以及長時滯空、空中戰場遮斷、空中格斗等等。地面機器人則將呈現“無人軍團”模式,就像電影中的機械戰士。
黃洪波 墨影科技聯合創始人、VP
——機器人產業“非標+長尾”現象如何破局?
黃洪波以冰山作比,浮出水面的一小塊冰山是如今簡單容易的項目或值得投入的大客戶,但另外沉在水面下、體積占比約80%的冰山則代表著那些無法被觸達和滿足的大量潛在需求機器人和自動化改造的行業和項目。
這也導致雖然機器人市場各垂直場景的價值達到了千億級、萬億級,大量機器人公司和集成商也僅僅是在“冰山一角”中進行競爭。
為什么會這樣?黃洪波解釋道,機器人企業開拓產品、集成商部署項目少則一兩年,多則三五年,投入資源重、周期長、成本高迫使他們提高報價、延長實施周期,繼而導致機器人和自動化改造價格高、周期長。但對于客戶來說,他們的需求是快速完成機器人和自動化改造,降低產險停產時間,實現降本增效目的,也因此,低價格、短周期的壓力自然而然就給到了企業和集成商,最終造成機器人企業、集成商普遍存在低價競爭、虧本賺吆喝現象?!斑@就是一個惡性循環?!?/strong>
當然,目前存在的“非標+長尾”現象只是機器人產業發展過程中階段性的必然結果,“需求種類和數量進一步增加,單一廠商的能力和開發速度逐漸無法滿足所有需求, 跨廠商系統集成又異常復雜,與此同時很多客戶想用機器人和自動化,但需求和場景各不相同,導致非標+長尾?!?/span>
至于如何破局,響應“更快滿足急速增長的客戶需求、更快更簡單地開發新產品新功能”的趨勢,黃洪波則是提出“平臺型系統”。在其看來,平臺型系統將能夠提供行業基礎共性功能,簡化開發流程, 整合上下游,進而共同促進行業爆發。
楊磊 南京清湛人工智能研究院執行副院長
——“云+邊+端”架構賦能機器人視頻感知
在楊磊看來,產業內諸多公司為機器人的感知和計算基礎都提供了杰出的支撐,但就目前來說,“感知”依舊是機器人技術發展的一個重要瓶頸。
其中,視頻感知不同于以往更多討論的機器視覺,所處理的數據基本上是實時連續幀圖片序列,需要處理的數據量更大,且多數數據都沒有經過加工處理器,落地之后更具實用性,是眼下計算機視覺與人工智能領域發展比較活躍的研究方向。
“相較于視頻監控,視頻感知除了要獲取數據、分析數據,還要理解視頻內容以及目標前后關系?!?/strong>
而就落地來看,隨著工業場景新需求的出現,傳統視頻監控已經不足以完成安全保障等方面的新挑戰,視頻感知逐漸在工業場景獲得極大應用。
與此同時,就機器人整個發展來看,“原先機器人平臺算力較小,存在巨大的算力障礙,而現在提出的新架構——‘云-邊-端感知架構’,依據不同場景需求通過云端或邊端的算力去解決算力不足的問題,幫助進行視頻運算和解析,這是未來發展的一個重要方向?!?/span>
針對這一點楊磊也說到,清湛人工智能研究院采用“云+邊+端”架構打造了一套基于視頻行為分析的智能監造系統,在前端網絡中增加邊緣分析設備,基于計算機視覺深度學習技術,構建專有的安全生產預警模型,是面向大型企業用戶,提供簡單、易用、優質視覺算法的開放平臺。