近日,昆仲天使投資企業「戴盟機器人」聯合創始人兼首席科學家王煜受邀出席以“讓AI成為創新生產力”為主題的聯想Tech World2025創新科技大會。大會上,二百余位產學研各界精英與權威專家匯聚一堂,共同分享具身智能的最新科研成果及實踐經驗,積極探索 AI 技術在具身智能領域的創新突破路徑與商業化落地模式。
圍繞機器人如何獲得豐富的操作能力、機器人如何落地實用場景等問題,王煜教授分享了《具身智能——機器人操作技能與人工智能技術融合》的主題演講。
機器人落地工業應用場景,關鍵在于靈巧操作能力
王煜教授在演講之初提出:今年或為人形機器人工業應用元年。他強調,機器人實現工業場景落地的核心在于突破精細操作與任務泛化能力——一旦機器人掌握靈巧操作技能,其應用場景將廣泛拓展。
以半導體和電子產品的制造場景為例,雖然前端工序已高度自動化,但后端異形零件裝配仍嚴重依賴人工。普通工人經短期培訓即可勝任的工作,對機器人卻是巨大的挑戰。王煜教授認為,機器人系統需構建具備認知決策能力的“大腦”與泛化操作能力的“小腦”協同架構,讓機器人真正擁有靈巧操作的能力。
機器人無法完成簡單任務的背后——論觸覺對于靈巧操作的重要性
王煜教授指出,當前業界普遍采用視覺-語言-動作(Vision-Language-Action,VLA)大模型來實現機器人操作。在該框架下,視覺模塊(V)使機器人能夠解析環境場景,語言模塊(L)幫助其理解操作指令,而動作模塊(A)則負責將語義信息轉化為具體的運動、操作執行。然而他強調,機器人實現從語言理解到精準動作的執行仍面臨挑戰。
他補充,實現機器人的基礎移動功能(Locomotion)相對簡單,而使其完成復雜操作任務(Manipulation)則有難點——這要求機器人必須掌握真正的操作技能與執行能力。
人類可以輕松完成擰螺絲、擰瓶蓋等操作,這得益于雙手敏銳的觸覺、力覺反饋和手指形變等感知信息。但對機器人而言,這些看似簡單的動作卻極具挑戰——關鍵在于缺乏觸覺感知。沒有觸覺感知的機器人,不僅操作速度緩慢,更難以完成精細、復雜的任務。
王煜教授介紹,戴盟在開始做人形機器人之初,便將觸覺傳感器確立為最重要的產品開發。今年4月,戴盟發布了全球首款多維高分辨率高頻率視觸覺傳感器DM-Tac W。DM-Tac W采用了基于單色光的圖案追蹤原理的技術路線,成功攻克了視觸覺傳感器算力要求高、發熱量大、耐用性差等難題,顯著降低了生產成本。
DM-Tac W賦予夾爪等執行末端類人觸覺能力,已應用于工業自動化、消費電子、智慧物流等場景。基于此,戴盟還將視觸覺傳感器的厚度開創性地減少到毫米級別,可輕松集成于五指靈巧手等執行末端。
業界共識與趨勢:通過大規模、高質量數據進行機器人模仿學習
王煜教授引用其導師Matthew Mason的觀點指出:機器人操作面臨的根本挑戰在于與真實世界的交互,真實世界既遵循物理規律,又充滿不確定性——并非所有現象都能被完全理解和預測。若缺乏豐富的感知能力,機器人將難以應對環境變化,從而影響任務完成度。
今年,戴盟全球首款多維高分辨率高頻率視觸覺傳感器DM-Tac W,已在具身智能領域樹立了技術與產品的雙重標桿,基于前沿的觸覺感知技術,戴盟將持續挖掘機器人學習方法。
王煜教授分享了行業最新動態:波士頓動力與英偉達達成戰略合作,共同開發基于人類行為建模的“大行為模型”(Large Behavior Model)。該技術路線不依賴傳統物理事件模型,采用仿真數據建立基礎的模型,通過引入真實數據來進行訓練并得到真實可靠的模型,進一步引入操作與人機交互的真實數據來提升模型可靠性。
他提到,當前機器人模仿學習主要采用兩種訓練路徑:一是通過仿真環境生成的數據進行訓練,二是通過真實物理世界中機器人操作的數據進行訓練。第二種方式需要大規模、高質量數據支撐,低質量數據反而會影響學習效果。為此,戴盟推出了穿戴式遙操作系統DM-EXton,專為機器人遠程操控、數據采集及學習訓練而設計。
從神經科學視角看機器人設計:聚焦于核心功能需求
王煜教授還從神經科學的角度分享了他對未來機器人設計的思考。人類大腦皮層的功能分配揭示了操作能力的生物學基礎,通過經典的感官腦皮小人(Sensory Homunculus Model)可見,大腦皮層中負責面部和手部功能的區域占據了最大比例,這印證了人類的智慧主要服務于精細操作、語言交流和社會互動等需求。
他認為,真正實用的機器人未必會完全仿照人類形態,而是聚焦于核心功能需求。未來的機器人可能會擁有一雙高度發達的手,憑借強大的感知能力、豐富的靈巧度完成精細、復雜的操作任務,滿足不同落地場景的需求,展現真正的社會價值。