2025年3月7日,由《機(jī)器人技術(shù)與應(yīng)用》雜志社發(fā)起并聯(lián)合中國機(jī)電一體化技術(shù)與應(yīng)用協(xié)會、天津大學(xué)和南開大學(xué)主辦的「2025具身智能機(jī)器人發(fā)展大會」在天津國家會展中心成功舉辦!數(shù)千人齊聚,聚焦具身智能機(jī)器人產(chǎn)業(yè)前沿話題,剖析產(chǎn)業(yè)風(fēng)口,共同探尋產(chǎn)業(yè)融合與落地的方向。 在上午的院士專家報告環(huán)節(jié)中,浙江大學(xué)教授熊蓉圍繞《人形機(jī)器人具身智能發(fā)展挑戰(zhàn)與進(jìn)展》這一主題,展開了主題報告。
一、技術(shù)演進(jìn)路徑解析
二、產(chǎn)業(yè)驅(qū)動要素分析 人力需求矛盾:康養(yǎng)、智能制造等領(lǐng)域面臨結(jié)構(gòu)性用工短缺。特別是在汽車裝配等復(fù)雜作業(yè)場景,現(xiàn)有自動化設(shè)備難以替代人類的多技能操作,而人形機(jī)器人具備共用空間作業(yè)的天然優(yōu)勢。 產(chǎn)業(yè)鏈基礎(chǔ):汽車與機(jī)器人產(chǎn)業(yè)積淀為人形機(jī)器人發(fā)展提供供應(yīng)鏈支撐,涵蓋精密傳動、傳感器、算力模塊等關(guān)鍵環(huán)節(jié)。 技術(shù)集群突破:深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)算法與大模型技術(shù)的成熟,為行為智能突破提供算法基座;仿真訓(xùn)練技術(shù)(如英偉達(dá)Sim2Real)則加速迭代進(jìn)程。 高盛預(yù)測,如能克服產(chǎn)品設(shè)計、材料、技術(shù)、成本及公眾接受度等障礙,到2035年人形機(jī)器人市場規(guī)模將達(dá)1520億美元,與電動汽車市場旗鼓相當(dāng)。 三、主要發(fā)展趨勢 從專用轉(zhuǎn)向通用:人形機(jī)器人研發(fā)正聚焦通用性能力突破,強(qiáng)調(diào)適應(yīng)多場景、多任務(wù)需求。 從高動態(tài)運(yùn)動轉(zhuǎn)向智能移動操作:波士頓動力雖展示高動態(tài)運(yùn)動能力但產(chǎn)業(yè)化滯后,而特斯拉Optimus等產(chǎn)品引發(fā)產(chǎn)業(yè)界關(guān)注的核心在于智能移動操作能力的實(shí)用性價值,這標(biāo)志著行業(yè)從單一功能向綜合智能的演進(jìn)。
四、四大核心挑戰(zhàn) 數(shù)據(jù)稀缺性:接觸交互數(shù)據(jù)獲取成本高昂,現(xiàn)有操作數(shù)據(jù)采集方案(如實(shí)時標(biāo)注、仿真生成)難以滿足高質(zhì)量需求。 仿真到現(xiàn)實(shí)鴻溝:現(xiàn)有仿真平臺(如英偉達(dá)Sim2Real)對毫米級接觸交互的物理建模精度不足。 通用性與可靠性矛盾:工業(yè)應(yīng)用要求高精度(0.1mm級)、高可靠性(99.99%成功率),而通用性設(shè)計需兼顧泛化能力,需在算法架構(gòu)層面實(shí)現(xiàn)平衡。 硬件性能制約產(chǎn)業(yè)化:驅(qū)動器功率密度需突破3.5kW/kg閾值,傳感器動態(tài)跟蹤精度需達(dá)0.01°級,可靠性指標(biāo)亟待提升至20000小時MTBF。
五、創(chuàng)新中心技術(shù)突破與實(shí)踐 全身協(xié)調(diào)控制:通過強(qiáng)化學(xué)習(xí)+機(jī)理控制融合,實(shí)現(xiàn)上半身作業(yè)與下半身穩(wěn)定的動態(tài)耦合。實(shí)驗表明,在5kg負(fù)載、0.1mm精度作業(yè)下,機(jī)器人可保持長時間擬人化站立(>1小時),行走速度達(dá)1.5m/s。 復(fù)雜地形適應(yīng):開發(fā)單一神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)多地形(平地、斜坡、臺階、不平整路面)自適應(yīng)行走,通過遺忘抑制算法解決多場景學(xué)習(xí)干擾問題。 2.操作智能體系構(gòu)建 視覺伺服系統(tǒng):構(gòu)建通用伺服控制模型,實(shí)現(xiàn)無紋理物體抓取(精度0.5mm,成功率99.99%)、M4-M6螺絲裝配等精細(xì)操作,訓(xùn)練效率提升百倍。 元動作學(xué)習(xí)框架:在仿真環(huán)境中訓(xùn)練開關(guān)操作、插拔動作后,可直接部署至實(shí)體場景,支持?jǐn)_動適應(yīng)與誤差容限。 3.快速部署能力提升 語義導(dǎo)航:結(jié)合視覺與語言指令,實(shí)現(xiàn)目標(biāo)場景自主定位(如"找到沙發(fā)"),支持動態(tài)障礙物規(guī)避。 工具鏈開發(fā):構(gòu)建標(biāo)準(zhǔn)化腿足、輪臂硬件平臺,配套智能感知規(guī)劃SDK,使場景部署周期縮短至1.5小時(實(shí)習(xí)生可操作)。 人形機(jī)器人與具身智能正處于技術(shù)爆發(fā)前夜,其產(chǎn)業(yè)化進(jìn)程取決于數(shù)據(jù)、算法、硬件的協(xié)同突破。熊蓉教授表示,浙江人形機(jī)器人創(chuàng)新中心將持續(xù)深耕核心關(guān)鍵技術(shù),推動具身智能從實(shí)驗室走向大規(guī)模應(yīng)用,為智能制造與公共服務(wù)領(lǐng)域提供變革性解決方案。