近日,南京大學(xué)黨委書記、中國科學(xué)院院士譚鐵牛在2025中國具身智能大會(huì)(CEAI 2025)作題為“具身智能:學(xué)科交叉的新前站”的主題演講。他表示,具身智能是發(fā)展人工智能的重要路徑,是學(xué)科交叉和新一輪科技革命的新前沿,是發(fā)展新質(zhì)生產(chǎn)力的重要引擎,產(chǎn)業(yè)界要多措并舉,理性務(wù)實(shí)推動(dòng)具身智能創(chuàng)新發(fā)展。
譚鐵牛,中國科學(xué)院院士。他在學(xué)術(shù)領(lǐng)域成績斐然,是模式識別與計(jì)算機(jī)視覺專家,主要從事模式識別、圖像處理和計(jì)算機(jī)視覺方面的研究。他提出了基于定序測量的虹膜識別理論等多項(xiàng)重要理論和方法,解決了虹膜圖像獲取、視覺計(jì)算病態(tài)問題等諸多難題。他主持過眾多科研項(xiàng)目,出版編(專)著14部,發(fā)表論文600多篇,獲得授權(quán)發(fā)明專利100多項(xiàng),還獲得了國家自然科學(xué)二等獎(jiǎng)、國家技術(shù)發(fā)明二等獎(jiǎng)等多項(xiàng)獎(jiǎng)勵(lì),2022年獲國際模式識別領(lǐng)域最高獎(jiǎng)—傅京孫獎(jiǎng)。具身智能(Embodied Intelligence)最早由艾倫·圖靈于1950年提出,其核心定義為:?物理實(shí)體通過與外部環(huán)境持續(xù)交互而不斷增長的智能?。人類智能的形成即源于此過程,如貓的智能水平差異實(shí)驗(yàn)表明,與外界交互的程度直接影響智能發(fā)展。譚鐵牛教授曾深入解讀漢字 “智” 的精妙之處。他指出,祖先在創(chuàng)造 “智” 字時(shí),其獨(dú)特的造字邏輯 ——“知” 與 “日” 的巧妙結(jié)合,蘊(yùn)含著 “知識需經(jīng)實(shí)踐積累方能升華” 的具身思想。《荀子?正名》中有言:“所以知之在人者謂之知。” 也就是說,通過學(xué)習(xí)獲取對外部世界的認(rèn)識和了解,這便是 “知識” 之 “知”。然而,僅僅擁有知識還不夠,只有將這些知識經(jīng)過深入思考,并與外部實(shí)際進(jìn)行驗(yàn)證,才能上升為對外部世界規(guī)律性的認(rèn)知。“智” 字為上下結(jié)構(gòu),“知” 代表知識,“日” 則象征著時(shí)間、經(jīng)驗(yàn)和經(jīng)歷。由此可見,“智” 是由知識的積累以及時(shí)間經(jīng)歷的沉淀共同構(gòu)成的,這其中就深刻地體現(xiàn)了具身的概念。具身智能作為生物智能形成的基礎(chǔ),對其展開深入研究,無疑會(huì)對認(rèn)知科學(xué)的發(fā)展起到巨大的促進(jìn)作用。譚鐵牛教授進(jìn)一步闡述了具身智能的發(fā)展歷程,將其劃分為三個(gè)重要階段:萌芽起步期(1940—2000):在這一時(shí)期,具身智能的研究主要停留在認(rèn)知學(xué)的理論探討層面,以及一些早期的實(shí)驗(yàn)性嘗試階段。當(dāng)時(shí),模式識別、控制技術(shù)、機(jī)械工程等領(lǐng)域各自獨(dú)立發(fā)展,未能形成一股合力,構(gòu)建出具身智能的系統(tǒng)級架構(gòu)。
技術(shù)積累期(2000—2022):隨著深度學(xué)習(xí)技術(shù)取得重大突破,人工智能的各個(gè)分支學(xué)科都得到了迅猛發(fā)展。“深度學(xué)習(xí) + 機(jī)器人智能化” 的水平不斷提升,與此同時(shí),各學(xué)科開始圍繞 “具身化” 這一核心逐漸展開融合研究。但這一階段的研究更多地集中在單一任務(wù)的泛化性方面,缺乏對一體化具身智能的系統(tǒng)性研究。
快速發(fā)展期(2022— 至今):大模型的創(chuàng)新性突破,為具身智能的研究注入了強(qiáng)大動(dòng)力,使其步入了發(fā)展的快車道。如今,人工智能、機(jī)器人技術(shù)、虛擬仿真以及認(rèn)知學(xué)等眾多學(xué)科領(lǐng)域,開始圍繞具身智能呈現(xiàn)出深度融合的趨勢。
那么,我們?yōu)槭裁匆罅ρ芯烤呱碇悄苣兀孔T鐵牛教授給出了兩個(gè)關(guān)鍵理由:突破傳統(tǒng) AI 局限,開辟新路徑:具身智能能夠突破傳統(tǒng)人工智能依賴 “算力 + 數(shù)據(jù)” 堆砌模式的局限,為人工智能的發(fā)展重塑路徑,同時(shí)也為探索人類智能的形成機(jī)制提供了全新的視角。傳統(tǒng)人工智能在性能提升方面存在瓶頸,并且在場景適應(yīng)性上有所不足,而具身智能則可以轉(zhuǎn)向生物啟發(fā)式創(chuàng)新。它通過物理實(shí)體與環(huán)境的動(dòng)態(tài)交互,實(shí)現(xiàn) “感知—決策—行動(dòng)” 的閉環(huán),這種模式更貼近生物智能的進(jìn)化邏輯。就像嬰兒是通過不斷地觸摸、摔倒等交互行為來學(xué)習(xí)行走的,而不是依靠預(yù)先設(shè)定好的編程。譚鐵牛教授強(qiáng)調(diào):“人工智能未來該如何發(fā)展?我們需要更多地借鑒生物智能,這就是我們研究具身智能的重要原因,具身智能也是推動(dòng)人工智能發(fā)展的重要途徑。”驅(qū)動(dòng)新質(zhì)生產(chǎn)力,促進(jìn)成果轉(zhuǎn)化:具身智能是新質(zhì)生產(chǎn)力的重要引擎。通過與物理載體以及實(shí)體經(jīng)濟(jì)的深度融合,它能夠有力地推動(dòng)科技成果的轉(zhuǎn)化。譚鐵牛教授表示:“當(dāng)前人工智能的發(fā)展方向主要聚焦于多用智能,多模態(tài)大模型是其主要代表。而下一步,實(shí)體多通用智能必將成為主流,具身智能則是實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵技術(shù)。”譚鐵牛指出,具身智能的發(fā)展前景廣闊,將呈現(xiàn)出五大顯著趨勢,引領(lǐng)著科技領(lǐng)域的新變革。第一,多學(xué)科深度交融,催生新興學(xué)科。具身智能天然地成為了多學(xué)科交叉融合的優(yōu)質(zhì)載體。它的蓬勃發(fā)展,高度依賴于傳感器技術(shù)、仿生材料、控制工程以及人工智能等多領(lǐng)域的協(xié)同創(chuàng)新。舉例來說,若要提升觸覺傳感器的靈敏度,就離不開納米材料與微電子技術(shù)的新突破;而想要實(shí)現(xiàn)運(yùn)動(dòng)控制的高精度,神經(jīng)動(dòng)力學(xué)與強(qiáng)化學(xué)習(xí)算法的有機(jī)融合則是關(guān)鍵所在。在這一深度融合的進(jìn)程中,不僅能加速各領(lǐng)域的技術(shù)突破,還將孕育出智能仿生學(xué)、認(rèn)知機(jī)器人學(xué)等一系列新興的交叉學(xué)科,為具身智能的發(fā)展注入新的活力。第二,任務(wù)模型升級,邁向廣域通用基座。當(dāng)下,基于特定場景的小模型正逐漸向跨領(lǐng)域的通用化基座模型轉(zhuǎn)型升級。而實(shí)現(xiàn)這一關(guān)鍵轉(zhuǎn)變的核心,在于構(gòu)建大規(guī)模的具身數(shù)據(jù)平臺。具身智能需要打造一個(gè)開放的數(shù)據(jù)集,全面涵蓋多模態(tài)感知以及物理交互等方面的信息。通過對海量實(shí)體交互數(shù)據(jù)的深度訓(xùn)練,從而得出能夠適應(yīng)復(fù)雜多樣場景的通用模型基座,極大地拓展具身智能的應(yīng)用范圍和能力。第三,虛實(shí)空間緊密結(jié)合,實(shí)現(xiàn)深度共生。虛擬仿真與物理驗(yàn)證之間形成的閉環(huán),將成為具身智能技術(shù)迭代的核心路徑。在虛擬空間中,借助數(shù)字孿生技術(shù),可以實(shí)現(xiàn)智能體的快速訓(xùn)練。以特斯拉人形機(jī)器人為例,其仿真訓(xùn)練效率因此提升了 10 倍之多。而物理空間則能夠提供真實(shí)的反饋信息,用于優(yōu)化算法模型。虛擬與現(xiàn)實(shí)空間的深度融合,將成功突破 “莫拉維克悖論” 的限制,使機(jī)器人在非結(jié)構(gòu)化的復(fù)雜環(huán)境中,也能獲得類似人類的環(huán)境適應(yīng)能力,更好地完成各項(xiàng)任務(wù)。第四,應(yīng)用邊界迅速拓展,產(chǎn)業(yè)規(guī)模有望激增。隨著靈巧操作(精度可達(dá)<0.1mm)、多模態(tài)感知(觸覺分辨率達(dá)到 0.5N)、集群協(xié)作(百臺級機(jī)器人協(xié)同誤差<1cm)等關(guān)鍵技術(shù)的不斷取得突破,具身智能的應(yīng)用場景將不再局限于工業(yè)制造領(lǐng)域,而是向著深海勘探、太空作業(yè)、微觀手術(shù)等極端復(fù)雜的環(huán)境延伸拓展。據(jù)預(yù)測,到 2030 年,全球具身智能產(chǎn)業(yè)規(guī)模有望突破萬億美元大關(guān),展現(xiàn)出巨大的發(fā)展?jié)摿徒?jīng)濟(jì)價(jià)值。第五,創(chuàng)新資源集聚發(fā)展,形成強(qiáng)大驅(qū)動(dòng)機(jī)制。人才、資本和政策將共同形成 “三螺旋” 驅(qū)動(dòng)機(jī)制,有力推動(dòng)具身智能的發(fā)展。高校紛紛重構(gòu) “智能 + 機(jī)器人” 的跨學(xué)科培養(yǎng)體系,為行業(yè)輸送專業(yè)人才;產(chǎn)業(yè)資本通過設(shè)立專項(xiàng)基金,加速具身智能技術(shù)的商業(yè)化進(jìn)程;政府則通過打造創(chuàng)新園區(qū),構(gòu)建起 “研發(fā) — 中試 — 量產(chǎn)” 的完整生態(tài)閉環(huán),營造良好的發(fā)展環(huán)境。這五大趨勢共同揭示了具身智能發(fā)展的核心規(guī)律:以物理實(shí)體作為關(guān)鍵錨點(diǎn),通過 “數(shù)據(jù) — 算法 — 載體” 的閉環(huán)迭代模式,推動(dòng)人工智能實(shí)現(xiàn)從虛擬認(rèn)知到實(shí)體智能的重大范式躍遷。在具身智能的演進(jìn)過程中,不僅要攻克觸覺傳感、精密傳動(dòng)等 “硬科技” 難題,更要著力構(gòu)建跨學(xué)科、跨產(chǎn)業(yè)、跨虛實(shí)空間的新型創(chuàng)新生態(tài)體系,為其持續(xù)發(fā)展提供堅(jiān)實(shí)支撐。相信在這些趨勢的引領(lǐng)下,具身智能將在未來的科技舞臺上大放異彩,為我們的生活和社會(huì)帶來更多的驚喜與改變。在科技飛速發(fā)展的當(dāng)下,具身智能產(chǎn)業(yè)的發(fā)展備受關(guān)注。如何有效推動(dòng)具身智能產(chǎn)業(yè)邁向新高度?譚鐵牛給出了五點(diǎn)極具建設(shè)性的建議:戰(zhàn)略規(guī)劃與頂層設(shè)計(jì)的完善:具身智能產(chǎn)業(yè)的發(fā)展是一個(gè)復(fù)雜的系統(tǒng)工程。從夯實(shí)理論基礎(chǔ),到強(qiáng)化軟硬件支撐;從材料研發(fā)、系統(tǒng)構(gòu)建,到安全評測體系的建立;再到精心設(shè)計(jì)應(yīng)用賦能場景,行業(yè)都需持續(xù)發(fā)力,不斷完善戰(zhàn)略規(guī)劃和頂層設(shè)計(jì),為產(chǎn)業(yè)發(fā)展筑牢根基,確保發(fā)展方向的正確性和前瞻性。學(xué)科融合與前沿布局的推進(jìn):鼓勵(lì)多學(xué)科之間的深度交叉研究,打破學(xué)科壁壘,實(shí)現(xiàn)知識與技術(shù)的融合創(chuàng)新。同時(shí),大力推動(dòng)數(shù)據(jù)平臺、算力平臺等基礎(chǔ)設(shè)施的建設(shè),為具身智能的研究與應(yīng)用提供堅(jiān)實(shí)的基礎(chǔ)條件,營造良好的發(fā)展環(huán)境,助力具身智能在前沿領(lǐng)域的探索與突破。國際與區(qū)域協(xié)同合作的加強(qiáng):在全球化的大背景下,具身智能的發(fā)展離不開國際合作。鼓勵(lì)國內(nèi)外科研團(tuán)隊(duì)攜手共進(jìn),聯(lián)合攻克技術(shù)難題,共同推動(dòng)具身智能在理論和應(yīng)用層面的創(chuàng)新研究,構(gòu)建起廣泛的全球合作網(wǎng)絡(luò)。此外,搭建區(qū)域性具身智能創(chuàng)新平臺,促進(jìn)區(qū)域內(nèi)資源共享、優(yōu)勢互補(bǔ),推動(dòng)區(qū)域協(xié)同發(fā)展,提升整體競爭力。科技與產(chǎn)業(yè)融合創(chuàng)新的深化:深化 “產(chǎn)學(xué)研” 協(xié)同創(chuàng)新模式,緊密連接高校、科研機(jī)構(gòu)和企業(yè),探索出一條從實(shí)驗(yàn)室研究到原型機(jī)開發(fā),再到整機(jī)系統(tǒng)構(gòu)建的完整產(chǎn)業(yè)鏈,加速技術(shù)向產(chǎn)業(yè)化的轉(zhuǎn)化進(jìn)程。圍繞智能制造、低空經(jīng)濟(jì)等重點(diǎn)行業(yè),建設(shè)具身智能示范工程,通過實(shí)際應(yīng)用驗(yàn)證技術(shù)的落地效果,同時(shí)建立健全行業(yè)標(biāo)準(zhǔn)和技術(shù)規(guī)范,推動(dòng)具身智能在產(chǎn)業(yè)領(lǐng)域?qū)崿F(xiàn)標(biāo)準(zhǔn)化和規(guī)模化應(yīng)用,釋放產(chǎn)業(yè)發(fā)展?jié)摿Α?/span>多層次人才培養(yǎng)體系的構(gòu)建:具身智能產(chǎn)業(yè)的發(fā)展需要大量既懂硬件又懂軟件的復(fù)合型人才。構(gòu)建多層次人才培養(yǎng)體系,促進(jìn) “產(chǎn)學(xué)研” 在人才培養(yǎng)方面的協(xié)同合作,培養(yǎng)契合具身智能發(fā)展需求的專業(yè)人才。同時(shí),強(qiáng)化人才的 “引、育、用、留” 機(jī)制,吸引優(yōu)秀人才投身具身智能產(chǎn)業(yè),為人才提供良好的發(fā)展環(huán)境和廣闊的發(fā)展空間,打造一支高質(zhì)量的人才隊(duì)伍,為產(chǎn)業(yè)發(fā)展提供智力支持。在提出發(fā)展建議之后,譚鐵牛進(jìn)一步總結(jié)了具身智能產(chǎn)業(yè)的重要意義:人工智能可持續(xù)發(fā)展的必由之路:具身智能不僅是人工智能的一種表現(xiàn)形態(tài),更是推動(dòng)人工智能實(shí)現(xiàn)可持續(xù)發(fā)展的關(guān)鍵路徑。目前,很多人將具身智能視為人工智能的另一種形式,這固然沒錯(cuò)。但從更深遠(yuǎn)的角度來看,具身智能是人工智能發(fā)展應(yīng)遵循的道路,因?yàn)槿祟愔悄苷峭ㄟ^自身感官與外部世界的不斷交互,在實(shí)踐中逐漸形成的。具身智能的發(fā)展模式更貼近人類智能的形成機(jī)制,為人工智能的發(fā)展提供了新的思路和方向。學(xué)科交叉的新前沿與產(chǎn)業(yè)賦能的 “新靶點(diǎn)”:具身智能處于多學(xué)科交叉的前沿位置,它整合了多個(gè)學(xué)科的知識和技術(shù),為學(xué)科發(fā)展帶來了新的機(jī)遇和挑戰(zhàn)。同時(shí),具身智能也是推動(dòng)人工智能賦能千行百業(yè)的關(guān)鍵 “靶點(diǎn)”。真正實(shí)現(xiàn)新質(zhì)生產(chǎn)力的發(fā)展,離不開物理世界的支撐,具身智能能夠?qū)⑷斯ぶ悄芗夹g(shù)與物理世界緊密結(jié)合,為各行業(yè)的創(chuàng)新發(fā)展注入新的動(dòng)力。理性務(wù)實(shí)推動(dòng)機(jī)器人創(chuàng)新發(fā)展:當(dāng)下,機(jī)器人領(lǐng)域備受矚目,發(fā)展前景廣闊。然而,在推動(dòng)具身智能相關(guān)的機(jī)器人發(fā)展時(shí),應(yīng)保持理性務(wù)實(shí)的態(tài)度。避免設(shè)定不切實(shí)際的發(fā)展目標(biāo),防止出現(xiàn)盲目跟風(fēng)、一哄而上的現(xiàn)象。要根據(jù)實(shí)際情況,穩(wěn)步推進(jìn)技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展,確保機(jī)器人產(chǎn)業(yè)能夠健康、可持續(xù)地發(fā)展。具身智能產(chǎn)業(yè)的發(fā)展前景廣闊,但也面臨著諸多挑戰(zhàn)。相信在科學(xué)的發(fā)展建議指引下,通過各方的共同努力,具身智能產(chǎn)業(yè)必將迎來新的發(fā)展機(jī)遇,為科技進(jìn)步和社會(huì)發(fā)展做出更大的貢獻(xiàn)。