中新經緯3月6日電 (薛宇飛 李曉萱)今年的政府工作報告指出,建立未來產業投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產業。
首次進入政府工作報告的“具身智能”是什么?與我們此前了解的人工智能、人形機器人,有什么區別?具身智能產業又有哪些特點?對此,中新經緯采訪多位業內人士進行解讀。
有“腦子”,還有“身體”
中國計算機學會(CCF)官網于2023年7月發布的《具身智能 | CCF專家談術語》中稱,具身智能是指一種基于物理身體進行感知和行動的智能系統,其通過智能體與環境的交互獲取信息、理解問題、做出決策并實現行動,從而產生智能行為和適應性。
該文章解釋了具身智能的由來。文章稱,具身智能的思想萌芽于人工智能誕生之初。1950年,英國科學家圖靈在其論文中展望了人工智能可能的兩條發展道路:一條路是聚焦抽象計算(比如下棋)所需的智能,另一條路則是為機器配備最好的傳感器,使其可以與人類交流、像嬰兒一樣地進行學習。這兩條道路便逐漸演變成了非具身和具身智能。
看到這里,可能很多人對具身智能還是一頭霧水。
智元機器人研究院執行院長、具身業務部總裁姚卯青對中新經緯解釋,顧名思義,與傳統的人工智能相比,具身智能的最大區別就體現在“具身”兩個字,過去的人工智能很多是停留在數字世界,比如大語言模型,只能在互聯網上與人對話。具身智能是將AI賦予了一個物理實體,不僅可以與人進行互動,還能在現實世界執行指令,比如讓它端茶、倒水、搬東西。
中歐中證機器人指數基金經理宋巍巍對中新經緯說:“你可以把傳統的人工智能想象成一個‘超級聰明的計算器’,它能幫你解答問題、分析數據,但它沒有身體,不能自己動,也不能真正‘感受’世界。而具身智能就像是給這個‘計算器’裝上了一雙眼睛、一雙手和一雙腳,讓它能看、能摸、能走,甚至能自己去完成任務!
宋巍巍進一步解釋稱,傳統的人工智能,比如手機里的語音助手(如Siri)、推薦算法(如抖音的視頻推薦),主要是在“云端”或者“屏幕”里工作。它們擅長處理數據、回答問題,但它們沒有“身體”,不能直接跟現實世界互動。而具身智能的核心區別在于,它不僅有“腦子”(計算能力),還有“身體”(物理實體),能夠感知環境、做出動作,甚至像人一樣學習和適應。
姚卯青稱,具身智能可以說是傳統人工智能的“升級版”,它的模態更豐富,不僅要理解語言,還要理解三維世界,理解物理規律。
與工業機器人相比,具身智能又有哪些進步?
姚卯青表示,工業機器人沒有智能可言,在預設好相關程序后,它只會做固定的動作,不會隨著環境的變化而變化,也不會根據反饋進行自我調節。具身智能是利用大模型形成意識識別、推理規劃等能力,能夠在相關環境中做一些任務,同時有自適應性,根據環境的變化做出調整。
宋巍巍說:“未來,具身智能可能會讓機器人像人一樣融入我們的生活,幫我們干活、照顧家人,甚至成為我們的‘伙伴’。”
具身智能=人形機器人?
當前,人形機器人十分火熱,具身智能落地的形態就是人形機器人嗎?
中信建投證券高端制造研究組組長呂娟團隊在今年2月底的研報中稱,人形機器人是指外形模仿人類設計的機器人,通常具有頭部、四肢和類似人類的外觀。雖然具身智能的智能體形態可以豐富多彩,但是預計人形機器人將成為具身智能最重要的載體。
宋巍巍表示,人形機器人之所以重要,是因為它們的設計模仿了人類的身體結構和行為方式,這樣它們就能更好地適應人類的生活環境和工作場景。
宋巍巍稱,具體原因有幾點:一是,適應人類環境。人形機器人因為有類似人類的身體結構,可以更方便地使用門把手、樓梯、工具等設施;二是,交互更自然。人形機器人可以通過表情、動作與人類交流,比如點頭、揮手,甚至模仿人類的情緒,讓互動更親切;三是,多功能性。人形機器人可以執行多種任務,比如在工廠搬運貨物、在醫院照顧病人、在家里做家務,而不像單一功能的機器人(比如掃地機器人)只能干一件事。
“人形機器人雖然不會是具身智能最完美的載體和呈現方式,但如果說只能設計一款機器人的話,人形機器人應該就是最大公約數。”姚卯青說。
產業鏈不斷延伸
既要有腦力,又要有身體的具身智能,所包含的產業十分豐富。
華創證券在今年1月份發布的研報中稱,上游環節是具身智能機器人產業的基礎,主要包括芯片、傳感器、控制器、電機、通信模組、能源管理等,這些核心組件是構建 “硬件”基礎。中游環節是產業鏈的技術核心,涉及AI算法、操作系統、云服務以及中間件的開發與集成,通過編程和系統集成,使其能夠執行復雜的智能任務。下游環節是產業鏈的最終輸出端,面向工業制造、服務業、醫療康復、教育娛樂、交通出行、公共安全等領域的多元化應用場景。
宋巍巍稱,具身智能的產業鏈可以簡單理解為“從大腦到身體,再到應用”的完整體系。以下是產業鏈的幾個關鍵環節:
一是“大腦”部分(核心技術研發)。這是具身智能的“靈魂”,包括人工智能算法、機器學習、感知技術(比如視覺、聽覺)、決策系統等。它就像人的大腦,負責思考、判斷和學習。比如,給機器人裝上一個能識別物體、理解語言的“大腦”。
二是“身體”部分(硬件制造)。這是具身智能的“骨骼和肌肉”,包括機器人身體的各種硬件,比如傳感器(相當于眼睛、耳朵)、電機(相當于肌肉)、機械臂、電池等。它就像人的身體,需要各種零件協調工作。比如,機器人要能走路,就需要電機驅動腿部;要能看東西,就需要攝像頭和激光雷達。
三是 “神經網絡”部分(軟件與硬件的連接)。這是讓“大腦”和“身體”協調工作的關鍵,包括操作系統、控制系統、通信技術等。它就像人的神經系統,把大腦的指令傳遞到手腳。比如,機器人看到一個杯子,大腦決定要拿起來,神經系統負責指揮手臂和手指完成動作。
四是“應用場景”部分(產業應用)。這是具身智能最終發揮作用的地方,比如在工業生產、醫療護理、家庭服務、教育娛樂等領域。
五是“支持系統”部分(基礎設施和生態)。包括數據支持、云計算、5G網絡、供應鏈、人才培養等,這些是為具身智能發展提供“土壤”的部分。它就像人的生活需要水、電、道路等基礎設施,機器人也需要網絡、電力、零件供應商的支持。
姚卯青表示,具身智能涉及到的產業鏈非常多,一旦能形成規模,會對整個工業制造尤其是精密制造的升級起到很強帶動作用,“它類似于新能源車的崛起,是對全產業鏈條的帶動!
多地定下發展目標
據中新經緯不完全統計,在近一年內,已有北京、廣東、浙江、山東等多個省市發布了布局具身智能、智能機器人發展的計劃和方案。
3月3日,深圳市科技創新局發布的《深圳市具身智能機器人技術創新與產業發展行動計劃(2025—2027年)》中提出,到2027年,深圳市具身智能機器人產業集群相關企業超過1200家,關聯產業規模達到1000億元以上。
2月28日,北京市科學技術委員會等4部門聯合發布了《北京具身智能科技創新與產業培育行動計劃(2025—2027年)》,其中提出,要加快實現具身智能科技創新和產業創新深度融合,培育人工智能發展新賽道,預計到2027年底,實現不少于100項規;瘧,量產總規模率先突破萬臺,培育千億級產業集群。
就人形機器人而言,呂娟團隊表示,2025年中國國內外頭部公司分別逐步啟動幾千臺或者萬臺級別的人形機器人量產計劃,2026年預期分別啟動數萬臺或者10萬臺級別的量產計劃。遠期市場空間方面,特斯拉對人形機器人遠期定價目標是2萬美元,宇樹機器人多個型號在京東售價不到10萬元人民幣,隨著智能化程度提升,未來可能每個家庭甚至每個人平均擁有一臺人形機器人,預計市場空間將超過汽車、智能手機,至少是數萬億元的市場規模。
不過,姚卯青也提醒,當前具身智能的發展仍處于萌芽階段。在硬件上,當前的迭代次數還不夠,有很多關鍵零部件有待成熟,比如,高自由度的靈巧手。零部件供應鏈不成熟,一些上游供應商仍是比較小的公司,在質量工藝、產品測試等方面處于比較原始的階段。軟件方面,大模型更多地停留在對多模態大語言模型語義的理解層面,該如何對任務進行理解,如何在復雜的三維環境去做任務對應的嵌入的規劃和執行,并且在執行過程中不停地糾錯、反思,這些問題有待解決。
(更多報道線索,請聯系本文作者薛宇飛:xueyufei@chinanews.com.cn)(中新經緯APP)
(文中觀點僅供參考,不構成投資建議,投資有風險,入市需謹慎。)
中新經緯版權所有,未經書面授權,任何單位及個人不得轉載、摘編或以其他方式使用。
責任編輯:魏薇 李中元