- +1
中國(guó)科學(xué)院研究員蔣樹強(qiáng):具身智能要能在真實(shí)世界幫人完成復(fù)雜多變的任務(wù)
“我們需要思考兩個(gè)問題。一個(gè)問題是,現(xiàn)在人工智能的技術(shù)是什么?我們?cè)趺礃觼?lái)實(shí)現(xiàn)它?另一個(gè)事情就是,我們?nèi)说闹悄艿降资鞘裁矗克菑哪膬簛?lái)的?機(jī)器到底能不能模仿它或者重建它?而具身智能非常值得作為一個(gè)參照體來(lái)思考這些問題。”日前,中國(guó)科學(xué)院大學(xué)“拔尖計(jì)劃2.0”計(jì)算機(jī)科學(xué)與技術(shù)學(xué)科國(guó)際暑期學(xué)校開班,CAAI(中國(guó)人工智能學(xué)會(huì))具身智能專委會(huì)主任、中國(guó)科學(xué)院大學(xué)特聘教授、中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員蔣樹強(qiáng)圍繞具身智能的內(nèi)涵、技術(shù)與進(jìn)展與同學(xué)們進(jìn)行探討。

中國(guó)科學(xué)院研究員蔣樹強(qiáng)(國(guó)科大供圖)
具身智能是指通過身體與環(huán)境互動(dòng)來(lái)實(shí)現(xiàn)的智能,具有主動(dòng)性、交互性和情境化的特點(diǎn),是人工智能走向物理世界的核心關(guān)鍵,當(dāng)前受到學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注。
關(guān)于具身智能,蔣樹強(qiáng)認(rèn)為有三個(gè)關(guān)鍵詞:第一個(gè)是身體,第二個(gè)是和環(huán)境進(jìn)行互動(dòng),第三個(gè)就是智能。
“顧名思義,具身智能要具身化,要有一個(gè)身體。它還要情境化,和真實(shí)世界相結(jié)合。要具有一定的主動(dòng)性,能夠相對(duì)自主地去完成一個(gè)任務(wù),而不只是被動(dòng)去接收一個(gè)指令然后去完成。在這個(gè)指令下面,它需要去完成一個(gè)它更想要的、更理想的結(jié)果。此外,它還要具有一定的交互性,和環(huán)境進(jìn)行交互,就像人類一樣和這個(gè)世界有各種各樣的交互,不管是和環(huán)境還是和人。”蔣樹強(qiáng)表示。

2025年7月26日,上海世博展覽館,最具產(chǎn)業(yè)想象力的場(chǎng)景藏在“智造車間坊”,身著工裝的人形機(jī)器人化身“產(chǎn)業(yè)工人”,在綠色傳送帶上有序搬運(yùn)物料、模擬裝配流程。澎湃新聞?dòng)浾?朱偉輝 圖
蔣樹強(qiáng)報(bào)告中提到,人類在肌肉和骨骼方面并沒有什么特別,但人類的大腦把人類與其他所有物種區(qū)別開來(lái)。人類的智能有一定的獨(dú)特性,所有認(rèn)知的形成都是和環(huán)境交互有很大關(guān)系。
“關(guān)于具身智能,現(xiàn)在經(jīng)常講的是大腦、小腦和本體。本體的話,現(xiàn)在的機(jī)器人發(fā)展非常快,為具身智能的研究提供了很好的支撐。而具身智能的大腦、小腦、本體是緊密耦合、互相支撐的。具身智能不是只在大腦中完成的事情,它一定是要和小腦和身體聯(lián)合在一起去做一些事情,脫離開身體的純粹的大腦能力不一定能夠很好完成具身智能的任務(wù)。”蔣樹強(qiáng)表示,具身智能一方面要有身體的一些能力,包括運(yùn)動(dòng)系統(tǒng)、感覺系統(tǒng)還有控制器等。另一方面,還要有人工智能的算法,包括機(jī)器學(xué)習(xí)、推理、自然語(yǔ)言對(duì)話等等。
此外,蔣樹強(qiáng)指出,在訓(xùn)練數(shù)據(jù)的時(shí)候,身體非常重要。身體的結(jié)構(gòu)、形態(tài)、感知器與行為能力共同構(gòu)成智能的一部分,對(duì)智能的實(shí)現(xiàn)具有重要影響。身高、肢體結(jié)構(gòu)、感官分布等決定了智能體如何感知和理解世界。如果要訓(xùn)練一個(gè)模型,一米七的機(jī)器人和一米八的機(jī)器人,數(shù)據(jù)是不一樣的,攝像頭圖像是不一樣的,抓取的姿勢(shì)不一樣,抓取的三維空間位置都是不一樣的。
蔣樹強(qiáng)指出,具身問答也是當(dāng)前具身智能一個(gè)非常重要的研究?jī)?nèi)容。
具身智能就像人類一樣,可以在環(huán)境中走來(lái)走去,可以去感知環(huán)境,可以和環(huán)境進(jìn)行交互。與具身智能相對(duì)的是離身智能。離身智能是有一個(gè)輸入,有一個(gè)輸出,實(shí)際上是和真實(shí)世界脫節(jié)的。
“在具身智能之下,有了具身問答。就是在環(huán)境中走一走,然后問一下這個(gè)房間里到底有沒有一把雨傘。可能一開始并不知道有沒有雨傘,但是這樣逛一逛,找到了答案。或者問這個(gè)房間里是穿藍(lán)色衣服的人多還是穿白色衣服的人多,類似這類問題,它可能不一定直接回答,要走一走看一看可能才能回答。”此外,蔣樹強(qiáng)表示,具身智能還有非常重要的一件事情,就是它會(huì)在環(huán)境中不斷進(jìn)行學(xué)習(xí)來(lái)提高能力。機(jī)器的學(xué)習(xí)和人類的學(xué)習(xí)機(jī)制是非常不一樣的。人是在試錯(cuò)中去進(jìn)行學(xué)習(xí)的,在環(huán)境的交互中來(lái)進(jìn)行學(xué)習(xí)的,在不斷嘗試過程中進(jìn)行學(xué)習(xí)的。

蔣樹強(qiáng)
互聯(lián)網(wǎng)上的數(shù)據(jù)能不能直接應(yīng)用在具身智能中?蔣樹強(qiáng)認(rèn)為它肯定是可以借鑒的,可以做支持的,但是還不能直接用在具身智能中,“因?yàn)榫W(wǎng)絡(luò)空間和真實(shí)世界還是有很大的一個(gè)區(qū)別”。
“有人講,到了十年之后也就是21世紀(jì)30年代的時(shí)候,地球上會(huì)有幾百億個(gè)機(jī)器人,比人類的數(shù)量還要多,這件事情是可以值得去期待的。但是,它一定是能夠在真實(shí)世界中幫我們?nèi)ネ瓿梢欢ǖ娜蝿?wù)的。這些任務(wù)是復(fù)雜的、多變的,它不像下棋一樣,只是在一個(gè)有限空間中去做這樣一件事情就行了。”蔣樹強(qiáng)表示,現(xiàn)在的具身智能看起來(lái)很酷很炫,但是還是要反思一件事:它有沒有真正使用到我們的生活中?答案是還沒有。
蔣樹強(qiáng)認(rèn)為,從技術(shù)的demo到它形成產(chǎn)品還有比較長(zhǎng)的路要走。現(xiàn)在有很多機(jī)器人的演示都是可以通過搖操實(shí)現(xiàn)的,一旦讓它在真實(shí)環(huán)境中,就沒有那么容易了。所以,需要付出大量的勞動(dòng)去開展工作。
“人類是生活在一個(gè)物理世界中,我們也希望人工智能能夠在這個(gè)三維的物理世界中真正為我們服務(wù),所以具身智能是非常值得我們?nèi)テ诖摹!笔Y樹強(qiáng)說(shuō)。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2025 上海東方報(bào)業(yè)有限公司




