每日經(jīng)濟新聞 2025-04-02 15:32:55
智元機器人宣布與國際頂尖具身智能公司Physical Intelligence達成合作,將在動態(tài)環(huán)境下的長周期復(fù)雜任務(wù)中推進具身智能技術(shù)發(fā)展。剛加入智元的羅劍嵐將領(lǐng)導(dǎo)具身智能研究中心并推動合作進程。在接受《每日經(jīng)濟新聞》記者采訪時,羅劍嵐探討了人形機器人從遙控到自主決策的技術(shù)挑戰(zhàn)。他認(rèn)為強化學(xué)習(xí)和世界模型是關(guān)鍵技術(shù),并指出機器人操控能力比大語言模型更高級。
每經(jīng)記者 朱成祥 每經(jīng)編輯 魏官紅
4月2日,智元機器人宣布與國際頂尖具身智能公司Physical Intelligence(Pi)達成合作伙伴關(guān)系,雙方將圍繞動態(tài)環(huán)境下的長周期復(fù)雜任務(wù),在具身智能領(lǐng)域展開深度技術(shù)合作。此外,近期正式加入智元的羅劍嵐,將全面領(lǐng)導(dǎo)智元具身智能研究中心,同時推進雙方的深度合作。4月2日,羅劍嵐接受了《每日經(jīng)濟新聞》記者的采訪。
目前,人形機器人仍然依賴人在背后遙控,未來人形機器人能否實現(xiàn)自主決策?
對此,羅劍嵐表示:“遙控與自主決策的差別其實很大。遙控類似于你與一個電腦程序?qū)υ?,但背后與你聊天的是一個真正的人,他在另一臺電腦上打字。而自主決策,最核心的是感知、預(yù)測、行為生成這一整套機制的泛化能力。機器人要理解世界,需要建立一個Internal Model(世界模型)去預(yù)測未來,再去實施可執(zhí)行的動作鏈。接著,再看機器人與真實世界的交互,去預(yù)測下一步動作。”
羅劍嵐認(rèn)為:“如果機器人真的實現(xiàn)Manipulation(操控),是比LLM(大語言模型)更高級的智能。如果以從0到10分級,大語言模型最多算3,如果機器人實現(xiàn)Manipulation,至少有7至8。”
那么,在實現(xiàn)機器人Manipulation的道路上,最關(guān)鍵的技術(shù)是什么呢?
羅劍嵐認(rèn)為:“強化學(xué)習(xí)是我們比較看重的一個技術(shù),此外我們也看到DeepSeek R1所展現(xiàn)出的比較強的推理能力。但光有模仿學(xué)習(xí)是不夠的,后來我們還會有世界模型。根據(jù)我們云端的Model(模型),去預(yù)測下一步環(huán)境會發(fā)生什么。不過這些都是工具,真正本質(zhì)上需要解決的,是怎樣在開放數(shù)據(jù)鏈構(gòu)建(具有)魯棒的策略,然后感知、預(yù)測、行為生成這一整套機制的泛化能力,才是最核心、最關(guān)鍵的。”
值得一提的是,汽車智能駕駛是收集到眾多車輛的數(shù)據(jù)后,才慢慢發(fā)展起來的。當(dāng)下人形機器人尚未大規(guī)模應(yīng)用于生活場景。如果缺乏足夠的數(shù)據(jù),人形機器人的“操控”該如何突破?
羅劍嵐表示:“我也經(jīng)常在想,這是一個循環(huán)。我們沒有機器人部署到真實世界,它就不會產(chǎn)生數(shù)據(jù);機器人的能力沒到一定程度,也無法部署到真實世界中去。但是,必須要有人做這些事,假設(shè)有1000臺機器人在星巴克工作,每天24個小時打咖啡,其一個月傳回來的數(shù)據(jù),超過我們現(xiàn)在所有見過的機器人數(shù)據(jù)集?;蛟S這時會發(fā)現(xiàn),在小的數(shù)據(jù)量中得出的很多結(jié)論不一定正確。”
不過羅劍嵐也強調(diào),機器人部署到真實世界的難度,小于汽車(智能駕駛),“車在安全性等各方面要求太嚴(yán)格。而機器人,可以從一些封閉空間、半封閉空間部署,讓它產(chǎn)生數(shù)據(jù)”。
封面圖片來源:每日經(jīng)濟新聞 劉國梅 攝
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP