4月19日,雨后的北京分外清涼,人形機(jī)器人半程馬拉松吸引眾多目光。當(dāng)天10時11分左右,首個人形機(jī)器人半程馬拉松迎來首位撞線“選手”——天工Ultra,用時2小時40分42秒。

天工Ultra身高180cm,體重55kg,具備開源開放性和兼容擴(kuò)展性,可以靈活擴(kuò)展軟、硬件等功能模塊,已具備帶有視覺感知的泛化移動能力,能輕松應(yīng)對溝壑、大高度差等復(fù)雜地形。

北京人形機(jī)器人創(chuàng)新中心首席技術(shù)官(CTO)唐劍。受訪者供圖


天工Ultra由北京人形機(jī)器人創(chuàng)新中心研發(fā)。北京人形機(jī)器人創(chuàng)新中心首席技術(shù)官(CTO)唐劍談及天工奪冠表示,“天工整體表現(xiàn)是非常符合預(yù)期的,主要是指它的整體速度以及完成時間。也不用避諱,大家都看到天工中途有一次摔跤,那是因?yàn)殡姵厥?,這也是偶爾會出現(xiàn)的故障”。

唐劍介紹,這次比賽主要是對機(jī)器人的硬件以及軟件的運(yùn)動算法,或者說機(jī)器人的“小腦” 穩(wěn)定性、可靠性的一次極限的測試。天工機(jī)器人的“小腦”也是國地共建具身智能機(jī)器人創(chuàng)新中心“慧思開物”平臺的一部分,測試是一個長期的過程。

唐劍認(rèn)為,目前具身智能的ChatGPT時刻還沒有到,需要對機(jī)器人模型的架構(gòu)能力升級,進(jìn)行顛覆式的升級。年中機(jī)器人自主導(dǎo)航將有突破,明年人形機(jī)器人馬拉松將不需要領(lǐng)跑員。希望人形機(jī)器人走入工業(yè)、商業(yè)、生活場景,能夠7X24小時不間斷穩(wěn)定地工作。


4月19日,首個人形機(jī)器人半程馬拉松,天工Ultra首個沖線。新京報(bào)記者 李木易 攝


表現(xiàn)符合預(yù)期


新京報(bào)貝殼財(cái)經(jīng):本次天工Ultra的表現(xiàn)是否符合預(yù)期?

唐劍:天工整體表現(xiàn)還是非常不錯的,主要是指它的整體速度以及完成時間。大家看到天工中途有一次摔跤,那是因?yàn)殡姵貨]電了,換電后很快便恢復(fù)了奔跑狀態(tài)。本次全程只用了同一臺機(jī)器人便完成了整個半程馬拉松比賽。

新京報(bào)貝殼財(cái)經(jīng):電池更換次數(shù)能更少?

唐劍:我們特別希望一臺機(jī)器人完成全程,電池?fù)Q了三次,一塊電池大概能跑六七公里。我們對電池容量、電量的選擇斟酌再三,做了很多測試,現(xiàn)在用的是15安的電池,如果加大加倍,更換電次數(shù)會減少一倍,但會增加機(jī)器人的重量,可能影響速度以及步態(tài)。目前是平衡各方面因素最終做一個最優(yōu)的選擇。

新京報(bào)貝殼財(cái)經(jīng):賽場上天工Ultra如何完成比賽?

唐劍:我們的機(jī)器人前面是有一位領(lǐng)跑者,這是無線跟隨技術(shù),是一種半自主的,不用遙控器方式。領(lǐng)跑者是一位運(yùn)動員,身上有UWB標(biāo)簽,機(jī)器人身上有無線的發(fā)射器,負(fù)責(zé)發(fā)射無線信號并且回收,然后利用算法與領(lǐng)跑者保持相對固定的距離和角度,實(shí)現(xiàn)運(yùn)動。然后后面兩個人員主要是起到保護(hù)作用。

新京報(bào)貝殼財(cái)經(jīng):為完成本次比賽做了哪些準(zhǔn)備?

唐劍:天工在備賽過程中做了大量訓(xùn)練和測試,還要去做極限測試,并針對各種復(fù)雜地形進(jìn)行測試,以及還有跟隨算法的測試。

為了奪冠軟硬兼施

新京報(bào)貝殼財(cái)經(jīng):天工奪冠主要原因是什么?優(yōu)勢有哪些?


唐劍:在硬件方面,首先為天工的“本體”做了輕量化和低慣量的設(shè)計(jì),盡量減重,同時把踝關(guān)節(jié)以及膝關(guān)節(jié)盡量往上提升,讓腿部的慣量比較低,腿部跑起來比較輕盈;其次,對一些關(guān)節(jié)模組的導(dǎo)熱設(shè)計(jì)做了優(yōu)化,讓它能很快達(dá)到熱平衡,而不是讓關(guān)節(jié)的溫度持續(xù)上升,因?yàn)樯仙揭欢囟?,這個關(guān)節(jié)會失效,這樣機(jī)器人會摔倒;第三,在腳底做了一些緩沖的設(shè)計(jì),盡可能減少對關(guān)節(jié)膜、對腳底板以及關(guān)節(jié)模組的磨損。更重要的是,天工的腿比其他賽隊(duì)的機(jī)器人要長,跑得比較快。

在軟件方面,運(yùn)控算法做了很多優(yōu)化。一是要在步頻、步幅、步態(tài)上做非常平衡的最優(yōu)選擇。二是奔跑的算法用了最先進(jìn)的強(qiáng)化模擬學(xué)習(xí)。強(qiáng)化模擬學(xué)習(xí)是要模仿人類,試采人類運(yùn)動員跑步的數(shù)據(jù),讓它盡可能接近運(yùn)動員。因?yàn)槿祟愡M(jìn)化了千年,跑步跑得快一定是有它的道理,我們把采集到的人的數(shù)據(jù)導(dǎo)入到強(qiáng)化學(xué)習(xí)的架構(gòu)中。

新京報(bào)貝殼財(cái)經(jīng):本次比賽展現(xiàn)了哪些技術(shù)優(yōu)勢?

唐劍:這次比賽主要是對機(jī)器人的硬件以及軟件的運(yùn)動算法,或者說機(jī)器人的“小腦” 穩(wěn)定性、可靠性的一次極限的測試。天工機(jī)器人的“小腦”也是北京人形機(jī)器人創(chuàng)新中心“慧思開物”平臺的一部分,測試是一個長期的過程。

今年3月12日,我們發(fā)布“慧思開物”的平臺,這是一個一腦多能、一腦多機(jī)的通用具身智能平臺,這個軟件平臺最主要功能是支持其他機(jī)器人應(yīng)用開發(fā)商以及系統(tǒng)集成商基于該平臺開發(fā)應(yīng)用,平臺上有非常強(qiáng)大的AI的能力。

AI的強(qiáng)化學(xué)習(xí)屬于實(shí)戰(zhàn)派,算法開始可能是個小白,放到實(shí)際環(huán)境中不斷試錯,起初可能會摔倒,跑得很慢,跌跌撞撞。然后它在訓(xùn)練過程中不斷地試錯,越來越強(qiáng)。強(qiáng)化學(xué)習(xí)的最大優(yōu)勢是泛化能力比較強(qiáng)。實(shí)戰(zhàn)派遇到什么情況都可以應(yīng)付。在奔跑過程中,可能會遇到轉(zhuǎn)彎、上坡、下坡以及坑洼地滑等等,都有比較好的應(yīng)對。

具身智能的ChatGPT時刻還沒有到

新京報(bào)貝殼財(cái)經(jīng):機(jī)器人如何泛化?

唐劍:泛化能力與大模型的泛化能力有類似的地方,一是數(shù)據(jù),但數(shù)據(jù)的增多也不一定能完全解決?,F(xiàn)在大模型已經(jīng)展現(xiàn)出比較強(qiáng)大的泛化能力了,但是機(jī)器人的操作和語言,與語言大模型不同。目前具身智能很大程度上照搬了語言大模型。機(jī)器人模型的結(jié)構(gòu)和架構(gòu),可能也需要比較顛覆式的突破和進(jìn)展,可能不只是數(shù)據(jù)的堆疊和積累??梢哉J(rèn)為是目前具身智能的ChatGPT時刻還沒有到。

新京報(bào)貝殼財(cái)經(jīng):機(jī)器人對物理世界的認(rèn)知還是有限?

唐劍:是的。泛化能力有兩方面,一是大腦的規(guī)劃能力,這有非常大的難點(diǎn),要學(xué)習(xí)物理的規(guī)律。看到物品后需要大腦規(guī)劃如何操作,這個比較難,要比較強(qiáng)大的泛化能力。

還有手部操作也要比較強(qiáng)大的泛化能力,進(jìn)入家庭生活場景,光照、桌子、窗簾等紋理都不一樣,如何操作是難點(diǎn),比方杯子類型豐富多樣,是否有模型可無差別拿起杯子,可能不單單是數(shù)據(jù)的積累,可能需要對模型的架構(gòu)能力升級,甚至是顛覆式的升級,這可能比較重要。

希望機(jī)器人能夠7X24小時不間斷穩(wěn)定地工作

新京報(bào)貝殼財(cái)經(jīng):后續(xù)技術(shù)如何迭代?

唐劍:我們會非常關(guān)注產(chǎn)業(yè)化的落地,第一階段先開始在工業(yè)和泛工業(yè)場景做一些巡檢類及簡單的操作類的工作。第二階段會在商業(yè)的場景提供商業(yè)服務(wù),完成打包、掃碼等相對比較復(fù)雜的操作。第三階段會走入生活和家庭,去扮演像保姆、管家等角色。

最終希望人形機(jī)器人走入工業(yè)、商業(yè)、生活場景,能夠7X24小時不間斷穩(wěn)定地工作,這是參加這次比賽的重要目的,我們會持續(xù)迭代不斷提升。同時也有一系列的研發(fā)計(jì)劃,會去占領(lǐng)具身智能技術(shù)制高點(diǎn)。

新京報(bào)貝殼財(cái)經(jīng):具體有哪些技術(shù)需要迭代?

唐劍:比如像這次馬拉松比賽,大家可能覺得自主導(dǎo)航是很成熟的技術(shù),但也不盡然。自主導(dǎo)航在自動駕駛上是開發(fā)了非常多年,相對比較成熟。但人形機(jī)器人全身的關(guān)節(jié)很多,控制完全不是一個層次,控制復(fù)雜度是幾何級數(shù)的增長。

人形機(jī)器人的自主導(dǎo)航在產(chǎn)業(yè)界沒有比較標(biāo)準(zhǔn)的參考性設(shè)計(jì),自動駕駛的算法也絕對不可能直接應(yīng)用到機(jī)器人上。比如路徑規(guī)劃的算法,可能可以借鑒自動駕駛的算法,但機(jī)器人能非常完美遵循規(guī)劃軌跡其實(shí)極其難,這個是非常大的難點(diǎn)。我們目前正在攻關(guān)這個難點(diǎn)。

已小批量生產(chǎn) 很快會具備自主導(dǎo)航能力

新京報(bào)貝殼財(cái)經(jīng):這個機(jī)器人已經(jīng)實(shí)現(xiàn)量產(chǎn)了嗎?

唐劍:我們會有天工2.0機(jī)器人很快實(shí)現(xiàn)小批量生產(chǎn),并且開始逐步投入一些場景的應(yīng)用。

新京報(bào)貝殼財(cái)經(jīng):2.0是Ultra版本嗎?

唐劍:不是的,Ultra版本是運(yùn)動型的機(jī)器人,最明顯特征腿比較長,主要是為提升運(yùn)動性能。天工2.0也有不同的版本,有七軸機(jī)械臂帶五指靈巧手的,能更好支持上肢具身智能相關(guān)的操作。

新京報(bào)貝殼財(cái)經(jīng):明年是否還會參加機(jī)器人馬拉松?是否還需要領(lǐng)跑員與陪護(hù)員?

唐劍:我們很快會具備自主導(dǎo)航能力,現(xiàn)在已經(jīng)在研發(fā),很快就能展示出全自主的導(dǎo)航。這樣天工將不再需要人類引導(dǎo)參加馬拉松,明年的機(jī)器人馬拉松有望看到無人引導(dǎo)的天工在奔跑。

新京報(bào)貝殼財(cái)經(jīng)記者 陳維城
編輯 徐倩
校對 王心