拒絕第三方賺差價,機器人企業(yè)轉(zhuǎn)向二次開發(fā)
作者:喬心怡
人形機器人,正忙著“搭臺”。
近日,包括北京人形機器人創(chuàng)新中心、宇樹科技和智元機器人以及等多家在內(nèi)的機器人企業(yè)均對外發(fā)布了用于二次開發(fā)的工具型平臺。有的平臺主要目標客群是產(chǎn)業(yè)部署方,有的則是科研院校開發(fā)者、租賃商。從控制接口到工具鏈條,這些平臺看似方向各異,卻有一個共同指向,讓機器人更好用、更能賣。
各家公司開始意識到,真正決定競爭力的,不是機器人能做多少高難度動作,而是用更完善的工具讓客戶用起來。推出二次開發(fā)平臺,正在成為人形機器人競爭的“第二戰(zhàn)場”,它既是吸引開發(fā)者的利器,也是企業(yè)商業(yè)化“帶貨”的抓手;蛟S,機器人企業(yè)搭的每一個“臺”,都是在為下一輪在市場中“唱戲”鋪路。
機器人能聽懂但不會做,自定義開發(fā)成“剛需”
“我們大概有一周的時間,是住在工廠里的!
在深圳福田的康明斯發(fā)動機工廠,北京人形機器人創(chuàng)新中心(以下簡稱“北京人形”)的人形機器人天工和天軼2.0正在無人生產(chǎn)線中完成上下料的工作。
北京人形具身智能部門負責人車正平向第一財經(jīng)記者表示,在部署過程中,團隊發(fā)現(xiàn)不同工位、不同任務(wù)對感知與控制能力的要求差異較大。
“除了能復(fù)用、標準化的開發(fā)流程以外,用戶需要能夠自定義開發(fā)和部署的工具!
北京人形于近日開源了具身智能平臺“慧思開物”SDK,包括了大腦、小腦以及供技能調(diào)用和部署的工具鏈。記者注意到,在北京人形此次開源的大模型采用的并非只基于當前行業(yè)內(nèi)主流的端到端VLA(Vision-Language-Action,視覺語言動作模型),而是采用了分層的模型架構(gòu)。
“行業(yè)中的VLA很多,但從實際場景的運行效果上來看,并不一定是最好的。”車正平告訴第一財經(jīng)記者,由于端到端VLA一個模型直出的特性,算法的黑箱性成為了落地場景中最不可控的“雷”。“也許機器人能夠理解人類的指令,但最終的動作執(zhí)行,仍然會有偏差!
在流水線裝配等高節(jié)拍的場景中,機器人光聽懂指令,是遠遠不夠的。
“機器人也許可以通過大腦理解‘把零件放進托盤’的指令,但由于模型缺乏對空間約束和力控反饋的建模,可能會放歪或者產(chǎn)生碰撞!避囌秸f,這會導(dǎo)致機器人導(dǎo)致無法穩(wěn)定地連續(xù)作業(yè),必要時需要工程師進行自定義調(diào)整,以配合產(chǎn)線節(jié)拍和實際情況。
相比端到端直出的VLA模型,分層模型則需要先建模、再規(guī)劃、最后執(zhí)行。不過,一位端到端VLA算法工程師告訴第一財經(jīng)記者,分層帶來的結(jié)構(gòu)化優(yōu)勢,也伴隨著誤差傳導(dǎo)的風險。
隨著每一層模型的傳遞,模型在某一層產(chǎn)生的微小誤差,“這會在后續(xù)的環(huán)節(jié)呈現(xiàn)指數(shù)級的擴散”。
這意味著,每分出一個步驟,就有可能給模型引入噪聲。他告訴記者,如果采用分層模型的機器人在環(huán)境建模階段對工位位置的識別偏差只有1%,后續(xù)路徑規(guī)劃和控制執(zhí)行在多輪迭代中就可能將這一誤差放大幾十倍,“這可能導(dǎo)致機械臂在毫米級精度任務(wù)中出現(xiàn)明顯偏移,甚至影響生產(chǎn)線節(jié)拍”。
為避免多層決策中誤差被放大,車正平選擇讓視覺語言模型(VLM)與世界模型組成機器人的“大腦”。
“我們讓VLM和世界模型相互糾偏作為大腦,再與VLA等構(gòu)建的技能庫模型協(xié)作!避囌礁嬖V第一財經(jīng)記者,慧思開物將VLM部署在云端,用于理解人類指令、規(guī)劃任務(wù)并生成執(zhí)行策略;而世界模型負責對物理世界進行建模與預(yù)測,相當于一個“虛擬演練場”。
世界模型把“演練”結(jié)果反饋給VLM,幫助它理解策略的實際效果,在調(diào)整和學習中提升任務(wù)規(guī)劃的準確性,反過來又讓世界模型的物理預(yù)測更加精確。
二者通過反饋機制相互作用,機器人最終有機會實現(xiàn)“自我校正”。車正平認為,這種能力需要在復(fù)雜、多變的真實環(huán)境中持續(xù)進化,而要讓機器人不斷學習、適應(yīng),就需要開放的數(shù)據(jù)接口和開發(fā)生態(tài)作為支撐。正因如此,除了硬件和算法,開放的開發(fā)工具與生態(tài)接口,正成為機器人企業(yè)競爭的新關(guān)鍵。
頻推開發(fā)工具,機器人企業(yè)“搭臺”為賣貨
給用戶提供完整的開發(fā)工具,這一點并不只有北京人形想到了。
11月6日,宇樹科技發(fā)布了全身遙操作平臺,人類通過遙操設(shè)備能夠讓G1機器人復(fù)現(xiàn)人類的全身動作,包括洗碗、整理衣服、拳擊對練等動作。10月底,智元機器人正式推出首個0代碼、0門檻的機器人內(nèi)容創(chuàng)作平臺靈創(chuàng)平臺。
“現(xiàn)階段,同尺寸的機器人已經(jīng)很難拉開巨大的差距了,用戶為什么買你的機器人,不買其他家的,需要新的理由。”深圳一家機器人公司的高管Eddie(化名)告訴第一財經(jīng)記者,不同于今年年初,宇樹硬件表現(xiàn)出“斷層”的狀況,人形機器人行業(yè)在過去的十個月里,成長速度非?。
他認為,各家專注的賽道不一樣,推出的開發(fā)工具也有所側(cè)重!坝顦涞挠布䞍(yōu)勢仍然在,遙操平臺的推出,也有機會讓宇樹獲得大規(guī)模、高保真的人類動作數(shù)據(jù),加速機器人AI側(cè)的閉環(huán)形成!盓ddie說,全身遙操平臺對于宇樹來說不僅僅是控制工具,也有可能是讓其突破表演場景的試水平臺。
智元的目標指向則更為明確。智元推出的靈心、靈創(chuàng)平臺主要用于租賃商等用戶能夠不用通過編程,來“自定義”機器人的運動表現(xiàn)和“人設(shè)”。
一位租賃商告訴記者,如果沒有這個平臺,想要讓機器人絲滑地跳一支舞,“哪怕只有三分鐘的時間,也可能需要兩三萬元”。智元機器人合伙人、高級副總裁、營銷服總裁姜青松告訴第一財經(jīng)記者,針對這兩個平臺,智元也設(shè)定了付費的機制。
“原先是第三方團隊賺的錢,企業(yè)現(xiàn)在要拿到自己手里賺!
Eddie告訴記者,盡管平臺建設(shè)在前期意味著高投入和長周期,不僅要搭建算法與交互框架,還要投入人力去維護內(nèi)容生態(tài),但一旦用戶數(shù)量和內(nèi)容積累形成規(guī)模效應(yīng),回報將十分可觀!昂笃诘氖找娌粌H來自軟件訂閱或功能付費,更重要的是用戶黏性的提升。”他說。
車正平告訴第一財經(jīng)記者,北京人形的慧思開物平臺則更多是從機器人應(yīng)用開發(fā)落地的痛點中倒推出來的!安煌臋C器人作業(yè)環(huán)境、機械接口、任務(wù)節(jié)拍差異巨大,標準化算法往往‘下不去’,而完全定制又成本過高!比绻幸粋平臺能夠解決“最后一公里”的落地問題,讓用戶能夠根據(jù)自身工位需求快速二次開發(fā)或集成新任務(wù)模塊,“那也會增強機器人本身的市場競爭力”。
“如果企業(yè)想要在資本側(cè)有一些大動作,商業(yè)化,也就是‘賣貨’的數(shù)據(jù)還是比較重要的!盓ddie說,這場由平臺化工具引發(fā)的新競爭,最終比拼的將不只是技術(shù)迭代的速度,而是誰能率先構(gòu)建起真正可持續(xù)的機器人生態(tài)。“對于企業(yè)來說,賣出去一個機器人只是開始,能不能讓它被持續(xù)使用、被更多人開發(fā)至應(yīng)用落地,才是更大的考驗!
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責任。
[京B2-20230170] [京ICP備17012796號-1]
[互聯(lián)網(wǎng)新聞信息服務(wù)許可證10120220005] [互聯(lián)網(wǎng)宗教信息服務(wù)許可證:京(2022)0000107]
違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司