拒絕第三方賺差價，機器人企業(yè)轉(zhuǎn)向二次開發(fā)

2025-11-13 07:31:35 第一財經(jīng)

　　拒絕第三方賺差價，機器人企業(yè)轉(zhuǎn)向二次開發(fā)

　　作者：喬心怡

　　人形機器人，正忙著“搭臺”。

　　近日，包括北京人形機器人創(chuàng)新中心、宇樹科技和智元機器人以及等多家在內(nèi)的機器人企業(yè)均對外發(fā)布了用于二次開發(fā)的工具型平臺。有的平臺主要目標客群是產(chǎn)業(yè)部署方，有的則是科研院校開發(fā)者、租賃商。從控制接口到工具鏈條，這些平臺看似方向各異，卻有一個共同指向，讓機器人更好用、更能賣。

　　各家公司開始意識到，真正決定競爭力的，不是機器人能做多少高難度動作，而是用更完善的工具讓客戶用起來。推出二次開發(fā)平臺，正在成為人形機器人競爭的“第二戰(zhàn)場”，它既是吸引開發(fā)者的利器，也是企業(yè)商業(yè)化“帶貨”的抓手�；蛟S，機器人企業(yè)搭的每一個“臺”，都是在為下一輪在市場中“唱戲”鋪路。

　　機器人能聽懂但不會做，自定義開發(fā)成“剛需”

　　“我們大概有一周的時間，是住在工廠里的�！�

　　在深圳福田的康明斯發(fā)動機工廠，北京人形機器人創(chuàng)新中心(以下簡稱“北京人形”)的人形機器人天工和天軼2.0正在無人生產(chǎn)線中完成上下料的工作。

　　北京人形具身智能部門負責人車正平向第一財經(jīng)記者表示，在部署過程中，團隊發(fā)現(xiàn)不同工位、不同任務(wù)對感知與控制能力的要求差異較大。

　　“除了能復(fù)用、標準化的開發(fā)流程以外，用戶需要能夠自定義開發(fā)和部署的工具�！�

　　北京人形于近日開源了具身智能平臺“慧思開物”SDK，包括了大腦、小腦以及供技能調(diào)用和部署的工具鏈。記者注意到，在北京人形此次開源的大模型采用的并非只基于當前行業(yè)內(nèi)主流的端到端VLA(Vision-Language-Action，視覺語言動作模型)，而是采用了分層的模型架構(gòu)。

　　“行業(yè)中的VLA很多，但從實際場景的運行效果上來看，并不一定是最好的。”車正平告訴第一財經(jīng)記者，由于端到端VLA一個模型直出的特性，算法的黑箱性成為了落地場景中最不可控的“雷”。“也許機器人能夠理解人類的指令，但最終的動作執(zhí)行，仍然會有偏差�！�

　　在流水線裝配等高節(jié)拍的場景中，機器人光聽懂指令，是遠遠不夠的。

　　“機器人也許可以通過大腦理解‘把零件放進托盤’的指令，但由于模型缺乏對空間約束和力控反饋的建模，可能會放歪或者產(chǎn)生碰撞�！避囌秸f，這會導(dǎo)致機器人導(dǎo)致無法穩(wěn)定地連續(xù)作業(yè)，必要時需要工程師進行自定義調(diào)整，以配合產(chǎn)線節(jié)拍和實際情況。

　　相比端到端直出的VLA模型，分層模型則需要先建模、再規(guī)劃、最后執(zhí)行。不過，一位端到端VLA算法工程師告訴第一財經(jīng)記者，分層帶來的結(jié)構(gòu)化優(yōu)勢，也伴隨著誤差傳導(dǎo)的風險。

　　隨著每一層模型的傳遞，模型在某一層產(chǎn)生的微小誤差，“這會在后續(xù)的環(huán)節(jié)呈現(xiàn)指數(shù)級的擴散”。

　　這意味著，每分出一個步驟，就有可能給模型引入噪聲。他告訴記者，如果采用分層模型的機器人在環(huán)境建模階段對工位位置的識別偏差只有1%，后續(xù)路徑規(guī)劃和控制執(zhí)行在多輪迭代中就可能將這一誤差放大幾十倍，“這可能導(dǎo)致機械臂在毫米級精度任務(wù)中出現(xiàn)明顯偏移，甚至影響生產(chǎn)線節(jié)拍”。

　　為避免多層決策中誤差被放大，車正平選擇讓視覺語言模型(VLM)與世界模型組成機器人的“大腦”。

　　“我們讓VLM和世界模型相互糾偏作為大腦，再與VLA等構(gòu)建的技能庫模型協(xié)作�！避囌礁嬖V第一財經(jīng)記者，慧思開物將VLM部署在云端，用于理解人類指令、規(guī)劃任務(wù)并生成執(zhí)行策略；而世界模型負責對物理世界進行建模與預(yù)測，相當于一個“虛擬演練場”。

　　世界模型把“演練”結(jié)果反饋給VLM，幫助它理解策略的實際效果，在調(diào)整和學習中提升任務(wù)規(guī)劃的準確性，反過來又讓世界模型的物理預(yù)測更加精確。

　　二者通過反饋機制相互作用，機器人最終有機會實現(xiàn)“自我校正”。車正平認為，這種能力需要在復(fù)雜、多變的真實環(huán)境中持續(xù)進化，而要讓機器人不斷學習、適應(yīng)，就需要開放的數(shù)據(jù)接口和開發(fā)生態(tài)作為支撐。正因如此，除了硬件和算法，開放的開發(fā)工具與生態(tài)接口，正成為機器人企業(yè)競爭的新關(guān)鍵。

　　頻推開發(fā)工具，機器人企業(yè)“搭臺”為賣貨

　　給用戶提供完整的開發(fā)工具，這一點并不只有北京人形想到了。

　　11月6日，宇樹科技發(fā)布了全身遙操作平臺，人類通過遙操設(shè)備能夠讓G1機器人復(fù)現(xiàn)人類的全身動作，包括洗碗、整理衣服、拳擊對練等動作。10月底，智元機器人正式推出首個0代碼、0門檻的機器人內(nèi)容創(chuàng)作平臺靈創(chuàng)平臺。

　　“現(xiàn)階段，同尺寸的機器人已經(jīng)很難拉開巨大的差距了，用戶為什么買你的機器人，不買其他家的，需要新的理由。”深圳一家機器人公司的高管Eddie(化名)告訴第一財經(jīng)記者，不同于今年年初，宇樹硬件表現(xiàn)出“斷層”的狀況，人形機器人行業(yè)在過去的十個月里，成長速度非�？�。

　　他認為，各家專注的賽道不一樣，推出的開發(fā)工具也有所側(cè)重�！坝顦涞挠布䞍�(yōu)勢仍然在，遙操平臺的推出，也有機會讓宇樹獲得大規(guī)模、高保真的人類動作數(shù)據(jù)，加速機器人AI側(cè)的閉環(huán)形成�！盓ddie說，全身遙操平臺對于宇樹來說不僅僅是控制工具，也有可能是讓其突破表演場景的試水平臺。

　　智元的目標指向則更為明確。智元推出的靈心、靈創(chuàng)平臺主要用于租賃商等用戶能夠不用通過編程，來“自定義”機器人的運動表現(xiàn)和“人設(shè)”。

　　一位租賃商告訴記者，如果沒有這個平臺，想要讓機器人絲滑地跳一支舞，“哪怕只有三分鐘的時間，也可能需要兩三萬元”。智元機器人合伙人、高級副總裁、營銷服總裁姜青松告訴第一財經(jīng)記者，針對這兩個平臺，智元也設(shè)定了付費的機制。

　　“原先是第三方團隊賺的錢，企業(yè)現(xiàn)在要拿到自己手里賺�！�

　　Eddie告訴記者，盡管平臺建設(shè)在前期意味著高投入和長周期，不僅要搭建算法與交互框架，還要投入人力去維護內(nèi)容生態(tài)，但一旦用戶數(shù)量和內(nèi)容積累形成規(guī)模效應(yīng)，回報將十分可觀�！昂笃诘氖找娌粌H來自軟件訂閱或功能付費，更重要的是用戶黏性的提升。”他說。

　　車正平告訴第一財經(jīng)記者，北京人形的慧思開物平臺則更多是從機器人應(yīng)用開發(fā)落地的痛點中倒推出來的�！安煌臋C器人作業(yè)環(huán)境、機械接口、任務(wù)節(jié)拍差異巨大，標準化算法往往‘下不去’，而完全定制又成本過高�！比绻幸粋€平臺能夠解決“最后一公里”的落地問題，讓用戶能夠根據(jù)自身工位需求快速二次開發(fā)或集成新任務(wù)模塊，“那也會增強機器人本身的市場競爭力”。

　　“如果企業(yè)想要在資本側(cè)有一些大動作，商業(yè)化，也就是‘賣貨’的數(shù)據(jù)還是比較重要的�！盓ddie說，這場由平臺化工具引發(fā)的新競爭，最終比拼的將不只是技術(shù)迭代的速度，而是誰能率先構(gòu)建起真正可持續(xù)的機器人生態(tài)。“對于企業(yè)來說，賣出去一個機器人只是開始，能不能讓它被持續(xù)使用、被更多人開發(fā)至應(yīng)用落地，才是更大的考驗�！�

來源：第一財經(jīng)

編輯：董文博

廣告等商務(wù)合作，請點擊這里

本文為轉(zhuǎn)載內(nèi)容，授權(quán)事宜請聯(lián)系原著作權(quán)人

中新經(jīng)緯版權(quán)所有，未經(jīng)書面授權(quán)，任何單位及個人不得轉(zhuǎn)載、摘編或以其它方式使用。

關(guān)注中新經(jīng)緯微信公眾號(微信搜索“中新經(jīng)緯”或“jwview”)，看更多精彩財經(jīng)資訊。

今日推薦