在具身智能領(lǐng)域低調(diào)已久的字節(jié),終于投出了在該賽道的第一筆直接投資。
1月12日,自變量機(jī)器人完成了10億元的A++輪融資,這是一家成立于2023年的具身智能企業(yè),此前,已吸引了美團(tuán)和阿里的投資。在這輪融資中,罕見的出現(xiàn)了字節(jié)跳動(dòng)。
2025年以來,具身智能賽道熱度攀升,互聯(lián)網(wǎng)大廠紛紛出手,騰訊、京東、美團(tuán)高調(diào)布局,只有字節(jié)顯得異常低調(diào)。
企查查數(shù)據(jù)顯示,字節(jié)上一波投資機(jī)器人的高峰期是2019-2021年,而在這一輪具身智能熱潮中,字節(jié)相對(duì)克制,特別是在2023年后成立的具身智能公司中,自變量是字節(jié)目前唯一一次出手。
這次出手,或許與創(chuàng)始人張一鳴的持續(xù)關(guān)注有關(guān)。
據(jù)《晚點(diǎn) LatePost》報(bào)道,2025年,張一鳴拜訪了一些早期具身智能創(chuàng)業(yè)公司和產(chǎn)業(yè)鏈公司,甚至有投資人評(píng)價(jià),在他這個(gè)級(jí)別的企業(yè)家里,很多人已經(jīng)不會(huì)見這么早期的創(chuàng)業(yè)者,張一鳴還保有很強(qiáng)的好奇心和想了解新東西的學(xué)習(xí)意愿。
互聯(lián)網(wǎng)大廠投資機(jī)器人,往往與自身業(yè)務(wù)戰(zhàn)略緊密相關(guān),叫做卡生態(tài)位。自變量機(jī)器人能夠做“最后100米配送”的事兒,從這個(gè)意義上來看,美團(tuán)和阿里投資自變量,不難理解,他們都有配送需求。但是對(duì)于字節(jié)來說,其背后戰(zhàn)略意圖又是什么呢?
01
WALL-A模型,自變量機(jī)器人
完成最后100米外賣配送
自變量機(jī)器人成立于2023年12月,創(chuàng)始人王潛畢業(yè)于清華大學(xué),博士期間,王潛曾在美國頂級(jí)機(jī)器人實(shí)驗(yàn)室參與多項(xiàng)機(jī)器人學(xué)習(xí)研究。
但是他并沒有繼續(xù)做機(jī)器人事業(yè),而是創(chuàng)立了量化基金公司,這也是王潛很后悔的事,后悔沒把機(jī)器人事業(yè)做下去。
后來王潛在工作中接觸到了OpenAI的GPT-3模型,于是決定回國創(chuàng)業(yè),創(chuàng)辦了自變量機(jī)器人。
該說不說,量化基金和AI是天然適配。做量化基金的梁文鋒推出了DeepSeek,同樣做量化的王潛,創(chuàng)辦了自變量機(jī)器人,都投身到了AI相關(guān)行業(yè)。
從一開始,自變量機(jī)器人就聚焦于“通用具身大模型”的技術(shù)研發(fā)。王潛選擇了“端到端統(tǒng)一VLA大模型”的技術(shù)路線,這也是當(dāng)時(shí)國內(nèi)唯一一家從第一天就選擇了端到端統(tǒng)一大模型技術(shù)的公司。
端到端的VLA(視覺-語言-行動(dòng))大模型,是目前行業(yè)的主流路徑。谷歌Gemini robotics、美國具身智能企業(yè)PI、Skild AI,都選擇了這條技術(shù)路線。
基于此,自變量自研的WALL-A模型,首創(chuàng)VLA與世界模型深度融合的系統(tǒng)范式,可以讓雙臂機(jī)器人完成例如衣物處理、收納整理、線束整理等多項(xiàng)復(fù)雜精細(xì)操作。
這一模型技術(shù)的可貴之處,在于機(jī)器人在部分未見過的新任務(wù)場景中展現(xiàn)出了零樣本泛化能力,這是實(shí)現(xiàn)通用機(jī)器人的關(guān)鍵標(biāo)志之一。
今年3月,接受《智能涌現(xiàn)》采訪時(shí),王潛表示,自變量機(jī)器人的模型水平基本上和PI、和google在同一個(gè)水平線上。而國內(nèi)廠商普遍才剛起步要往這個(gè)方向去做,進(jìn)度上就會(huì)差得比較多了。
也有投資人表示,宇樹和智元算第一梯隊(duì),融資金額都在15億元以上,自變量機(jī)器人融資金額超過10億元,已經(jīng)從二線企業(yè)進(jìn)入準(zhǔn)一線之列。
技術(shù)上的領(lǐng)先,讓自變量獲得了資本市場的青睞。企查查信息顯示,自變量機(jī)器人已累計(jì)獲得9次融資,融資至A++輪,其中更有2025年5月美團(tuán)獨(dú)投的數(shù)億元A輪融資,以及9月份阿里云的參投。
伴隨技術(shù)成熟,自變量也完成了從軟件到硬件的產(chǎn)品閉環(huán),不僅實(shí)現(xiàn)了機(jī)械臂、關(guān)節(jié)模組、動(dòng)力驅(qū)動(dòng)器等核心零部件全研與算法適配,還相繼發(fā)布了“量子一號(hào)”與“量子二號(hào)”兩款機(jī)器人本體。
2025年8月,自變量發(fā)布的全自研輪式雙臂仿人形機(jī)器人“量子2號(hào)(Quanta X2)”,能滿足智能倉儲(chǔ)(快遞分揀)、服務(wù)、家庭等復(fù)雜場景的需求。
真正展現(xiàn)其技術(shù)實(shí)力的,則是自變量不久前公開的一段實(shí)拍視頻:搭載WALL-A模型的“量子1號(hào)”機(jī)器人在真實(shí)開放環(huán)境中,全程自主完成了外賣配送“最后100米”的任務(wù),全程沒有人工干預(yù)。
自變量宣稱,這是全球首個(gè)基于VLA端到端模型,在真實(shí)開放場景下全程自主外賣配送的移動(dòng)操作范例。
其中包含“取件與拆箱回收”、“長距離自主配送”“和乘電梯精準(zhǔn)送達(dá)”三大環(huán)節(jié)。涉及不少技術(shù)難點(diǎn),譬如機(jī)器人從粘有魔術(shù)貼的外賣紙箱中取出餐食,這個(gè)過程是對(duì)機(jī)器人雙臂協(xié)同與力控能力的考驗(yàn);機(jī)器人將外賣紙箱折疊,塞入狹窄回收口,展現(xiàn)出端到端“力-位”控制技能。
這次演示也讓外界看到,自變量的機(jī)器人能夠在復(fù)雜真實(shí)環(huán)境中實(shí)現(xiàn)“用腦思考,用手干活”的潛力,也是一次硬件、技術(shù)與場景融合的突破。
02
雙線戰(zhàn)略浮現(xiàn),
字節(jié)在機(jī)器人上的野望
從大廠投資具身智能的普遍邏輯來看,往往與自身業(yè)務(wù)場景緊密相連。
譬如美團(tuán)對(duì)具身智能的投資,傾向于拓展無人化服務(wù)能力。與銀河通用合作,雙方打造由人形機(jī)器人值守運(yùn)營的24小時(shí)“無人”藥店。
那么字節(jié)投資自變量,背后又是什么邏輯?
這就要從字節(jié)的機(jī)器人戰(zhàn)略來看。
字節(jié)在機(jī)器人上的布局,很大程度上來自于張一鳴。早在2020年,張一鳴就對(duì)機(jī)器人表現(xiàn)出興趣,會(huì)不定期參與機(jī)器人項(xiàng)目討論。不過當(dāng)時(shí),字節(jié)的投入還是相對(duì)克制。
轉(zhuǎn)折點(diǎn)是2023年。據(jù)《晚點(diǎn) LatePost》報(bào)道,2023年中,張一鳴與字節(jié)跳動(dòng)CEO梁汝波等字節(jié)高管,和AI Lab機(jī)器人團(tuán)隊(duì)有一次會(huì)議討論,目的是探討字節(jié)機(jī)器人的方向。最終,目標(biāo)分為兩部分:一是生產(chǎn)機(jī)器人,服務(wù)字節(jié)的電商履約需求;二是關(guān)注技術(shù),將AI大模型能力用到機(jī)器人上。
所謂服務(wù)于電商履約,指的是機(jī)器人能在倉庫里揀貨、搬運(yùn)和打包貨物。抖音有自己的電商倉等,使用機(jī)器人能夠應(yīng)對(duì)在大促期間訂單暴增所帶來的揀選、搬運(yùn)等壓力。
當(dāng)時(shí),張一鳴還鼓勵(lì)團(tuán)隊(duì)把目標(biāo)定得大一點(diǎn)。當(dāng)年,字節(jié)就完成了200臺(tái)量產(chǎn)。后來,《晚點(diǎn) LatePost》在2025年7月報(bào)道稱,字節(jié)開發(fā)的機(jī)器人累計(jì)量產(chǎn)超千臺(tái),而且是輪式物流機(jī)器人。
對(duì)于上述消息,字母AI向字節(jié)方面求證,對(duì)方表示不予回應(yīng)。
此外,在量產(chǎn)方面,2025年,字節(jié)跳動(dòng)還與賽力斯合作,共同推動(dòng)人形機(jī)器人量產(chǎn)與應(yīng)用。
除了硬件量產(chǎn),字節(jié)也在推動(dòng)具身智能技術(shù)的進(jìn)步,特別是2025年以來明顯加速。
2025年7月,字節(jié)跳動(dòng)Seed團(tuán)隊(duì)推出VLA(視覺—語言—?jiǎng)幼髂P停┠P汀猄eed GR-3。
Seed是字節(jié)在人工智能領(lǐng)域的核心研發(fā)團(tuán)隊(duì),成立于2023年,研究方向中就有具身智能領(lǐng)域。自2023年開始,AI Lab團(tuán)隊(duì)開始陸續(xù)并入Seed。
據(jù)Seed團(tuán)隊(duì)介紹,GR-3模型能夠理解抽象指令、操作柔性物體,并具備良好的泛化能力,能夠有效處理長程任務(wù)并能進(jìn)行高靈巧度的操作。
為此,字節(jié)還同步開發(fā)了通用雙臂移動(dòng)機(jī)器人ByteMini,搭載GR-3,形成一套完整的解決方案。
12月,Seed團(tuán)隊(duì)又進(jìn)一步發(fā)布了GR-RL框架,讓機(jī)器人在真實(shí)場景中穩(wěn)定完成多步驟、高精度的操作任務(wù)。
一邊是技術(shù)推新,一邊是人才儲(chǔ)備。
2025年6月,Seed團(tuán)隊(duì)就被曝出招聘多個(gè)針對(duì)機(jī)器人產(chǎn)品、工程及具身智能大模型負(fù)責(zé)人。幾個(gè)月后,字節(jié)跳動(dòng)旗下火山引擎也啟動(dòng)招聘,例如“操作算法資深專家(具身智能)”,主導(dǎo)人形具身機(jī)器人操作算法、VLA模型研發(fā)等工作。
可見,在具身智能賽道,字節(jié)大致也是兩條腿走路,正采取“軟硬件結(jié)合、自研與投資并舉”的策略。
雖然字節(jié)在具身智能投資上表現(xiàn)相對(duì)保守,不過,和字節(jié)淵源頗深的錦秋基金,倒是多次出手?!懊咳战?jīng)濟(jì)新聞”報(bào)道,字節(jié)跳動(dòng)是錦秋基金的眾多LP之一。2025年,錦秋基金投資了星塵智能、因克斯、宇樹科技等具身智能企業(yè)。
這就不難理解,字節(jié)為什么投資自變量機(jī)器人,雙方有戰(zhàn)略契合點(diǎn)。在軟件方面,自變量的端到端的VLA模型WALL-A,擁有多模態(tài)思維鏈與零樣本泛化能力;在硬件層面,自變量的量子1號(hào)展現(xiàn)出來的智能倉儲(chǔ)能力,也是和字節(jié)現(xiàn)業(yè)務(wù)相輔相成的。
正如恒業(yè)資本創(chuàng)始合伙人江一表示,自變量的價(jià)值遠(yuǎn)超“最后一公里配送”的表象,而是正在構(gòu)建物理世界的基礎(chǔ)模型,這正是字節(jié)看重的戰(zhàn)略資產(chǎn)。自變量的端到端VLA技術(shù)路線,與字節(jié)的大模型基因形成互補(bǔ)。WALL-A模型的多模態(tài)思維鏈能力,可能為字節(jié)的AR/VR、智能硬件等業(yè)務(wù)提供底層支撐。
此外,江一還表示,字節(jié)跳動(dòng)雖不直接做配送,但其電商、本地生活等業(yè)務(wù)正在加速布局,自變量的柔性操作能力和泛化部署經(jīng)驗(yàn),可能成為字節(jié)突破線下場景智能化的關(guān)鍵技術(shù)跳板。
參考資料:
《自變量機(jī)器人王潛:具身智能大模型沒法抄國外作業(yè)》智能涌現(xiàn)
《這家公司成立兩年,獲8輪融資,美團(tuán)、阿里云重倉押注》中國企業(yè)家雜志
《字節(jié)要造機(jī)器人,團(tuán)隊(duì)計(jì)劃擴(kuò)充到百人》晚點(diǎn) LatePost
《2年半,字節(jié)造出千臺(tái)機(jī)器人,長期目標(biāo)是具身智能》晚點(diǎn) LatePost
《自變量獲字節(jié)、紅杉等10億元投資,構(gòu)建物理世界的基礎(chǔ)模型》自變量機(jī)器人
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)