黄色一级电影免费,图片一区二区三区

DoNews > 專(zhuān)欄 > 羅福莉再發(fā)聲，Agent時(shí)代模型訂閱制涼了？

羅福莉再發(fā)聲，Agent時(shí)代模型訂閱制涼了？

字母榜 2026-04-09 17:07:00

371136

分享到

“我會(huì)建議所有LLM公司，在搞清楚‘coding plan怎么定價(jià)不虧錢(qián)’之前，不要盲目打價(jià)格戰(zhàn)?！苯眨∶准瘓F(tuán)MiMo負(fù)責(zé)人羅福莉在X平臺(tái)發(fā)文，談及針對(duì)眼下的Token定價(jià)問(wèn)題發(fā)表看法。

讓羅福莉下場(chǎng)發(fā)聲的由頭很簡(jiǎn)單：Anthropic在近期調(diào)整了產(chǎn)品策略，不再允許用Claude訂閱運(yùn)行OpenClaw。

本月4日起，Claude的Pro和Max訂閱不再覆蓋OpenClaw等第三方框架，用戶(hù)如果還要繼續(xù)使用這些智能體，只能改為通過(guò)API按量付費(fèi)或購(gòu)買(mǎi)額外使用額度。

Claude官方解釋稱(chēng)：這類(lèi)調(diào)用對(duì)系統(tǒng)造成了“遠(yuǎn)超預(yù)期的壓力”。

而幾乎在同一時(shí)間，MiMo也推出了自家的Token Plan。

“Claude Code的訂閱機(jī)制在計(jì)算資源分配上設(shè)計(jì)得非常漂亮。但我認(rèn)為它并不賺錢(qián)甚至可能虧損，除非API利潤(rùn)率高出10到20倍。”在文中，羅福莉這樣分析道。

除了呼吁不打價(jià)格戰(zhàn)，羅福莉的另一個(gè)核心觀點(diǎn)是：長(zhǎng)期來(lái)看，Agent時(shí)代的模型正在迎接一個(gè)“被迫進(jìn)化”的過(guò)程，優(yōu)化上下文管理、復(fù)用已有計(jì)算結(jié)果、減少無(wú)效token消耗是接下來(lái)的迭代方向。

在她看來(lái)，Anthropic的這一步，正在推動(dòng)整個(gè)生態(tài)向這個(gè)方向：讓高效的Agent和高效的模型協(xié)同進(jìn)化。

不過(guò)，面對(duì)Anthropic這一策略調(diào)整，也有人選擇了不買(mǎi)賬。

OpenClaw作者Peter Steinberger在X上直接開(kāi)噴，他表示，曾嘗試與Anthropic溝通，但最終只爭(zhēng)取到一周的緩沖時(shí)間。

OpenClaw的廣大用戶(hù)群體無(wú)疑是這一輪調(diào)整的最大受害者，很多用戶(hù)訂閱Claude，本來(lái)就是為了運(yùn)行OpenClaw，而現(xiàn)在，這條路徑被直接切斷。

當(dāng)原本被認(rèn)為“高昂價(jià)格”的200美元的訂閱，突然間能跑出幾千美元的算力消耗，無(wú)疑是對(duì)廠商定價(jià)策略的一次考驗(yàn)。

另一方面，這并非是一句簡(jiǎn)單的“Token調(diào)用變多了”就能解釋的現(xiàn)象。Agent正在重塑Token的調(diào)用邏輯，而背后這筆賬，算起來(lái)還真有點(diǎn)復(fù)雜。

600倍浮動(dòng)下，模型該怎么定價(jià)

如果要用一個(gè)詞來(lái)解釋這場(chǎng)爭(zhēng)議的核心，那就是——波動(dòng)，不可預(yù)測(cè)的波動(dòng)。

南洋理工大學(xué)等團(tuán)隊(duì)在近期發(fā)布的研究《Beyond Max Tokens》顯示，在多輪工具調(diào)用的智能體場(chǎng)景中，同一個(gè)任務(wù)的計(jì)算消耗，可能出現(xiàn)最高658倍的差異。

一條看起來(lái)類(lèi)似的任務(wù)，有的幾千個(gè)計(jì)算單元就結(jié)束，有的則被拉到數(shù)萬(wàn)甚至更高。這意味著，模型的成本不只是變得更高，而是不可預(yù)測(cè)。

“我仔細(xì)觀察過(guò)OpenClaw的上下文管理——做得不怎么樣。”

解構(gòu)羅福莉在X上的發(fā)言，你能發(fā)現(xiàn)和南洋理工這份研究的契合之處。羅福莉發(fā)現(xiàn)，在OpenClaw的一個(gè)用戶(hù)請(qǐng)求里，往往會(huì)發(fā)起多輪低價(jià)值的工具調(diào)用，帶來(lái)了巨大的模型調(diào)用量的浪費(fèi)。

“真實(shí)成本很可能是訂閱價(jià)格的幾十倍。這不是差距——這是一個(gè)‘深坑’?！?/p>

羅福莉所說(shuō)“深坑”，問(wèn)題出在OpenClaw這類(lèi)智能體的運(yùn)行方式：一個(gè)任務(wù)往往需要多輪嘗試和回退，很多計(jì)算并不會(huì)直接產(chǎn)生結(jié)果，但依然消耗資源。

但這個(gè)消耗資源的具體量級(jí)很難測(cè)算，這也是Claude選擇封禁掉訂閱接入Agent的渠道，而不是選擇新設(shè)立一個(gè)“合理”定價(jià)的訂閱套餐。

總而言之，隨著Agent生態(tài)加速演變，Token用量的“合理”范圍，壓根無(wú)法準(zhǔn)確預(yù)估。

“我們一直在努力滿(mǎn)足不斷增長(zhǎng)的Claude需求，但我們的訂閱服務(wù)并非為這些第三方工具的使用模式而設(shè)計(jì)的?！闭劶斑@一次業(yè)務(wù)調(diào)整，Claude Code負(fù)責(zé)人Boris Cherny此前在X上這樣寫(xiě)道。

他表示：“Token是一種我們謹(jǐn)慎管理的資源，我們將優(yōu)先考慮使用我們產(chǎn)品和API的客戶(hù)?！?/p>

對(duì)于這一調(diào)整帶來(lái)的影響，有業(yè)內(nèi)分析稱(chēng)之為“自助餐已經(jīng)結(jié)束了”。OpenClaw開(kāi)啟了Agent的大航海時(shí)代，但也推翻了此前的模型定價(jià)門(mén)檻。一個(gè)OpenClaw代理運(yùn)行一天，就可能消耗1000到5000美元的API成本。

“Anthropic正在承擔(dān)每個(gè)通過(guò)第三方接口用戶(hù)所產(chǎn)生的這部分差價(jià)，”增長(zhǎng)營(yíng)銷(xiāo)專(zhuān)家Aakash Gupta在X上寫(xiě)道。“這就是一家公司眼睜睜看著利潤(rùn)實(shí)時(shí)蒸發(fā)的速度。”

成本完全失控，這是Anthropic不得不立刻做出反應(yīng)的原因。

在Chatbot形態(tài)里，訂閱制之所以能延續(xù)，是因?yàn)榭梢愿鶕?jù)歷史數(shù)據(jù)，統(tǒng)計(jì)出一個(gè)代表大部分用戶(hù)的用量均值：輕度用戶(hù)覆蓋重度用戶(hù)，整體成本可以被攤平。

但在Agent場(chǎng)景中，這種結(jié)構(gòu)被打破。重度使用不再是個(gè)例，而是由產(chǎn)品形態(tài)本身決定的結(jié)果。只要模型開(kāi)始“執(zhí)行任務(wù)”，就必然會(huì)出現(xiàn)長(zhǎng)鏈路調(diào)用、上下文膨脹和重復(fù)嘗試。

類(lèi)似的變化，其實(shí)已經(jīng)在其他產(chǎn)品中出現(xiàn)。此前當(dāng)Cursor在調(diào)整定價(jià)時(shí)，就從“按請(qǐng)求次數(shù)計(jì)費(fèi)”轉(zhuǎn)向“按實(shí)際Token成本折算的額度”，原因同樣是長(zhǎng)鏈路任務(wù)帶來(lái)的成本差異，已經(jīng)無(wú)法用固定配額衡量。

不過(guò)，用Token作為唯一定價(jià)、實(shí)算實(shí)銷(xiāo)的方式雖然看起來(lái)很科學(xué)，但是也帶來(lái)了新的問(wèn)題，Agent鏈路下Token用量不確定性依然存在，如果完全用實(shí)際Token用量核算，相當(dāng)于把這種不確定性轉(zhuǎn)嫁給了用戶(hù)。

因此，當(dāng)Anthropic發(fā)表聲明后，用戶(hù)不買(mǎi)賬的聲音也此起彼伏。

X上有許多用戶(hù)表示，切換到API計(jì)費(fèi)跑OpenClaw成本會(huì)嚴(yán)重攀升，使得他們不得不考慮其他途徑。

而已經(jīng)被OpenAI“收編”的OpenClaw創(chuàng)始人Steinberger，在X上“開(kāi)噴”也帶了一絲叫板的意味。

有外媒分析，OpenAI似乎正在將自己定位為一個(gè)更“易于上手”的替代方案，并可能利用這一契機(jī)，從不滿(mǎn)的Claude高級(jí)用戶(hù)那里獲取客戶(hù)。

知名媒體Axios此前在報(bào)道中披露，曾有一位行業(yè)資深人士表示，“Anthropic強(qiáng)調(diào)訓(xùn)練和運(yùn)行模型的效率，而OpenAI的心態(tài)是，CEO奧特曼總能籌集到更多資金來(lái)支持計(jì)算規(guī)模的擴(kuò)展?！?/p>

這場(chǎng)爭(zhēng)論的結(jié)局尚未可知，但毫無(wú)疑問(wèn)的是，在2026年的AI領(lǐng)域，第三方自動(dòng)化獲得補(bǔ)貼、無(wú)限計(jì)算能力的時(shí)代已經(jīng)結(jié)束。

不管采用哪種計(jì)費(fèi)邏輯，更謹(jǐn)慎、更細(xì)化的Token收費(fèi)模式已在路上。

配額不是唯一出路，但已是眼下最優(yōu)解

進(jìn)一步討論定價(jià)問(wèn)題前，有必要先解釋下目前模型產(chǎn)品的主流計(jì)費(fèi)模式。

目前主流模型廠商大致形成“三層計(jì)費(fèi)結(jié)構(gòu)”。第一層是訂閱制，面向個(gè)人用戶(hù)，如ChatGPT Plus、Claude Pro、Gemini Advanced，按月收費(fèi)，提供更強(qiáng)模型與更高調(diào)用上限，但通常伴隨速率與用量限制。

第二層是API按量計(jì)費(fèi)，以O(shè)penAI、Anthropic、Google以及國(guó)內(nèi)火山引擎、阿里云、智譜等公司，按token或等價(jià)計(jì)算量收費(fèi)，是開(kāi)發(fā)者與企業(yè)的核心結(jié)算方式。

在此之上，各家又推出Coding Plan/Token Plan等套餐，作為訂閱與按量之間的過(guò)渡形態(tài)：用戶(hù)按月付費(fèi)獲得一定額度與優(yōu)先權(quán)，但超額仍需按量付費(fèi)，并伴隨公平使用與限流機(jī)制。

在Agent場(chǎng)景中，這一分層尤為關(guān)鍵，自動(dòng)化調(diào)用大都只支持API按量計(jì)費(fèi)，訂閱與套餐難以覆蓋高強(qiáng)度、多輪調(diào)用的算力消耗。而大部分“訂閱模式”只針對(duì)一般用戶(hù)的Chatbot和內(nèi)嵌Agent功能。

隨著Anthropic針對(duì)Openclaw切換計(jì)費(fèi)方式，其他廠商也相繼做出反應(yīng)，是更直接的——漲價(jià)。

過(guò)去幾周時(shí)間里，一輪集中調(diào)價(jià)出現(xiàn)在國(guó)內(nèi)AI云廠商中。

騰訊云此前宣布，自上月13日起結(jié)束部分模型的免費(fèi)公測(cè)，并轉(zhuǎn)為正式收費(fèi)，同時(shí)對(duì)混元系列模型進(jìn)行大幅調(diào)價(jià)，部分價(jià)格漲幅超過(guò)400%。

隨后，阿里和百度方面也發(fā)布公告，本月月中開(kāi)始上調(diào)AI算力和存儲(chǔ)價(jià)格，整體漲幅在5%—30%區(qū)間。

而在幾天前智譜的財(cái)報(bào)電話會(huì)議上，CEO張鵬披露，2026年一季度接口調(diào)用價(jià)格提升了83%，但調(diào)用量仍然增長(zhǎng)400%。

接連幾家AI云廠商漲價(jià)，說(shuō)明了一件事：模型需求的增長(zhǎng)來(lái)得太快，甚至廠商的基建層都倍感壓力。

這一點(diǎn)在羅福莉的發(fā)文中也有體現(xiàn)：“更宏觀地看：全球的算力供給，跟不上agent帶來(lái)的token需求增長(zhǎng)。”真正的出路，不是更便宜的token，而是模型和Agent的‘協(xié)同進(jìn)化’?！?/p>

只是，在更高效的模型+Agent架構(gòu)面世之前，漲價(jià)或者限制訂閱，并不能解決這套計(jì)費(fèi)邏輯中的核心矛盾。

從用戶(hù)視角看，購(gòu)買(mǎi)的是“任務(wù)完成”；但從模型廠商的視角，計(jì)量的是“計(jì)算過(guò)程”。

這兩者之間，目前存在著明顯的錯(cuò)位。走訂閱，廠商要承擔(dān)Token調(diào)用不穩(wěn)定的風(fēng)險(xiǎn)；走API，這個(gè)風(fēng)險(xiǎn)又來(lái)到了用戶(hù)身上。

這也是為什么“訂閱+配額+API”的組合，同時(shí)出現(xiàn)在了各大廠商的落地方案中。

在Harness/Coding場(chǎng)景下，各類(lèi)plan本質(zhì)上是一種用戶(hù)與模型廠商之間的相互妥協(xié)：廠商通過(guò)Coding/Token Plan套餐鎖定一部分額度，換取用戶(hù)側(cè)的價(jià)格確定性，同時(shí)用限流和規(guī)則控制風(fēng)險(xiǎn)。

但在OpenClaw這類(lèi)更不受控的agent場(chǎng)景中，調(diào)用強(qiáng)度和路徑都難以約束，這種“妥協(xié)”很難成立，廠商們更多選擇 API按量計(jì)費(fèi)。

訂閱負(fù)責(zé)輕量使用，配額限制極端消耗，超額部分按量計(jì)費(fèi)。本質(zhì)上，這是一種對(duì)不確定性的緩沖機(jī)制。

不過(guò)，Token計(jì)價(jià)也并不是唯一的解法，行業(yè)內(nèi)已經(jīng)在探索一些“另類(lèi)”的模型收費(fèi)模式。

一類(lèi)是按任務(wù)收費(fèi)。比如Anthropic在Claude Code中推出的Code Review功能，直接按一次PR審查計(jì)價(jià)，單次review平均成本在15–25美元，并隨代碼規(guī)模和復(fù)雜度浮動(dòng)。

二是按結(jié)果收費(fèi)，已經(jīng)在企業(yè)側(cè)落地，比如智能客服、RPA廠商按“問(wèn)題解決”或“流程完成”計(jì)價(jià)；還有一種是按時(shí)間收費(fèi)，比如xAI的語(yǔ)音agent按運(yùn)行時(shí)長(zhǎng)計(jì)費(fèi)，約0.05美元/分鐘）。

幾天前，在火山引擎武漢站巡展活動(dòng)中，當(dāng)字母AI問(wèn)及“面對(duì)模型調(diào)用激增、Token消耗存在不確定性的現(xiàn)狀，模型廠商該如何優(yōu)化定價(jià)策略？”時(shí)，火山引擎總裁譚待這樣回應(yīng)：

“目前OpenClaw這類(lèi)通用型平臺(tái)適合按Token收費(fèi)，因?yàn)槠鋺?yīng)用場(chǎng)景廣泛，無(wú)法統(tǒng)一定義效果和成本。”譚待同時(shí)表示，未來(lái)可能會(huì)孵化出垂直領(lǐng)域的智能體，如客服智能體，就可以按回答問(wèn)題的數(shù)量收費(fèi)。“類(lèi)似線下找客服的模式，按效果付費(fèi)?！?/p>

“（Anthropic的這一步）大概率是一件好事。Agent時(shí)代不屬于消耗最多算力的人，而屬于最會(huì)使用算力的人?！痹谀瞧l(fā)文最后，羅福莉這樣總結(jié)道。

顯然，圍繞Token收費(fèi)的爭(zhēng)論還將持續(xù)下去，這一爭(zhēng)論將取決于未來(lái)模型-Agent在效率層面的迭代情況。

我們可以確定的是，過(guò)去一度被壓到幾厘錢(qián)每Token的單價(jià)，在這個(gè)調(diào)用量激增、鏈路無(wú)限延伸的Agent爆發(fā)周期，已經(jīng)變成了每一個(gè)用戶(hù)都無(wú)法忽視的成本因素。

Agent大航海時(shí)代，Token收費(fèi)這筆賬，值得每一個(gè)廠商認(rèn)真盤(pán)一盤(pán)。

特別聲明：本文為合作媒體授權(quán)DoNews專(zhuān)欄轉(zhuǎn)載，文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn)，不代表DoNews專(zhuān)欄的立場(chǎng)，轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問(wèn)都請(qǐng)聯(lián)系idonews@donews.com)

標(biāo)簽: 羅福莉 Token 小米 AI 大模型

關(guān)于我們| 電子協(xié)議| 合作聯(lián)系| 蜀ICP備2024059877號(hào)-1

網(wǎng)站信息

Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號(hào)-1
聯(lián)系地址：北京市海淀區(qū)寶盛東路興華綠色產(chǎn)業(yè)樓3層307室（東升地區(qū)）
郵箱：jubao@infinities.com.cn
網(wǎng)上有害信息舉報(bào)專(zhuān)區(qū): www.12377.cn

京公網(wǎng)安備11010802023059號(hào)