“我會(huì)建議所有LLM公司,在搞清楚‘coding plan怎么定價(jià)不虧錢(qián)’之前,不要盲目打價(jià)格戰(zhàn)?!苯眨∶准瘓F(tuán)MiMo負(fù)責(zé)人羅福莉在X平臺(tái)發(fā)文,談及針對(duì)眼下的Token定價(jià)問(wèn)題發(fā)表看法。
讓羅福莉下場(chǎng)發(fā)聲的由頭很簡(jiǎn)單:Anthropic在近期調(diào)整了產(chǎn)品策略,不再允許用Claude訂閱運(yùn)行OpenClaw。
本月4日起,Claude的Pro和Max訂閱不再覆蓋OpenClaw等第三方框架,用戶(hù)如果還要繼續(xù)使用這些智能體,只能改為通過(guò)API按量付費(fèi)或購(gòu)買(mǎi)額外使用額度。
Claude官方解釋稱(chēng):這類(lèi)調(diào)用對(duì)系統(tǒng)造成了“遠(yuǎn)超預(yù)期的壓力”。
而幾乎在同一時(shí)間,MiMo也推出了自家的Token Plan。
“Claude Code的訂閱機(jī)制在計(jì)算資源分配上設(shè)計(jì)得非常漂亮。但我認(rèn)為它并不賺錢(qián)甚至可能虧損,除非API利潤(rùn)率高出10到20倍。”在文中,羅福莉這樣分析道。
除了呼吁不打價(jià)格戰(zhàn),羅福莉的另一個(gè)核心觀點(diǎn)是:長(zhǎng)期來(lái)看,Agent時(shí)代的模型正在迎接一個(gè)“被迫進(jìn)化”的過(guò)程,優(yōu)化上下文管理、復(fù)用已有計(jì)算結(jié)果、減少無(wú)效token消耗是接下來(lái)的迭代方向。
在她看來(lái),Anthropic的這一步,正在推動(dòng)整個(gè)生態(tài)向這個(gè)方向:讓高效的Agent和高效的模型協(xié)同進(jìn)化。
不過(guò),面對(duì)Anthropic這一策略調(diào)整,也有人選擇了不買(mǎi)賬。
OpenClaw作者Peter Steinberger在X上直接開(kāi)噴,他表示,曾嘗試與Anthropic溝通,但最終只爭(zhēng)取到一周的緩沖時(shí)間。
OpenClaw的廣大用戶(hù)群體無(wú)疑是這一輪調(diào)整的最大受害者,很多用戶(hù)訂閱Claude,本來(lái)就是為了運(yùn)行OpenClaw,而現(xiàn)在,這條路徑被直接切斷。
當(dāng)原本被認(rèn)為“高昂價(jià)格”的200美元的訂閱,突然間能跑出幾千美元的算力消耗,無(wú)疑是對(duì)廠商定價(jià)策略的一次考驗(yàn)。
另一方面,這并非是一句簡(jiǎn)單的“Token調(diào)用變多了”就能解釋的現(xiàn)象。Agent正在重塑Token的調(diào)用邏輯,而背后這筆賬,算起來(lái)還真有點(diǎn)復(fù)雜。
01
600倍浮動(dòng)下,模型該怎么定價(jià)
如果要用一個(gè)詞來(lái)解釋這場(chǎng)爭(zhēng)議的核心,那就是——波動(dòng),不可預(yù)測(cè)的波動(dòng)。
南洋理工大學(xué)等團(tuán)隊(duì)在近期發(fā)布的研究《Beyond Max Tokens》顯示,在多輪工具調(diào)用的智能體場(chǎng)景中,同一個(gè)任務(wù)的計(jì)算消耗,可能出現(xiàn)最高658倍的差異。
一條看起來(lái)類(lèi)似的任務(wù),有的幾千個(gè)計(jì)算單元就結(jié)束,有的則被拉到數(shù)萬(wàn)甚至更高。這意味著,模型的成本不只是變得更高,而是不可預(yù)測(cè)。
“我仔細(xì)觀察過(guò)OpenClaw的上下文管理——做得不怎么樣。”
解構(gòu)羅福莉在X上的發(fā)言,你能發(fā)現(xiàn)和南洋理工這份研究的契合之處。羅福莉發(fā)現(xiàn),在OpenClaw的一個(gè)用戶(hù)請(qǐng)求里,往往會(huì)發(fā)起多輪低價(jià)值的工具調(diào)用,帶來(lái)了巨大的模型調(diào)用量的浪費(fèi)。
“真實(shí)成本很可能是訂閱價(jià)格的幾十倍。這不是差距——這是一個(gè)‘深坑’?!?/p>
羅福莉所說(shuō)“深坑”,問(wèn)題出在OpenClaw這類(lèi)智能體的運(yùn)行方式:一個(gè)任務(wù)往往需要多輪嘗試和回退,很多計(jì)算并不會(huì)直接產(chǎn)生結(jié)果,但依然消耗資源。
但這個(gè)消耗資源的具體量級(jí)很難測(cè)算,這也是Claude選擇封禁掉訂閱接入Agent的渠道,而不是選擇新設(shè)立一個(gè)“合理”定價(jià)的訂閱套餐。
總而言之,隨著Agent生態(tài)加速演變,Token用量的“合理”范圍,壓根無(wú)法準(zhǔn)確預(yù)估。
“我們一直在努力滿(mǎn)足不斷增長(zhǎng)的Claude需求,但我們的訂閱服務(wù)并非為這些第三方工具的使用模式而設(shè)計(jì)的?!闭劶斑@一次業(yè)務(wù)調(diào)整,Claude Code負(fù)責(zé)人Boris Cherny此前在X上這樣寫(xiě)道。
他表示:“Token是一種我們謹(jǐn)慎管理的資源,我們將優(yōu)先考慮使用我們產(chǎn)品和API的客戶(hù)?!?/p>
對(duì)于這一調(diào)整帶來(lái)的影響,有業(yè)內(nèi)分析稱(chēng)之為“自助餐已經(jīng)結(jié)束了”。OpenClaw開(kāi)啟了Agent的大航海時(shí)代,但也推翻了此前的模型定價(jià)門(mén)檻。一個(gè)OpenClaw代理運(yùn)行一天,就可能消耗1000到5000美元的API成本。
“Anthropic正在承擔(dān)每個(gè)通過(guò)第三方接口用戶(hù)所產(chǎn)生的這部分差價(jià),”增長(zhǎng)營(yíng)銷(xiāo)專(zhuān)家Aakash Gupta在X上寫(xiě)道。“這就是一家公司眼睜睜看著利潤(rùn)實(shí)時(shí)蒸發(fā)的速度。”
成本完全失控,這是Anthropic不得不立刻做出反應(yīng)的原因。
在Chatbot形態(tài)里,訂閱制之所以能延續(xù),是因?yàn)榭梢愿鶕?jù)歷史數(shù)據(jù),統(tǒng)計(jì)出一個(gè)代表大部分用戶(hù)的用量均值:輕度用戶(hù)覆蓋重度用戶(hù),整體成本可以被攤平。
但在Agent場(chǎng)景中,這種結(jié)構(gòu)被打破。重度使用不再是個(gè)例,而是由產(chǎn)品形態(tài)本身決定的結(jié)果。只要模型開(kāi)始“執(zhí)行任務(wù)”,就必然會(huì)出現(xiàn)長(zhǎng)鏈路調(diào)用、上下文膨脹和重復(fù)嘗試。
類(lèi)似的變化,其實(shí)已經(jīng)在其他產(chǎn)品中出現(xiàn)。此前當(dāng)Cursor在調(diào)整定價(jià)時(shí),就從“按請(qǐng)求次數(shù)計(jì)費(fèi)”轉(zhuǎn)向“按實(shí)際Token成本折算的額度”,原因同樣是長(zhǎng)鏈路任務(wù)帶來(lái)的成本差異,已經(jīng)無(wú)法用固定配額衡量。
不過(guò),用Token作為唯一定價(jià)、實(shí)算實(shí)銷(xiāo)的方式雖然看起來(lái)很科學(xué),但是也帶來(lái)了新的問(wèn)題,Agent鏈路下Token用量不確定性依然存在,如果完全用實(shí)際Token用量核算,相當(dāng)于把這種不確定性轉(zhuǎn)嫁給了用戶(hù)。
因此,當(dāng)Anthropic發(fā)表聲明后,用戶(hù)不買(mǎi)賬的聲音也此起彼伏。
X上有許多用戶(hù)表示,切換到API計(jì)費(fèi)跑OpenClaw成本會(huì)嚴(yán)重攀升,使得他們不得不考慮其他途徑。
而已經(jīng)被OpenAI“收編”的OpenClaw創(chuàng)始人Steinberger,在X上“開(kāi)噴”也帶了一絲叫板的意味。
有外媒分析,OpenAI似乎正在將自己定位為一個(gè)更“易于上手”的替代方案,并可能利用這一契機(jī),從不滿(mǎn)的Claude高級(jí)用戶(hù)那里獲取客戶(hù)。
知名媒體Axios此前在報(bào)道中披露,曾有一位行業(yè)資深人士表示,“Anthropic強(qiáng)調(diào)訓(xùn)練和運(yùn)行模型的效率,而OpenAI的心態(tài)是,CEO奧特曼總能籌集到更多資金來(lái)支持計(jì)算規(guī)模的擴(kuò)展?!?/p>
這場(chǎng)爭(zhēng)論的結(jié)局尚未可知,但毫無(wú)疑問(wèn)的是,在2026年的AI領(lǐng)域,第三方自動(dòng)化獲得補(bǔ)貼、無(wú)限計(jì)算能力的時(shí)代已經(jīng)結(jié)束。
不管采用哪種計(jì)費(fèi)邏輯,更謹(jǐn)慎、更細(xì)化的Token收費(fèi)模式已在路上。
02
配額不是唯一出路,但已是眼下最優(yōu)解
進(jìn)一步討論定價(jià)問(wèn)題前,有必要先解釋下目前模型產(chǎn)品的主流計(jì)費(fèi)模式。
目前主流模型廠商大致形成“三層計(jì)費(fèi)結(jié)構(gòu)”。第一層是訂閱制,面向個(gè)人用戶(hù),如ChatGPT Plus、Claude Pro、Gemini Advanced,按月收費(fèi),提供更強(qiáng)模型與更高調(diào)用上限,但通常伴隨速率與用量限制。
第二層是API按量計(jì)費(fèi),以O(shè)penAI、Anthropic、Google以及國(guó)內(nèi)火山引擎、阿里云、智譜等公司,按token或等價(jià)計(jì)算量收費(fèi),是開(kāi)發(fā)者與企業(yè)的核心結(jié)算方式。
在此之上,各家又推出Coding Plan/Token Plan等套餐,作為訂閱與按量之間的過(guò)渡形態(tài):用戶(hù)按月付費(fèi)獲得一定額度與優(yōu)先權(quán),但超額仍需按量付費(fèi),并伴隨公平使用與限流機(jī)制。
在Agent場(chǎng)景中,這一分層尤為關(guān)鍵,自動(dòng)化調(diào)用大都只支持API按量計(jì)費(fèi),訂閱與套餐難以覆蓋高強(qiáng)度、多輪調(diào)用的算力消耗。而大部分“訂閱模式”只針對(duì)一般用戶(hù)的Chatbot和內(nèi)嵌Agent功能。
隨著Anthropic針對(duì)Openclaw切換計(jì)費(fèi)方式,其他廠商也相繼做出反應(yīng),是更直接的——漲價(jià)。
過(guò)去幾周時(shí)間里,一輪集中調(diào)價(jià)出現(xiàn)在國(guó)內(nèi)AI云廠商中。
騰訊云此前宣布,自上月13日起結(jié)束部分模型的免費(fèi)公測(cè),并轉(zhuǎn)為正式收費(fèi),同時(shí)對(duì)混元系列模型進(jìn)行大幅調(diào)價(jià),部分價(jià)格漲幅超過(guò)400%。
隨后,阿里和百度方面也發(fā)布公告,本月月中開(kāi)始上調(diào)AI算力和存儲(chǔ)價(jià)格,整體漲幅在5%—30%區(qū)間。
而在幾天前智譜的財(cái)報(bào)電話會(huì)議上,CEO張鵬披露,2026年一季度接口調(diào)用價(jià)格提升了83%,但調(diào)用量仍然增長(zhǎng)400%。
接連幾家AI云廠商漲價(jià),說(shuō)明了一件事:模型需求的增長(zhǎng)來(lái)得太快,甚至廠商的基建層都倍感壓力。
這一點(diǎn)在羅福莉的發(fā)文中也有體現(xiàn):“更宏觀地看:全球的算力供給,跟不上agent帶來(lái)的token需求增長(zhǎng)。”真正的出路,不是更便宜的token,而是模型和Agent的‘協(xié)同進(jìn)化’?!?/p>
只是,在更高效的模型+Agent架構(gòu)面世之前,漲價(jià)或者限制訂閱,并不能解決這套計(jì)費(fèi)邏輯中的核心矛盾。
從用戶(hù)視角看,購(gòu)買(mǎi)的是“任務(wù)完成”;但從模型廠商的視角,計(jì)量的是“計(jì)算過(guò)程”。
這兩者之間,目前存在著明顯的錯(cuò)位。走訂閱,廠商要承擔(dān)Token調(diào)用不穩(wěn)定的風(fēng)險(xiǎn);走API,這個(gè)風(fēng)險(xiǎn)又來(lái)到了用戶(hù)身上。
這也是為什么“訂閱+配額+API”的組合,同時(shí)出現(xiàn)在了各大廠商的落地方案中。
在Harness/Coding場(chǎng)景下,各類(lèi)plan本質(zhì)上是一種用戶(hù)與模型廠商之間的相互妥協(xié):廠商通過(guò)Coding/Token Plan套餐鎖定一部分額度,換取用戶(hù)側(cè)的價(jià)格確定性,同時(shí)用限流和規(guī)則控制風(fēng)險(xiǎn)。
但在OpenClaw這類(lèi)更不受控的agent場(chǎng)景中,調(diào)用強(qiáng)度和路徑都難以約束,這種“妥協(xié)”很難成立,廠商們更多選擇 API按量計(jì)費(fèi)。
訂閱負(fù)責(zé)輕量使用,配額限制極端消耗,超額部分按量計(jì)費(fèi)。本質(zhì)上,這是一種對(duì)不確定性的緩沖機(jī)制。
不過(guò),Token計(jì)價(jià)也并不是唯一的解法,行業(yè)內(nèi)已經(jīng)在探索一些“另類(lèi)”的模型收費(fèi)模式。
一類(lèi)是按任務(wù)收費(fèi)。比如Anthropic在Claude Code中推出的Code Review功能,直接按一次PR審查計(jì)價(jià),單次review平均成本在15–25美元,并隨代碼規(guī)模和復(fù)雜度浮動(dòng)。
二是按結(jié)果收費(fèi),已經(jīng)在企業(yè)側(cè)落地,比如智能客服、RPA廠商按“問(wèn)題解決”或“流程完成”計(jì)價(jià);還有一種是按時(shí)間收費(fèi),比如xAI的語(yǔ)音agent按運(yùn)行時(shí)長(zhǎng)計(jì)費(fèi),約0.05美元/分鐘)。
幾天前,在火山引擎武漢站巡展活動(dòng)中,當(dāng)字母AI問(wèn)及“面對(duì)模型調(diào)用激增、Token消耗存在不確定性的現(xiàn)狀,模型廠商該如何優(yōu)化定價(jià)策略?”時(shí),火山引擎總裁譚待這樣回應(yīng):
“目前OpenClaw這類(lèi)通用型平臺(tái)適合按Token收費(fèi),因?yàn)槠鋺?yīng)用場(chǎng)景廣泛,無(wú)法統(tǒng)一定義效果和成本。”譚待同時(shí)表示,未來(lái)可能會(huì)孵化出垂直領(lǐng)域的智能體,如客服智能體,就可以按回答問(wèn)題的數(shù)量收費(fèi)。“類(lèi)似線下找客服的模式,按效果付費(fèi)?!?/p>
“(Anthropic的這一步)大概率是一件好事。Agent時(shí)代不屬于消耗最多算力的人,而屬于最會(huì)使用算力的人?!痹谀瞧l(fā)文最后,羅福莉這樣總結(jié)道。
顯然,圍繞Token收費(fèi)的爭(zhēng)論還將持續(xù)下去,這一爭(zhēng)論將取決于未來(lái)模型-Agent在效率層面的迭代情況。
我們可以確定的是,過(guò)去一度被壓到幾厘錢(qián)每Token的單價(jià),在這個(gè)調(diào)用量激增、鏈路無(wú)限延伸的Agent爆發(fā)周期,已經(jīng)變成了每一個(gè)用戶(hù)都無(wú)法忽視的成本因素。
Agent大航海時(shí)代,Token收費(fèi)這筆賬,值得每一個(gè)廠商認(rèn)真盤(pán)一盤(pán)。
特別聲明:本文為合作媒體授權(quán)DoNews專(zhuān)欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表DoNews專(zhuān)欄的立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問(wèn)都請(qǐng)聯(lián)系idonews@donews.com)