DoNews4月21日消息,月之暗面20日晚間發(fā)布并開源了其最新模型 Kimi K2.6,該模型在代碼編寫、長程任務(wù)執(zhí)行及 Agent 集群能力方面實(shí)現(xiàn)了全面升級。即日起,所有用戶均可通過官網(wǎng)(kimi.com)、最新版 Kimi 應(yīng)用、Kimi API 以及 Kimi Code 編程助手使用該模型。

據(jù)官方披露,Kimi K2.6 在博士級難度的完整版“終極人類考試”(Humanity's Last Exam)、評估真實(shí)軟件工程能力的 SWE-Bench Pro 以及 Agent 深度檢索基準(zhǔn) DeepSearchQA 等測試中,均取得了行業(yè)領(lǐng)先的成績,表現(xiàn)持平或優(yōu)于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等閉源模型。

作為月之暗面迄今最強(qiáng)的代碼模型,Kimi K2.6 的長程編碼能力顯著提升。在測試中,該模型可以不間斷編碼長達(dá) 13 小時,編寫或修改超過 4000 行代碼,完成復(fù)雜系統(tǒng)的開發(fā)與優(yōu)化。
通過將代碼與視覺能力深度融合,K2.6 能夠交付具有設(shè)計(jì)創(chuàng)意的專業(yè)級 Web 應(yīng)用。在 Kimi 內(nèi)部的嚴(yán)格代碼評測基準(zhǔn) Kimi Code Bench 中,K2.6 的成績相比上一代 K2.5 提升了約 20%。

實(shí)測案例顯示,該模型成功在 Mac 本地下載并部署了 Qwen3.5-0.8B 模型,使用小眾的 Zig 語言實(shí)現(xiàn)并優(yōu)化模型推理,經(jīng)過 4000 多次工具調(diào)用、超過 12 小時的不間斷運(yùn)行,共迭代 14 輪,將吞吐量從約 15 tokens/s 提升至約 193 tokens/s,最終推理速度比 LM Studio 快 20%。

在另一個案例中,Kimi K2.6 自主完成了對擁有 8 年歷史、接近性能極限的開源金融撮合引擎 exchange-core 的深度重構(gòu),歷經(jīng) 13 小時連續(xù)作業(yè),迭代 12 套優(yōu)化策略,通過 1000 余次工具調(diào)用,精準(zhǔn)修改了 4000 多行代碼,最終實(shí)現(xiàn)中位吞吐量從 0.43 MT/s 躍升至 1.24 MT/s(增幅 185%),峰值吞吐量從 1.23 MT/s 飆升至 2.86 MT/s(增幅 133%)。

在代碼驅(qū)動設(shè)計(jì)方面,K2.6 的 Agent 模式能夠制作具有設(shè)計(jì)感和視覺沖擊力的網(wǎng)站。憑借對圖像和視頻生成工具的熟練調(diào)用,該 Agent 可以生成視覺風(fēng)格高度統(tǒng)一的素材,構(gòu)建視覺焦點(diǎn)突出的首屏區(qū),并實(shí)現(xiàn)交互元素和滾動觸發(fā)動效。
月之暗面表示,它不局限于前端頁面編寫,也支持基礎(chǔ)的后端數(shù)據(jù)庫模塊,例如在網(wǎng)頁中嵌入表單信息收集功能。
另外,月之暗面還創(chuàng)建了一套專門的前端開發(fā)設(shè)計(jì)評測基準(zhǔn) Kimi Design Bench,涵蓋視覺輸入、落地頁構(gòu)建、全棧應(yīng)用開發(fā)及通用 Web 開發(fā)四個維度,對比 Google AI Studio 中的 Gemini 3 模型,基于 Kimi K2.6 的 Agent 展現(xiàn)出了明顯領(lǐng)先優(yōu)勢。

同時,其 Agent 集群能力迎來全面升級。K2.6 支持動態(tài)拆解復(fù)雜任務(wù),自主生成專項(xiàng) Agent 并行處理,現(xiàn)在最多可調(diào)度 300 個子 Agent 并行完成 4000 個協(xié)作步驟,實(shí)現(xiàn)更大規(guī)模的并行化,任務(wù)完成度和交付質(zhì)量相比 K2.5 顯著提升。Agent 集群能夠?qū)⑺阉?、深度研究、文檔分析和長文創(chuàng)作等能力進(jìn)行組合,在單次運(yùn)行中獨(dú)立完成從文檔到網(wǎng)頁、再到 PPT 和表格的多產(chǎn)物端到端交付。

例如,該集群針對全球 100 個半導(dǎo)體標(biāo)的設(shè)計(jì)并執(zhí)行了 5 套量化策略,將麥肯錫風(fēng)格的 PPT 邏輯沉淀為可復(fù)用技能,最終交付了詳盡的建模表格和整套匯報(bào)演示文檔。
在另一個案例中,Agent 集群將一篇包含大量視覺數(shù)據(jù)的天體物理論文轉(zhuǎn)化為可復(fù)用學(xué)術(shù)技能,提取論文的推理流程和可視化方法,產(chǎn)出了 40 頁、7000 字的研究論文,以及包含 2 萬多條數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)集和 14 張?zhí)煳募増D表。
K2.6 顯著增強(qiáng)了 Agent 的自主化執(zhí)行能力,尤其在與 OpenClaw、Hermes Agent 等主動式 Agent 框架協(xié)同工作時表現(xiàn)突出。這類場景要求 AI 能夠跨應(yīng)用實(shí)現(xiàn) 24/7 不間斷運(yùn)行。
月之暗面的 RL 基礎(chǔ)設(shè)施團(tuán)隊(duì)使用基于 K2.6 的 Agent 實(shí)現(xiàn)了連續(xù) 5 天自主運(yùn)行,該 Agent 負(fù)責(zé)監(jiān)控、故障響應(yīng)和系統(tǒng)運(yùn)維,展現(xiàn)了持久的上下文維持能力、多線程任務(wù)處理能力以及從接收告警到徹底解決的全流程執(zhí)行能力。
Kimi 內(nèi)部的 Claw Bench 測試結(jié)果顯示,K2.6 相比 K2.5 綜合性能提升了 10%,涵蓋編程任務(wù)、即時通訊生態(tài)集成、信息檢索與分析、定時任務(wù)管理及記憶調(diào)用五大維度,在需要長時間自主運(yùn)行且無需人工干預(yù)的工作流中優(yōu)勢尤為顯著。

借助 K2.6 更強(qiáng)的代碼和視覺理解能力,Kimi Agent 模式現(xiàn)在支持創(chuàng)建和調(diào)用技能(Skill)。系統(tǒng)已內(nèi)置上百個官方推薦技能,包括投研技能包,可一鍵生成專業(yè)排版的 A 股、港股、美股公司一頁紙或深度投資研報(bào)。
用戶在 Kimi Agent 模式下輸入斜杠“/”即可開始創(chuàng)建和調(diào)用技能。此外,Kimi Agent 已支持“Office 文檔轉(zhuǎn)技能”功能,上傳高質(zhì)量 Office 文檔后,模型會嘗試?yán)斫庠臋n的結(jié)構(gòu)與風(fēng)格基因,生成專屬的可復(fù)用文檔創(chuàng)建技能。

月之暗面同時宣布開啟“Claw 群組”小范圍內(nèi)測。該群組的目標(biāo)是讓多個 Agent 與人類作為真正的協(xié)作者共同運(yùn)行,用戶可以接入來自任何設(shè)備、任何供應(yīng)商、運(yùn)行任何模型的全天候 Agent(首批支持 OpenClaw,后續(xù)將加入對 Hermes Agent 等框架的支持),每個 Agent 可攜帶各自的專業(yè)工具包、技能和持久化記憶上下文。
在 Claw 群組中,K2.6 擔(dān)任協(xié)調(diào)者,根據(jù) Agent 的技能畫像和可用工具動態(tài)匹配任務(wù),當(dāng)某個 Agent 遇到故障或停滯時,協(xié)調(diào)者會檢測到中斷并自動重新分配任務(wù)或生成子任務(wù)。Kimi Claw 用戶將陸續(xù)收到內(nèi)測邀請。

Kimi K2.6 現(xiàn)已面向所有免費(fèi)用戶、付費(fèi)訂閱用戶、Kimi Code 和企業(yè) API 用戶開放。企業(yè)和開發(fā)者在 Kimi API 中指定模型為 kimi-k2.6 即可開始使用。
為慶祝 K2.6 模型 API 上線,Kimi 開放平臺同步開啟了最高 30% 的限時充贈活動。同時,Kimi K2.6 官方 API 已經(jīng)首發(fā)登陸騰訊云 TokenHub 等平臺。月之暗面推薦直接調(diào)用官方 API 復(fù)現(xiàn)基準(zhǔn)評測成績,如需使用第三方 API 服務(wù),可通過 Kimi 模型供應(yīng)商驗(yàn)證服務(wù)(Kimi Vendor Verifier, KVV)挑選精度更高的服務(wù)商。