久久性爱无码av日韩无码,日本一级黄色录相片,国产特级毛片无遮挡

DoNews > 商業(yè) > 月之暗面 Kimi K2.6 發(fā)布并開源：代碼能力對標(biāo) GPT-5.4

月之暗面 Kimi K2.6 發(fā)布并開源：代碼能力對標(biāo) GPT-5.4

楊亮 2026-04-21 09:10:53

436613

分享到

DoNews4月21日消息，月之暗面20日晚間發(fā)布并開源了其最新模型 Kimi K2.6，該模型在代碼編寫、長程任務(wù)執(zhí)行及 Agent 集群能力方面實(shí)現(xiàn)了全面升級。即日起，所有用戶均可通過官網(wǎng)（kimi.com）、最新版 Kimi 應(yīng)用、Kimi API 以及 Kimi Code 編程助手使用該模型。

據(jù)官方披露，Kimi K2.6 在博士級難度的完整版“終極人類考試”（Humanity's Last Exam）、評估真實(shí)軟件工程能力的 SWE-Bench Pro 以及 Agent 深度檢索基準(zhǔn) DeepSearchQA 等測試中，均取得了行業(yè)領(lǐng)先的成績，表現(xiàn)持平或優(yōu)于 GPT-5.4、Claude Opus 4.6 和 Gemini 3.1 Pro 等閉源模型。

作為月之暗面迄今最強(qiáng)的代碼模型，Kimi K2.6 的長程編碼能力顯著提升。在測試中，該模型可以不間斷編碼長達(dá) 13 小時，編寫或修改超過 4000 行代碼，完成復(fù)雜系統(tǒng)的開發(fā)與優(yōu)化。

通過將代碼與視覺能力深度融合，K2.6 能夠交付具有設(shè)計(jì)創(chuàng)意的專業(yè)級 Web 應(yīng)用。在 Kimi 內(nèi)部的嚴(yán)格代碼評測基準(zhǔn) Kimi Code Bench 中，K2.6 的成績相比上一代 K2.5 提升了約 20%。

實(shí)測案例顯示，該模型成功在 Mac 本地下載并部署了 Qwen3.5-0.8B 模型，使用小眾的 Zig 語言實(shí)現(xiàn)并優(yōu)化模型推理，經(jīng)過 4000 多次工具調(diào)用、超過 12 小時的不間斷運(yùn)行，共迭代 14 輪，將吞吐量從約 15 tokens/s 提升至約 193 tokens/s，最終推理速度比 LM Studio 快 20%。

在另一個案例中，Kimi K2.6 自主完成了對擁有 8 年歷史、接近性能極限的開源金融撮合引擎 exchange-core 的深度重構(gòu)，歷經(jīng) 13 小時連續(xù)作業(yè)，迭代 12 套優(yōu)化策略，通過 1000 余次工具調(diào)用，精準(zhǔn)修改了 4000 多行代碼，最終實(shí)現(xiàn)中位吞吐量從 0.43 MT/s 躍升至 1.24 MT/s（增幅 185%），峰值吞吐量從 1.23 MT/s 飆升至 2.86 MT/s（增幅 133%）。

在代碼驅(qū)動設(shè)計(jì)方面，K2.6 的 Agent 模式能夠制作具有設(shè)計(jì)感和視覺沖擊力的網(wǎng)站。憑借對圖像和視頻生成工具的熟練調(diào)用，該 Agent 可以生成視覺風(fēng)格高度統(tǒng)一的素材，構(gòu)建視覺焦點(diǎn)突出的首屏區(qū)，并實(shí)現(xiàn)交互元素和滾動觸發(fā)動效。

月之暗面表示，它不局限于前端頁面編寫，也支持基礎(chǔ)的后端數(shù)據(jù)庫模塊，例如在網(wǎng)頁中嵌入表單信息收集功能。

另外，月之暗面還創(chuàng)建了一套專門的前端開發(fā)設(shè)計(jì)評測基準(zhǔn) Kimi Design Bench，涵蓋視覺輸入、落地頁構(gòu)建、全棧應(yīng)用開發(fā)及通用 Web 開發(fā)四個維度，對比 Google AI Studio 中的 Gemini 3 模型，基于 Kimi K2.6 的 Agent 展現(xiàn)出了明顯領(lǐng)先優(yōu)勢。

同時，其 Agent 集群能力迎來全面升級。K2.6 支持動態(tài)拆解復(fù)雜任務(wù)，自主生成專項(xiàng) Agent 并行處理，現(xiàn)在最多可調(diào)度 300 個子 Agent 并行完成 4000 個協(xié)作步驟，實(shí)現(xiàn)更大規(guī)模的并行化，任務(wù)完成度和交付質(zhì)量相比 K2.5 顯著提升。Agent 集群能夠?qū)⑺阉?、深度研究、文檔分析和長文創(chuàng)作等能力進(jìn)行組合，在單次運(yùn)行中獨(dú)立完成從文檔到網(wǎng)頁、再到 PPT 和表格的多產(chǎn)物端到端交付。

例如，該集群針對全球 100 個半導(dǎo)體標(biāo)的設(shè)計(jì)并執(zhí)行了 5 套量化策略，將麥肯錫風(fēng)格的 PPT 邏輯沉淀為可復(fù)用技能，最終交付了詳盡的建模表格和整套匯報(bào)演示文檔。

在另一個案例中，Agent 集群將一篇包含大量視覺數(shù)據(jù)的天體物理論文轉(zhuǎn)化為可復(fù)用學(xué)術(shù)技能，提取論文的推理流程和可視化方法，產(chǎn)出了 40 頁、7000 字的研究論文，以及包含 2 萬多條數(shù)據(jù)的結(jié)構(gòu)化數(shù)據(jù)集和 14 張?zhí)煳募増D表。

K2.6 顯著增強(qiáng)了 Agent 的自主化執(zhí)行能力，尤其在與 OpenClaw、Hermes Agent 等主動式 Agent 框架協(xié)同工作時表現(xiàn)突出。這類場景要求 AI 能夠跨應(yīng)用實(shí)現(xiàn) 24/7 不間斷運(yùn)行。

月之暗面的 RL 基礎(chǔ)設(shè)施團(tuán)隊(duì)使用基于 K2.6 的 Agent 實(shí)現(xiàn)了連續(xù) 5 天自主運(yùn)行，該 Agent 負(fù)責(zé)監(jiān)控、故障響應(yīng)和系統(tǒng)運(yùn)維，展現(xiàn)了持久的上下文維持能力、多線程任務(wù)處理能力以及從接收告警到徹底解決的全流程執(zhí)行能力。

Kimi 內(nèi)部的 Claw Bench 測試結(jié)果顯示，K2.6 相比 K2.5 綜合性能提升了 10%，涵蓋編程任務(wù)、即時通訊生態(tài)集成、信息檢索與分析、定時任務(wù)管理及記憶調(diào)用五大維度，在需要長時間自主運(yùn)行且無需人工干預(yù)的工作流中優(yōu)勢尤為顯著。

借助 K2.6 更強(qiáng)的代碼和視覺理解能力，Kimi Agent 模式現(xiàn)在支持創(chuàng)建和調(diào)用技能（Skill）。系統(tǒng)已內(nèi)置上百個官方推薦技能，包括投研技能包，可一鍵生成專業(yè)排版的 A 股、港股、美股公司一頁紙或深度投資研報(bào)。

用戶在 Kimi Agent 模式下輸入斜杠“/”即可開始創(chuàng)建和調(diào)用技能。此外，Kimi Agent 已支持“Office 文檔轉(zhuǎn)技能”功能，上傳高質(zhì)量 Office 文檔后，模型會嘗試?yán)斫庠臋n的結(jié)構(gòu)與風(fēng)格基因，生成專屬的可復(fù)用文檔創(chuàng)建技能。

月之暗面同時宣布開啟“Claw 群組”小范圍內(nèi)測。該群組的目標(biāo)是讓多個 Agent 與人類作為真正的協(xié)作者共同運(yùn)行，用戶可以接入來自任何設(shè)備、任何供應(yīng)商、運(yùn)行任何模型的全天候 Agent（首批支持 OpenClaw，后續(xù)將加入對 Hermes Agent 等框架的支持），每個 Agent 可攜帶各自的專業(yè)工具包、技能和持久化記憶上下文。

在 Claw 群組中，K2.6 擔(dān)任協(xié)調(diào)者，根據(jù) Agent 的技能畫像和可用工具動態(tài)匹配任務(wù)，當(dāng)某個 Agent 遇到故障或停滯時，協(xié)調(diào)者會檢測到中斷并自動重新分配任務(wù)或生成子任務(wù)。Kimi Claw 用戶將陸續(xù)收到內(nèi)測邀請。

Kimi K2.6 現(xiàn)已面向所有免費(fèi)用戶、付費(fèi)訂閱用戶、Kimi Code 和企業(yè) API 用戶開放。企業(yè)和開發(fā)者在 Kimi API 中指定模型為 kimi-k2.6 即可開始使用。

為慶祝 K2.6 模型 API 上線，Kimi 開放平臺同步開啟了最高 30% 的限時充贈活動。同時，Kimi K2.6 官方 API 已經(jīng)首發(fā)登陸騰訊云 TokenHub 等平臺。月之暗面推薦直接調(diào)用官方 API 復(fù)現(xiàn)基準(zhǔn)評測成績，如需使用第三方 API 服務(wù)，可通過 Kimi 模型供應(yīng)商驗(yàn)證服務(wù)（Kimi Vendor Verifier, KVV）挑選精度更高的服務(wù)商。