今日,深度求索(DeepSeek)正式宣布全新系列大模型 DeepSeek-V4 預覽版 上線并同步開源。該系列突破性地支持 100萬字(1M)超長上下文,在智能體(Agent)協(xié)同能力、世界知識儲備及復雜邏輯推理性能上,均實現(xiàn)國內(nèi)與開源領(lǐng)域的全面領(lǐng)先。即日起,用戶可通過官網(wǎng) chat.deepseek.com 或官方 App 體驗,開發(fā)者亦可通過更新 API 參數(shù)無縫接入。

雙版本矩陣:Pro 旗艦對標頂尖,F(xiàn)lash 主打高效經(jīng)濟


為滿足多元應用場景,DeepSeek-V4 劃分為 Pro 與 Flash 兩大版本:

架構(gòu)突破:首創(chuàng) Token 壓縮+DSA 稀疏注意力,1M 上下文成標配
DeepSeek-V4 在底層架構(gòu)上實現(xiàn)重大創(chuàng)新。模型采用全新的 Token 維度注意力壓縮機制,結(jié)合 DSA 稀疏注意力(DeepSeek Sparse Attention),成功破解長上下文場景下的算力與顯存瓶頸。相比傳統(tǒng)方法,該架構(gòu)在維持百萬級上下文吞吐的同時大幅降低計算開銷。官方明確宣布:自即日起,1M 超長上下文將成為 DeepSeek 所有官方服務的標準配置。
生態(tài)適配與 API 升級:全面擁抱 Agent 開發(fā)流
針對主流 AI Agent 生態(tài),V4 系列已完成對 Claude Code、OpenClaw、OpenCode、CodeBuddy 等框架的深度適配,在自動化代碼生成、結(jié)構(gòu)化文檔輸出(如 PPT/報告生成)等任務中表現(xiàn)顯著提升。