一区二区三区四区大黄片,国产毛片AA一级正片

DoNews > 專欄 > AI手搓的Cowork“李鬼”版跟“李逵”一樣能打！還免費？

AI手搓的Cowork“李鬼”版跟“李逵”一樣能打！還免費？

字母榜 2026-01-19 17:44:46

328987

分享到

Cowork是Anthropic最近推出的一個桌面AI Agent，能讓用戶無需編程即可完成本地文件處理、工作流程自動化等任務。

這個產(chǎn)品對產(chǎn)業(yè)的影響非常大，但它有點太貴了，只有Anthropic的Max用戶才能使用，最低也要每月100美元。

有意思的是，僅僅過了48個小時，就有人通過根據(jù)Cowork的產(chǎn)品邏輯開發(fā)出了免費開源的版本OpenWork。

它同樣可以讀取文件、創(chuàng)建文檔、自動化重復性知識工作。而且它不需要訂閱，用戶只需接入自己的API密鑰，選擇想用的模型，就能在Mac上運行Agent工作流。

當一個產(chǎn)品的核心能力可以在兩天內(nèi)被復制，要么是技術(shù)門檻已經(jīng)足夠低，要么是原型足夠清晰。

答案顯而易見，Vibe Coding已經(jīng)強大到只要給出的需求足夠明確，就能做個甩手掌柜，讓AI獨自完成所有的工作。

事實上Cowork這個產(chǎn)品本身的開發(fā)周期就僅有10天，團隊也就4個人，幾乎全部代碼都由AI編寫。并且它的代碼完整、封裝完整，是一個成熟的應用，而非以前那種10天半個月就開發(fā)出來的玩具級應用。

醫(yī)生可以給自己做手術(shù)，理發(fā)師可以給自己剪頭發(fā)，而AI也可以構(gòu)建AI。

在Cowork誕生之前，市場已經(jīng)有不少相似的產(chǎn)品。

最被人們熟知的就是Manus，它的定位是“首個通用AIAgent”，由已經(jīng)被Meta收購的蝴蝶效應開發(fā)。

Manus在云端異步執(zhí)行任務，用戶可以關閉筆記本電腦后讓Agent繼續(xù)工作。在GAIA基準測試中，Manus在1到12級難度的最優(yōu)表現(xiàn)，超越OpenAI Deep Research。不過10到12級難度的得分仍然很低，僅有0.4-0.8%。

其架構(gòu)使用Claude作為主LLM，配合29種專用工具，通過多Agent并行處理與結(jié)構(gòu)化輸出 (Schema) 來管理上下文。

2025年3月發(fā)布后，Manus在8個月內(nèi)達到1億美元年度經(jīng)常性收入，這個增長速度在AI產(chǎn)品中極為罕見。2025年12月，Meta以超過20億美元收購Manus，這筆交易的估值是其半年前5億美元估值的四倍。

Gemini CLI是谷歌的開源終端Agent，面向開發(fā)者群體。

它提供免費訪問Gemini 2.5 Pro，內(nèi)置谷歌搜索、文件操作、Shell命令等工具，并支持MCP擴展。與Cowork的圖形界面不同，Gemini CLI保持在命令行環(huán)境，但通過開源策略鼓勵社區(qū)貢獻和自定義集成。

ChatGPT Agent于2025年7月推出，運行在虛擬機環(huán)境中，集成文本瀏覽器、可視化瀏覽器、終端和第三方API連接器。Pro用戶每月獲得400次使用額度，Plus和Team用戶為40次。

在HLE基準測試中得分41.6%，在BrowseComp基準測試中達到68.9%的結(jié)果。但實際測試顯示基線成功率僅12.5%，需要優(yōu)化才能達到80%的任務完成率。

ChatGPT Agent的前身，是OpenAI在2025年1月發(fā)布發(fā)布的Operator。

對比維度上，自主性程度從高到低依次為Manus、Cowork、ChatGPT Agent、Gemini CLI。

Manus允許完全異步執(zhí)行，用戶可以在任務運行期間完全脫離；Cowork采用委托式執(zhí)行，用戶授權(quán)后AI自主工作；ChatGPT Agent提供監(jiān)督模式選項，用戶可以選擇介入程度；Gemini CLI則采用交互式確認，每個關鍵步驟都需要用戶批準。

執(zhí)行環(huán)境方面，Manus和ChatGPT Agent提供完整虛擬環(huán)境，隔離性最強；Cowork限定在本地文件夾，通過沙箱機制保證安全；Gemini CLI直接訪問系統(tǒng)終端，靈活性最高但風險也相對較大。

Gemini CLI的使用門檻最高，它需要用戶具備命令行操作能力。而其他三款軟件，均可以通過自然語言或者點擊界面來執(zhí)行任務。

技術(shù)架構(gòu)中，多Agent協(xié)作、工具鏈集成、沙箱隔離和虛擬機封裝代表了不同的安全與能力權(quán)衡。

Manus的多Agent系統(tǒng)采用MapReduce架構(gòu)，主Agent分析任務并生成執(zhí)行計劃，然后派生出數(shù)百個專業(yè)化子Agent并行工作，最后聚合結(jié)果。

這種架構(gòu)使其能夠同時處理大規(guī)模任務，比如找出所有YC支持的金融科技初創(chuàng)公司CTO的電子郵件地址，這個任務如果由人工完成需要數(shù)周，而Manus可以在幾分鐘內(nèi)完成。

Cowork與Claude Code共享相同代理棧，但通過GUI而非終端界面呈現(xiàn)，實現(xiàn)“相同能力，不同入口”。

它運行在完整的Linux容器中，由于目前Cowork只支持Mac，所以它使用的是Apple虛擬化框架所提供的沙箱隔離。用戶能明確授權(quán)可訪問的文件夾，如果不授予訪問權(quán)限，Cowork就無法看到該文件夾。

Gemini CLI通過MCP服務器擴展能力，支持GitHub、Firebase、谷歌 Workspace等集成。

開發(fā)者可以配置多個MCP服務器，每個服務器提供特定領域的工具。這種模塊化設計使Gemini CLI成為一個可擴展的平臺，而不僅僅是一個固定功能的工具。

ChatGPT Agent的虛擬機環(huán)境提供了最嚴格的隔離，但也帶來了性能開銷。在測試中，簡單的點擊、選擇元素和搜索操作可能需要幾秒鐘甚至幾分鐘。

Cowork給業(yè)界帶來的最大啟示就是，AI也可以構(gòu)建AI。

傳統(tǒng)軟件開發(fā)中，從概念到產(chǎn)品需要數(shù)月甚至數(shù)年，AI輔助開發(fā)將周期縮短到數(shù)周。

到了AI構(gòu)建AI階段，整個產(chǎn)品開發(fā)的周期可以以“天”為單位。Cowork就是最好的證明。

AI生成的代碼通常需要人工審查和修正，但當AI構(gòu)建的是AI工具本身時，它對領域的理解深度超越了通用場景。

Claude Code理解代碼生成的模式、常見錯誤、最佳實踐，因為它每天處理1.95億行代碼，形成了一種自產(chǎn)自銷的良性循環(huán)。

Anthropic的工程師鮑里斯·切爾尼（Boris Cherny）對這個過程的描述是：“我們采用了一種Vibe Coding的方法，工程師給出一個大概的結(jié)果，然后讓Claude Code生成Cowork的大部分功能?！?/p>

Claude Code不僅寫代碼，還提出自己的想法，建議應該構(gòu)建什么。因此這不是簡單的代碼生成，而是一個理解需求、設計架構(gòu)、實現(xiàn)功能的完整過程。

這種遞歸改進已經(jīng)在Anthropic內(nèi)部產(chǎn)生了顯著影響。

去年，Anthropic工程師表示，Claude輔助完成了30%的編碼工作。到了2025年，這個數(shù)字提升到了60%。

同時Anthropic的工程團隊表示，其團隊規(guī)模擴大了一倍，代碼合并請求（PR吞吐量）卻增加了67%。

這是一個反常識的事情，PR指的是當開發(fā)者完成一段代碼開發(fā)后，會發(fā)起代碼合并請求。當團隊審核代碼質(zhì)量、確認功能無誤，才能將這段代碼合并到項目的主分支中。

理論上來說，團隊規(guī)模越大，PR吞吐量越低。但是由于原本需要人工編寫、審核的大量功能代碼，被Claude Code承接，減少了人類工程師的重復工作。

工程師可以更聚焦于核心模塊的審核與架構(gòu)設計，讓PR的審核、合并流程更快，最終體現(xiàn)為電表倒轉(zhuǎn)，PR吞吐量提升。

更進一步，Anthropic CEO 達里奧·阿莫德（Dario Amodei）在2025年10月季度技術(shù)溝通會上公開表示，新Claude模型和功能的“絕大多數(shù)”代碼現(xiàn)在由AI Agent自主編寫，且這個比例超過90%。

換句話說，今天你用的Claude，是昨天Claude自己寫給你用的。

Claude Code的能力被封裝進Cowork，Cowork又讓非技術(shù)用戶能夠構(gòu)建自動化工具，這些工具可能反過來生成新的AI輔助流程。

同時，整個過程也因為不斷有新的工具加入而變得越來越高效、越來越準確。

歸根結(jié)底，這些Agent產(chǎn)品的共同使命是將AI模型從聊天窗口中解放出來。

傳統(tǒng)chatbot的局限性已經(jīng)顯而易見，它們被動響應用戶輸入，無法主動執(zhí)行操作，缺乏跨會話記憶，困在對話框的界面牢籠里。當用戶需要完成實際工作時，chatbot只能提供建議，真正的執(zhí)行仍需人工介入。

新一代Agent實現(xiàn)了根本性突破。

2025年11月的AI Agent Summit上，一位Anthropic工程師描述的工作流：“15個并行實例，每個作為自主工作者無監(jiān)督執(zhí)行數(shù)小時。從早上用手機啟動會話，白天晚些時候檢查輸出。”

這種模式的核心在于，你把任務委托給你信任的模型，讓它在你不監(jiān)看時自行解決問題，同時也標志著，大模型正在從“對話助手”轉(zhuǎn)變成一位“數(shù)字員工”。

這個轉(zhuǎn)變不僅僅是技術(shù)進步，更是工作方式的重構(gòu)。

而在nthropic 2025年Q4內(nèi)部研發(fā)狀態(tài)報告中，一位Anthropic工程師估計，他們的工作已經(jīng)“70%以上轉(zhuǎn)變?yōu)榇a審查者/修訂者，而不是全新的代碼編寫者”。

另一位工程師認為，“為1個、5個或100個Claude的工作負責”是未來工程師唯一需要做的事情。他認為這不是失業(yè)的威脅，而是角色的轉(zhuǎn)換。從執(zhí)行者變成指揮者，從勞動者變成架構(gòu)師。

給Claude一個瀏覽器來測試自己的UI，質(zhì)量會提高2到3倍。給它一個測試套件，它會自我糾正。模型已經(jīng)具備了能力，構(gòu)建讓你能夠信任輸出而無需審查每一行的系統(tǒng)才能解鎖其余部分。

但這個轉(zhuǎn)變也沒有那么靠譜，當前的瓶頸是可靠性。

如果AI可以在10天內(nèi)構(gòu)建自己的繼任者，人類團隊面臨著“不可能的競賽”來審計正在創(chuàng)建的內(nèi)容。

PromptArmor報告稱，Cowork可以通過提示注入被誘騙將敏感文件傳輸?shù)焦粽叩腁nthropic賬戶，而在授予訪問權(quán)限后無需任何額外的用戶批準。

這個過程不僅相對簡單，而且愈發(fā)難以收拾。AI性能越強，權(quán)限越高，那么這個情況就會越惡化。

Anthropic對此的回應是，這個問題超出了范圍，因為包含受影響代碼的GitHub存儲庫已在2025年5月存檔，并且不計劃修補。

盡管存在這些風險，但AI構(gòu)建AI的趨勢已經(jīng)不可逆轉(zhuǎn)。

目前AGI已經(jīng)初具呈現(xiàn)。

這就不得不提起Claude Code引入的CLAUDE.md系統(tǒng)了。這是一個積累機構(gòu)知識的機制，工程師在同事的PR上標記@.claude來添加學習內(nèi)容，將AI視為一個正在入職的工程師，積累機構(gòu)知識。

用戶維護一個錯誤文件，記錄2500個token的累積更正，作為一個實體的記憶，否則它會在會話之間忘記一切。每個沖刺，AI在該代碼庫中變得更聰明。

這種學習不是被動的知識積累，而是主動的能力提升。Claude Code現(xiàn)在可以提出自己的想法，建議應該構(gòu)建什么。它不再只是執(zhí)行指令，而是參與到創(chuàng)意過程中。

這種從工具到伙伴的轉(zhuǎn)變，是AGI的一個關鍵特征。

Anthropic在2025年發(fā)布的《AI輔助研發(fā)效率白皮書》中提到了這么一個事情，Claude所輔助的工作中，27%是“否則不會完成”。

“否則不會完成”就是那些因為優(yōu)先級低、耗時久、回報不確定而被跳過的任務的統(tǒng)稱。比如為某個小眾功能做交互式數(shù)據(jù)監(jiān)控儀表板，不做也不會影響主線進度。那么如果這個數(shù)據(jù)監(jiān)控儀表板沒有做，它就會被歸類為“否則不會完成”。

只需給出目標，Claude就能自主設計、編寫、測試，工程師僅需最終審核，從而讓 “不值得做” 的任務變得可以做。

Anthropic在白皮書中寫道，這種把“否則不會完成”變成可以完成的能力，其增長不是線性的，而是指數(shù)級的。

當一個人類大腦可以監(jiān)督15個并行會話時，每個會話都被信任獨立執(zhí)行，生產(chǎn)力不是增加15倍，而是開啟了全新的可能性空間。

任務不再受限于人類的時間和注意力，轉(zhuǎn)而受限于問題的復雜性和AI的能力。

當然話又說回來了，目前AGI呈現(xiàn)仍然有明顯的局限性。

AI構(gòu)建的是仍然停留在應用層工具這個階段，而非底層模型。

Claude沒辦法構(gòu)建一個Claude。遞歸自我改進仍然局限在特定領域，而不是全面的智能提升。

可靠性仍然是瓶頸。ChatGPT Agent在簡單任務上的基線成功率只有12.5%，需要大量優(yōu)化才能達到實用水平。即使是表現(xiàn)最好的系統(tǒng)，也會在復雜的用戶界面和擴展工作流程中遇到困難。

接下來還需要面對安全問題，提示注入攻擊、數(shù)據(jù)泄露、意外的破壞性操作，這些風險隨著AI自主性的增加而放大。

當前的安全措施主要依賴于沙箱隔離和權(quán)限控制，但這些機制在面對復雜的攻擊場景時可能不夠。

不過目前最大的瓶頸是Agent的通用性不夠高。

雖然這些Agent可以處理多種任務，但它們在特定領域的表現(xiàn)仍然遠超跨領域的泛化能力。

AGI的實現(xiàn)路徑不僅是語言模型性能的提升，更是產(chǎn)品形態(tài)和工作流設計的系統(tǒng)工程。當前的Agent產(chǎn)品展示了這條路徑的早期階段：從被動的對話到主動的執(zhí)行，從單次交互到持續(xù)學習，從人工監(jiān)督到自主工作。

Gartner的《AI Agent 重塑企業(yè)采購報告》預測，到2028年，90%的B2B采購將由Agent處理，“Agent商務”將控制超過15萬億美元的支出。

到2028年，使用多AgentAI處理80%客戶面向業(yè)務流程的組織將占據(jù)主導地位。AI是一個企業(yè)的基本能力，而不是附加功能。

它們將工作流程重新設計為基于AI以及AI優(yōu)先，而不是將AI塞入現(xiàn)有流程。

但這個轉(zhuǎn)變不會一帆風順。Gartner還預測，到2028年，25%的企業(yè)網(wǎng)絡安全事件將由AIAgent的誤用引起。隨著AI獲得更多自主權(quán)，風險也在增加。

不過必須要承認的是，從Cowork到Manus，從Gemini CLI到ChatGPT Agent，這些產(chǎn)品正在重新定義人機協(xié)作的邊界。

當ChatGPT還在陪聊時，Cowork已經(jīng)開始“打工”了。AI不再是回答問題的工具，而是完成任務的伙伴。這個轉(zhuǎn)變的深遠影響，我們才剛剛開始理解。

特別聲明：本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載，文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點，不代表DoNews專欄的立場，轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)