久久久九九九一级大片a|一级黄片黄片一级一级|三级无码视频免费操人视频|成人精品A片亚州一区二区|亚洲日韩欧美在线一二区|91丝袜一区二区|国摸私拍电影一区二区爱|免费久久久久久久久久久久|免费国产黄色av发布网址|国产精品人妻人伦a 6 2v久动漫

AI手搓的Cowork“李鬼”版跟“李逵”一樣能打!還免費?

Cowork是Anthropic最近推出的一個桌面AI Agent,能讓用戶無需編程即可完成本地文件處理、工作流程自動化等任務。

這個產(chǎn)品對產(chǎn)業(yè)的影響非常大,但它有點太貴了,只有Anthropic的Max用戶才能使用,最低也要每月100美元。

有意思的是,僅僅過了48個小時,就有人通過根據(jù)Cowork的產(chǎn)品邏輯開發(fā)出了免費開源的版本OpenWork。

它同樣可以讀取文件、創(chuàng)建文檔、自動化重復性知識工作。而且它不需要訂閱,用戶只需接入自己的API密鑰,選擇想用的模型,就能在Mac上運行Agent工作流。

當一個產(chǎn)品的核心能力可以在兩天內(nèi)被復制,要么是技術(shù)門檻已經(jīng)足夠低,要么是原型足夠清晰。

答案顯而易見,Vibe Coding已經(jīng)強大到只要給出的需求足夠明確,就能做個甩手掌柜,讓AI獨自完成所有的工作。

事實上Cowork這個產(chǎn)品本身的開發(fā)周期就僅有10天,團隊也就4個人,幾乎全部代碼都由AI編寫。并且它的代碼完整、封裝完整,是一個成熟的應用,而非以前那種10天半個月就開發(fā)出來的玩具級應用。

醫(yī)生可以給自己做手術(shù),理發(fā)師可以給自己剪頭發(fā),而AI也可以構(gòu)建AI。

01

在Cowork誕生之前,市場已經(jīng)有不少相似的產(chǎn)品。

最被人們熟知的就是Manus,它的定位是“首個通用AIAgent”,由已經(jīng)被Meta收購的蝴蝶效應開發(fā)。

Manus在云端異步執(zhí)行任務,用戶可以關閉筆記本電腦后讓Agent繼續(xù)工作。在GAIA基準測試中,Manus在1到12級難度的最優(yōu)表現(xiàn),超越OpenAI Deep Research。不過10到12級難度的得分仍然很低,僅有0.4-0.8%。

其架構(gòu)使用Claude作為主LLM,配合29種專用工具,通過多Agent并行處理與結(jié)構(gòu)化輸出 (Schema) 來管理上下文。

2025年3月發(fā)布后,Manus在8個月內(nèi)達到1億美元年度經(jīng)常性收入,這個增長速度在AI產(chǎn)品中極為罕見。2025年12月,Meta以超過20億美元收購Manus,這筆交易的估值是其半年前5億美元估值的四倍。

Gemini CLI是谷歌的開源終端Agent,面向開發(fā)者群體。

它提供免費訪問Gemini 2.5 Pro,內(nèi)置谷歌搜索、文件操作、Shell命令等工具,并支持MCP擴展。與Cowork的圖形界面不同,Gemini CLI保持在命令行環(huán)境,但通過開源策略鼓勵社區(qū)貢獻和自定義集成。

ChatGPT Agent于2025年7月推出,運行在虛擬機環(huán)境中,集成文本瀏覽器、可視化瀏覽器、終端和第三方API連接器。Pro用戶每月獲得400次使用額度,Plus和Team用戶為40次。

在HLE基準測試中得分41.6%,在BrowseComp基準測試中達到68.9%的結(jié)果。但實際測試顯示基線成功率僅12.5%,需要優(yōu)化才能達到80%的任務完成率。

ChatGPT Agent的前身,是OpenAI在2025年1月發(fā)布發(fā)布的Operator。

對比維度上,自主性程度從高到低依次為Manus、Cowork、ChatGPT Agent、Gemini CLI。

Manus允許完全異步執(zhí)行,用戶可以在任務運行期間完全脫離;Cowork采用委托式執(zhí)行,用戶授權(quán)后AI自主工作;ChatGPT Agent提供監(jiān)督模式選項,用戶可以選擇介入程度;Gemini CLI則采用交互式確認,每個關鍵步驟都需要用戶批準。

執(zhí)行環(huán)境方面,Manus和ChatGPT Agent提供完整虛擬環(huán)境,隔離性最強;Cowork限定在本地文件夾,通過沙箱機制保證安全;Gemini CLI直接訪問系統(tǒng)終端,靈活性最高但風險也相對較大。

Gemini CLI的使用門檻最高,它需要用戶具備命令行操作能力。而其他三款軟件,均可以通過自然語言或者點擊界面來執(zhí)行任務。

技術(shù)架構(gòu)中,多Agent協(xié)作、工具鏈集成、沙箱隔離和虛擬機封裝代表了不同的安全與能力權(quán)衡。

Manus的多Agent系統(tǒng)采用MapReduce架構(gòu),主Agent分析任務并生成執(zhí)行計劃,然后派生出數(shù)百個專業(yè)化子Agent并行工作,最后聚合結(jié)果。

這種架構(gòu)使其能夠同時處理大規(guī)模任務,比如找出所有YC支持的金融科技初創(chuàng)公司CTO的電子郵件地址,這個任務如果由人工完成需要數(shù)周,而Manus可以在幾分鐘內(nèi)完成。

Cowork與Claude Code共享相同代理棧,但通過GUI而非終端界面呈現(xiàn),實現(xiàn)“相同能力,不同入口”。

它運行在完整的Linux容器中,由于目前Cowork只支持Mac,所以它使用的是Apple虛擬化框架所提供的沙箱隔離。用戶能明確授權(quán)可訪問的文件夾,如果不授予訪問權(quán)限,Cowork就無法看到該文件夾。

Gemini CLI通過MCP服務器擴展能力,支持GitHub、Firebase、谷歌 Workspace等集成。

開發(fā)者可以配置多個MCP服務器,每個服務器提供特定領域的工具。這種模塊化設計使Gemini CLI成為一個可擴展的平臺,而不僅僅是一個固定功能的工具。

ChatGPT Agent的虛擬機環(huán)境提供了最嚴格的隔離,但也帶來了性能開銷。在測試中,簡單的點擊、選擇元素和搜索操作可能需要幾秒鐘甚至幾分鐘。

02

Cowork給業(yè)界帶來的最大啟示就是,AI也可以構(gòu)建AI。

傳統(tǒng)軟件開發(fā)中,從概念到產(chǎn)品需要數(shù)月甚至數(shù)年,AI輔助開發(fā)將周期縮短到數(shù)周。

到了AI構(gòu)建AI階段,整個產(chǎn)品開發(fā)的周期可以以“天”為單位。Cowork就是最好的證明。

AI生成的代碼通常需要人工審查和修正,但當AI構(gòu)建的是AI工具本身時,它對領域的理解深度超越了通用場景。

Claude Code理解代碼生成的模式、常見錯誤、最佳實踐,因為它每天處理1.95億行代碼,形成了一種自產(chǎn)自銷的良性循環(huán)。

Anthropic的工程師鮑里斯·切爾尼(Boris Cherny)對這個過程的描述是:“我們采用了一種Vibe Coding的方法,工程師給出一個大概的結(jié)果,然后讓Claude Code生成Cowork的大部分功能?!?/p>

Claude Code不僅寫代碼,還提出自己的想法,建議應該構(gòu)建什么。因此這不是簡單的代碼生成,而是一個理解需求、設計架構(gòu)、實現(xiàn)功能的完整過程。

這種遞歸改進已經(jīng)在Anthropic內(nèi)部產(chǎn)生了顯著影響。

去年,Anthropic工程師表示,Claude輔助完成了30%的編碼工作。到了2025年,這個數(shù)字提升到了60%。

同時Anthropic的工程團隊表示,其團隊規(guī)模擴大了一倍,代碼合并請求(PR吞吐量)卻增加了67%。

這是一個反常識的事情,PR指的是當開發(fā)者完成一段代碼開發(fā)后,會發(fā)起代碼合并請求。當團隊審核代碼質(zhì)量、確認功能無誤,才能將這段代碼合并到項目的主分支中。

理論上來說,團隊規(guī)模越大,PR吞吐量越低。但是由于原本需要人工編寫、審核的大量功能代碼,被Claude Code承接,減少了人類工程師的重復工作。

工程師可以更聚焦于核心模塊的審核與架構(gòu)設計,讓PR的審核、合并流程更快,最終體現(xiàn)為電表倒轉(zhuǎn),PR吞吐量提升。

更進一步,Anthropic CEO 達里奧·阿莫德(Dario Amodei)在2025年10月季度技術(shù)溝通會上公開表示,新Claude模型和功能的“絕大多數(shù)”代碼現(xiàn)在由AI Agent自主編寫,且這個比例超過90%。

換句話說,今天你用的Claude,是昨天Claude自己寫給你用的。

Claude Code的能力被封裝進Cowork,Cowork又讓非技術(shù)用戶能夠構(gòu)建自動化工具,這些工具可能反過來生成新的AI輔助流程。

同時,整個過程也因為不斷有新的工具加入而變得越來越高效、越來越準確。

歸根結(jié)底,這些Agent產(chǎn)品的共同使命是將AI模型從聊天窗口中解放出來。

傳統(tǒng)chatbot的局限性已經(jīng)顯而易見,它們被動響應用戶輸入,無法主動執(zhí)行操作,缺乏跨會話記憶,困在對話框的界面牢籠里。當用戶需要完成實際工作時,chatbot只能提供建議,真正的執(zhí)行仍需人工介入。

新一代Agent實現(xiàn)了根本性突破。

2025年11月的AI Agent Summit上,一位Anthropic工程師描述的工作流:“15個并行實例,每個作為自主工作者無監(jiān)督執(zhí)行數(shù)小時。從早上用手機啟動會話,白天晚些時候檢查輸出。”

這種模式的核心在于,你把任務委托給你信任的模型,讓它在你不監(jiān)看時自行解決問題,同時也標志著,大模型正在從“對話助手”轉(zhuǎn)變成一位“數(shù)字員工”。

這個轉(zhuǎn)變不僅僅是技術(shù)進步,更是工作方式的重構(gòu)。

而在nthropic 2025年Q4內(nèi)部研發(fā)狀態(tài)報告中,一位Anthropic工程師估計,他們的工作已經(jīng)“70%以上轉(zhuǎn)變?yōu)榇a審查者/修訂者,而不是全新的代碼編寫者”。

另一位工程師認為,“為1個、5個或100個Claude的工作負責”是未來工程師唯一需要做的事情。他認為這不是失業(yè)的威脅,而是角色的轉(zhuǎn)換。從執(zhí)行者變成指揮者,從勞動者變成架構(gòu)師。

給Claude一個瀏覽器來測試自己的UI,質(zhì)量會提高2到3倍。給它一個測試套件,它會自我糾正。模型已經(jīng)具備了能力,構(gòu)建讓你能夠信任輸出而無需審查每一行的系統(tǒng)才能解鎖其余部分。

但這個轉(zhuǎn)變也沒有那么靠譜,當前的瓶頸是可靠性。

如果AI可以在10天內(nèi)構(gòu)建自己的繼任者,人類團隊面臨著“不可能的競賽”來審計正在創(chuàng)建的內(nèi)容。

PromptArmor報告稱,Cowork可以通過提示注入被誘騙將敏感文件傳輸?shù)焦粽叩腁nthropic賬戶,而在授予訪問權(quán)限后無需任何額外的用戶批準。

這個過程不僅相對簡單,而且愈發(fā)難以收拾。AI性能越強,權(quán)限越高,那么這個情況就會越惡化。

Anthropic對此的回應是,這個問題超出了范圍,因為包含受影響代碼的GitHub存儲庫已在2025年5月存檔,并且不計劃修補。

盡管存在這些風險,但AI構(gòu)建AI的趨勢已經(jīng)不可逆轉(zhuǎn)。

03

目前AGI已經(jīng)初具呈現(xiàn)。

這就不得不提起Claude Code引入的CLAUDE.md系統(tǒng)了。這是一個積累機構(gòu)知識的機制,工程師在同事的PR上標記@.claude來添加學習內(nèi)容,將AI視為一個正在入職的工程師,積累機構(gòu)知識。

用戶維護一個錯誤文件,記錄2500個token的累積更正,作為一個實體的記憶,否則它會在會話之間忘記一切。每個沖刺,AI在該代碼庫中變得更聰明。

這種學習不是被動的知識積累,而是主動的能力提升。Claude Code現(xiàn)在可以提出自己的想法,建議應該構(gòu)建什么。它不再只是執(zhí)行指令,而是參與到創(chuàng)意過程中。

這種從工具到伙伴的轉(zhuǎn)變,是AGI的一個關鍵特征。

Anthropic在2025年發(fā)布的《AI輔助研發(fā)效率白皮書》中提到了這么一個事情,Claude所輔助的工作中,27%是“否則不會完成”。

“否則不會完成”就是那些因為優(yōu)先級低、耗時久、回報不確定而被跳過的任務的統(tǒng)稱。比如為某個小眾功能做交互式數(shù)據(jù)監(jiān)控儀表板,不做也不會影響主線進度。那么如果這個數(shù)據(jù)監(jiān)控儀表板沒有做,它就會被歸類為“否則不會完成”。

只需給出目標,Claude就能自主設計、編寫、測試,工程師僅需最終審核,從而讓 “不值得做” 的任務變得可以做。

Anthropic在白皮書中寫道,這種把“否則不會完成”變成可以完成的能力,其增長不是線性的,而是指數(shù)級的。

當一個人類大腦可以監(jiān)督15個并行會話時,每個會話都被信任獨立執(zhí)行,生產(chǎn)力不是增加15倍,而是開啟了全新的可能性空間。

任務不再受限于人類的時間和注意力,轉(zhuǎn)而受限于問題的復雜性和AI的能力。

當然話又說回來了,目前AGI呈現(xiàn)仍然有明顯的局限性。

AI構(gòu)建的是仍然停留在應用層工具這個階段,而非底層模型。

Claude沒辦法構(gòu)建一個Claude。遞歸自我改進仍然局限在特定領域,而不是全面的智能提升。

可靠性仍然是瓶頸。ChatGPT Agent在簡單任務上的基線成功率只有12.5%,需要大量優(yōu)化才能達到實用水平。即使是表現(xiàn)最好的系統(tǒng),也會在復雜的用戶界面和擴展工作流程中遇到困難。

接下來還需要面對安全問題,提示注入攻擊、數(shù)據(jù)泄露、意外的破壞性操作,這些風險隨著AI自主性的增加而放大。

當前的安全措施主要依賴于沙箱隔離和權(quán)限控制,但這些機制在面對復雜的攻擊場景時可能不夠。

不過目前最大的瓶頸是Agent的通用性不夠高。

雖然這些Agent可以處理多種任務,但它們在特定領域的表現(xiàn)仍然遠超跨領域的泛化能力。

AGI的實現(xiàn)路徑不僅是語言模型性能的提升,更是產(chǎn)品形態(tài)和工作流設計的系統(tǒng)工程。當前的Agent產(chǎn)品展示了這條路徑的早期階段:從被動的對話到主動的執(zhí)行,從單次交互到持續(xù)學習,從人工監(jiān)督到自主工作。

Gartner的《AI Agent 重塑企業(yè)采購報告》預測,到2028年,90%的B2B采購將由Agent處理,“Agent商務”將控制超過15萬億美元的支出。

到2028年,使用多AgentAI處理80%客戶面向業(yè)務流程的組織將占據(jù)主導地位。AI是一個企業(yè)的基本能力,而不是附加功能。

它們將工作流程重新設計為基于AI以及AI優(yōu)先,而不是將AI塞入現(xiàn)有流程。

但這個轉(zhuǎn)變不會一帆風順。Gartner還預測,到2028年,25%的企業(yè)網(wǎng)絡安全事件將由AIAgent的誤用引起。隨著AI獲得更多自主權(quán),風險也在增加。

不過必須要承認的是,從Cowork到Manus,從Gemini CLI到ChatGPT Agent,這些產(chǎn)品正在重新定義人機協(xié)作的邊界。

當ChatGPT還在陪聊時,Cowork已經(jīng)開始“打工”了。AI不再是回答問題的工具,而是完成任務的伙伴。這個轉(zhuǎn)變的深遠影響,我們才剛剛開始理解。

特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)

AI手搓的Cowork“李鬼”版跟“李逵”一樣能打!還免費?
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號-1