
文 | 曹雙濤
編輯 | 楊博丞
題圖 | IC Photo
AI大模型的競爭,本質是頂尖AI人才的競爭。
海外市場上,為搶奪AI頂尖人才,歐美科技巨頭紛紛高薪挖人、留人。Meta、谷歌針對AI相關崗位年薪總包最高均在千萬元以上。Open AI從谷歌挖人時,承諾年薪(主要以股票形式)將在500萬美元-1000萬美元之間。
國內市場上,重點高校+知名教授帶隊的AI項目,成為國內AI創(chuàng)投圈瘋搶的對象,“清華系創(chuàng)投公司”前期更是不缺資金。如由清華大學計算機系技術成果轉化的智譜AI,2023年Q3單季度完成多筆融資,融資速度之快在創(chuàng)投圈中幾乎少見。

圖源:天眼查
“清華系創(chuàng)投公司”的深言科技、面壁智能、月之暗面,三家公司創(chuàng)始人豈凡超師從孫茂松、曾國洋師從劉知遠、楊植麟師從唐杰,這三位清華教授均參與清華大學AI研究院基礎模型研究中心的籌建,孫茂松任首席科學家、劉知遠任副主任、唐杰任研究中心主任。
4月份,月之暗面和面壁智能相繼傳出拿下新一輪融資,其中面壁智能本輪融資春華創(chuàng)投、華為哈勃領投,北京市人工智能產業(yè)投資基金等跟投,老股東知乎戰(zhàn)略跟進。

圖源:天眼查
國內頂尖高校技術學派,創(chuàng)始人年輕且奮斗在技術一線,初創(chuàng)公司沒有如阿里、字節(jié)“大廠病”。種種優(yōu)勢加持下,“清華系創(chuàng)投公司”的技術能力正走到國際前沿。
以面壁智能圍繞TOB推出的面壁MiniCPM2開源模型為例,據面壁智能透露,MiniCPM2模型在同等性能參數更小、同等參數性能更強,超越Mistral-7B、谷歌Gemma、Llama2-13B、 ChatGLM3-6B等,且170萬tokens的推理成本僅需1元。
MiniCPM2多次登頂GitHub Trending,躋身HuggingFace 50萬模型TOP3一周,GitHub星標3.4K,全網下載量37萬。
同樣的也有MiniCPM-1.2B模型,它在參數減少50%下,仍保持上一代2.4B模型87%的綜合性能。在多個公開權威測試榜單上,1.2B模型取得了綜合性能超過阿里通義Qwen1.8B、Llama2-7B,甚至超過Llama2-13B。
但在當前國內AI大模型商業(yè)化尚不明朗、行業(yè)加速迎來洗牌期,資本市場寒冬帶來的不確定性下,僅有技術和產品恐怕遠遠不夠。且面壁智能團隊過于年輕化,缺乏企業(yè)實際管理和商戰(zhàn)經驗,面壁智能未來也需解決重重難題。
一、TOC端產品面壁露卡Luca,頻頻報錯
面壁智能圍繞TOC端的基座模型產品面壁露卡Luca,去年11月獲得審批后對外開放。我們實測面壁露卡Luca時發(fā)現,其輸出的結果一言難盡。
在文本輸出能力上,當我們詢問面壁露卡Luca“您如何看待中國市場新能源汽車的價格戰(zhàn)時”,面壁露卡Luca首次結果顯示,政府對新能源汽車產業(yè)給予大力支持和補貼是新能源汽車價格戰(zhàn)的成因之一。

圖源:面壁露卡Luca
二次結果顯示,新能源汽車價格戰(zhàn)有利于整個行業(yè)健康發(fā)展,同時也有益于消費者。三次結果顯示,這既是機遇也是挑戰(zhàn)。
不管首次結果和2022年新能源汽車補貼退坡取消現實情況不符,還是后二次結果的前后矛盾,面壁露卡Luca的文本輸出能力仍需大幅度提高。

圖源:面壁露卡Luca

圖源:面壁露卡Luca
我們將難度稍微升級,讓面壁露卡Luca幫我們寫一篇800字的小米SU7文章,本是新能源汽車的小米SU7,兩次輸出結果均顯示小米SU7是一款智能手機。

圖源:面壁露卡Luca

圖源:面壁露卡Luca
不知為提升小米SU7銷量,又是直播又是給車主開車門各種賣力宣傳的雷軍,看到這個結果會作何感想。更甚者說,在小米本就沒有SU7這款機型時,面壁露卡Luca的這些信息又從何而來?
投資機構Atreides Management高層Gavin Baker曾稱,從人類回饋中進行強化學習的方法來說,若無法取得專有、即時的數據,且沒有足夠的部署管道,基礎模型或將成為歷史上折舊最快的資產。
Gavin Baker的這句話對也不對,對于各種通用大模型、經濟類大模型而言,信息更新速度既要快也要有深度。如金融TOB類大模型,要求極高精準度,不允許出現任何錯誤,時效性也快。時效問題可能通過算力升級來解決,可精準度又要如何解決呢?
但對于如情感類、國學類小模型,以及包括學而思、網易有道等K12教育類垂直大模型來說,對信息更新速度并不是要求很高。畢竟從古至今人性具有很大共性,K12學科類不少知識點具有固定化。面壁露卡Luca作為一款通用大模型,若文本輸出信息屢屢出錯,又何談TOC端用戶增長呢?
在測試解讀圖片信息方面,我們選取網絡平臺上一張同時包含中國傳統(tǒng)神話故事中四大神獸的圖片。面壁露卡Luca不僅將玄武識別為獅子,且圖片中的朱雀也未能識別出,四大神獸變成三大神獸。

圖源:面壁露卡Luca
在測試邏輯推理時,我們選取2023年新課標2卷上的一道高考數學真題,但面壁露卡Luca在識別這道真題識首問時,無法準確識別原題,更別提后面的證明過程。

圖源:2023年高考新課標2卷

圖源:面壁露卡Luca
第二問將原題中的“cosax”中的a識別丟失下,面壁露卡Luca居然還能給出完整的推理過程以及a的取值范圍,這實在有些讓我們費解。

圖源:面壁露卡Luca
從2023年至今國內大模型技術快速迭代,尤其是kimi、文心一言都在卷長文本輸出能力下,面壁露卡Luca的這些能力真的是2024年大模型該有的水平嗎?
二、TOB端AI Agent,商業(yè)化落地遠比想象的難
TOC端面壁露卡Luca表現欠佳,可能和面壁智能對TOB端更重視有關。圍繞TOB端,面壁智能推出基于AI代碼生成工具的ChatDev,核心能力包括快速生成應用程序、AI Agents群體智能協(xié)作等。
除面壁智能外,目前國內多家廠商也紛紛推出TOB端AI Agent。如阿里云ModelScopeGPT、聯(lián)匯科技OmBot、瀾碼科技AskXBot、昆侖萬維天工SkyAgents、實在智能實在Agent等等。
但AI Agent想要在國內市場探索清晰的商業(yè)化之路,仍有很長的路要走。對標SaaS產業(yè)來看,只有給客戶帶來明確價值的SaaS產品,客戶才愿意買單。小到餐飲店購買SaaS點餐軟件,大到零售行業(yè)需零售類SaaS完成日常商品進銷存、記錄供應商貨款等等。剛需性較強下,零售類SaaS也是2021年國內行業(yè)垂直SaaS最大的市場。

圖源:艾瑞咨詢
AI大模型市場上,不管是淘寶上賣GPT4會員賬號付款人數較多,抖音平臺各種AI課程的高轉化率?;蚴莻涫軤幾h的李一舟AI課程的火爆,越來越多的“大佬”從質疑李一舟到成為李一舟,均符合該邏輯。

圖源:達多多(數據維度:2024年1月30日至2024年2月28日)
但目前很多企業(yè)主并沒有真正意識到AI所帶來的價值,尤其是在各類SaaS已滿足企業(yè)核心業(yè)務需求以及企業(yè)紛紛追求降本增效下,企業(yè)主很難在AI Agent上投入太多費用。
即使有企業(yè)基于AI Agent做小模型,但投產比也是一大問題。有自媒體反饋稱,目前包括百家號、頭條號、抖音等自媒體平臺,均對AI生成的圖文、視頻嚴重限流。
企業(yè)開發(fā)小模型,一方面企業(yè)要投入大量人員從代碼部署到模型訓練,到后續(xù)企業(yè)小模型商業(yè)化推廣。另一方面,考慮到信息安全問題,后續(xù)也需購買AI服務器,預估整個成本約在百萬級。高投入下后續(xù)又要靠什么攤薄成本、實現盈利?
更深層來看,給客戶帶來明確價值的背后,最好是要服務企業(yè)核心業(yè)務流程,才能讓企業(yè)主看到價值。但目前AI Agent仍需持續(xù)努力,才能滿足這些。
來自國內某互聯(lián)網大廠技術總監(jiān)朱楊告訴DoNews,以阿里云Model Scope GPT對外宣傳的多模型協(xié)同能力,這種能力相當于“搭積木”。但積木是有限的,且若是我需要圓形積木或異形積木,它只提供方形積木也很難滿足我的需求。同理當企業(yè)端核心業(yè)務相對復雜時,不管積木如何搭配,也無法解決業(yè)務實際需求。
同樣的情況也適用于面壁智能的ChatDev,以OTA類軟件為例,從航班查詢到機票購買,從機票推薦機制到捆綁保險,從用戶最終下單到后續(xù)改簽、退款帶來的售后,從用戶行程完成到機票價格按比例給平臺會員返現。整個過程中不僅要加密緩存大量數據,且要打通如航司、支付、保險、售后等多個數據接口。
業(yè)務場景高度復雜化下,除要和對應業(yè)務產品經理確定需求外。即使AI能幫助開發(fā)人員提高編寫代碼效率,但開發(fā)人員也只能全程手動編寫代碼,不可能全部使用AI提供的代碼。
畢竟一旦AI給到的代碼存在語法和邏輯錯誤,很容易對公司核心業(yè)務構成影響,直接影響開發(fā)人員考核。更重要的是,互聯(lián)網的軟件開發(fā)并不是簡單地編寫代碼,還有各種數據、緩存、接口、配置等基礎服務需要對接,每家企業(yè)情況又不同。
因很多大型互聯(lián)網業(yè)務成熟,想要實現重大版本更新并非易事。在互聯(lián)網流量紅利徹底退潮下,新軟件面臨著推廣成本高、用戶獲取難、盈利難的問題。這讓AI Agent陷入互聯(lián)網大企業(yè)應用少,小企業(yè)沒錢用,技術人員使用低,不懂技術的人不知道如何開發(fā)的尷尬局面,這種情況預估3—5年才有所改善。
如朱楊所言,飛書在顛覆時期員工數量超八千多人,產研人員占比2/3的情況下,近半年發(fā)布的版本多以小升級為主,更別提資金實力不占優(yōu)勢的小型互聯(lián)網企業(yè)。

圖源:七麥數據
三、如何快速退去青澀,增加現實主義?
除朱楊所提到的技術問題外,AI大模型想要在TOB端占領市場也需做到:
一是AI能力對所服務企業(yè)的運營流程有所理解,并可根據這種流程進行AI能力的調整。如文生圖成為AI大模型的標配,但中大型企業(yè)對外的營銷圖有著嚴格的VI視覺規(guī)范,尤其是牽扯到品牌代言人時要求更高。那么AI大模型針對不同企業(yè)的VI視覺規(guī)范又要如何生圖,又要如何進行約束,又要如何保存呢?
同理,AI大模型也需對客戶業(yè)務流程中的傳入參數和傳出參數有所理解,畢竟參數是客戶的“生命線”,甚至能根據這種參數衍生出不同場景。如人臉識別的視頻流,既牽扯到橫向和豎向視頻,又牽扯到1080和1920分辨率,又牽扯到視頻畫面是否穩(wěn)定、光線是否穩(wěn)定等等。
二是想要和客戶業(yè)務流程耦合,AI應用也要以API Centric方式進行設計規(guī)劃。但在客戶調取API數據接口,又要如何做到悄無聲息、無影無形呢?如互聯(lián)網APP短信驗證碼登錄為有形的,用戶搜索某關鍵詞時,后臺檢索關鍵詞生產內容和商品對用戶是無形的。
但國內目前又有多少AI公司能同時做到上述兩點呢?另對標SaaS產業(yè)來看,定制路線意味著回款周期長,且客戶需求差距大帶來企業(yè)投入成本高、可復制程度低。市場競爭激烈下,SaaS公司議價能力低。
同時考慮到目前企業(yè)對大模型定制需求不高,如從2019年至2023年完成七輪融資的竹間智能,2023年初就推出大模型相關的產品和服務,并為大型企業(yè)自建大模型提供一站式服務。但今年年初竹間智能公告稱,因客戶需求較少停工半年。

圖源:天眼查

圖源:竹間智能公告
這就意味著未來3—5年國內走TOB端商業(yè)化的AI公司很難盈利,面壁智能或將需要資本持續(xù)輸血,才能解決研發(fā)過程中資金流不足問題,進而保證技術能力始終走到前列??扇羰浅掷m(xù)引入資本,又是否會像智譜AI創(chuàng)始人張鵬這樣,股權被持續(xù)稀釋呢?

圖源:天眼查
另外面壁智能作為初創(chuàng)企業(yè),相較于大廠而言,仍有很多短板需要補齊。
一方面,對不同行業(yè)高質量的數據積累不足,客戶資源積累深度不夠、缺乏更多實戰(zhàn)經驗。
另一方面,面壁智能目前團隊年齡多集中在28歲以研發(fā)人員為主,團隊稍顯年輕,缺乏明顯的商戰(zhàn)經驗和企業(yè)管理經驗。
如面壁智能CEO李大海曾指出,在服務TOB端時,我們傾向于選擇擅長跟客戶溝通、交付能力強的合作伙伴,我們提供平臺、工具,合作伙伴去做好交付落地工作。在這個合作鏈條中,我們只要把各自擅長做的事做好,就能一起給客戶產生價值。
短期來看,這種合作模式是能夠幫助面壁智能增加項目經驗。但長期來看,面壁智能在整個項目執(zhí)行過程中充當丙方的角色,暫且不說來回溝通下,是否能完整理解客戶需求。
客戶不攥在自己手中,不進行長期的客情維護,很容易產生大客戶流失。同時大客戶回款周期相對較長,又牽扯到乙方這很容易出現三角債問題,且若是未來行業(yè)爆發(fā)和SaaS產業(yè)、數據庫產業(yè)、云產業(yè)這樣的價格戰(zhàn),面壁智能還能拿到多少利潤呢?這很容易影響到面壁智能的現金流穩(wěn)健。
在和TOB端到底合作上,面壁智能高層們或許真的需要找國內老牌SaaS廠商金蝶和用友好好取經了。如何退掉身上的書生氣和理想主義,增加“江湖氣”和現實主義,將是面壁智能高層們需要盡快解決的問題。
結語:
我們始終堅信隨著“清華系初創(chuàng)公司”的不斷努力,必然會加速國內AI產業(yè)的迅速發(fā)展,逐漸縮小和歐美在AI大模型上的差距。但企業(yè)畢竟要生存,在資本壓力下要做大規(guī)模,面壁智能對資本的依賴、團隊經驗不足等問題,整個“清華系初創(chuàng)公司”都存在類似。
在這些問題的解決過程中,創(chuàng)始人資歷和性格的不同,會讓“清華系初創(chuàng)公司”迎來一輪洗牌。誰能成為最后的王者,可能需要市場來給出答案。