摩爾線程上市不到兩周,又一家國產(chǎn)芯片企業(yè)沐曦登陸A股。
和摩爾線程一樣,沐曦也創(chuàng)造了令人炫目的財富神話:首日高開568.83%,報700元/股,總市值達2800億元,本次IPO募資41.97億元,發(fā)行價104.66元/股,網(wǎng)上中簽率僅0.03348913%。
中一簽盈利近30萬元,直接刷新了A股年內(nèi)打新收益紀錄。
與之相對,被稱為國產(chǎn)英偉達的摩爾線程,截止至發(fā)稿,股價報715.06元/ 股,較昨日收盤微漲 0.51%,當前總市值約 3361 億元,位列A股第三高價股,僅次于寒武紀和貴州茅臺。
股價與市值的火爆表現(xiàn),讓沐曦與摩爾線程這兩家國產(chǎn) GPU 頭部玩家成功站上聚光燈下。但資本市場的熱度背后,是兩家企業(yè)截然不同的基因底色、技術(shù)路線博弈,以及對國產(chǎn)算力替代賽道的差異化布局。
兩家國產(chǎn)GPU 芯片在資本市場上接連締造財富神話,無疑會令“英偉達國產(chǎn)平替”們的上市之路更加急迫,問題是,第三個幸運兒會是誰?這場財富盛宴又能持續(xù)多久?
A
如果摩爾線程被稱作是國產(chǎn)英偉達,那么沐曦就是國產(chǎn)AMD。
沐曦成立于2020年9月,創(chuàng)始人陳維良曾在AMD工作17年,擔任過AMD全球GPGPU設計總負責人,負責全球通用計算GPU產(chǎn)品線的整體設計與管理,主導并完成15款高性能GPU產(chǎn)品的流片與量產(chǎn)。聯(lián)合創(chuàng)始人彭莉和楊建,兩人都是AMD企業(yè)院士。
彭莉是AMD全球首位華人女性企業(yè)院士,在AMD任職多年歷任圖形架構(gòu)師、系統(tǒng)架構(gòu)師、首席芯片架構(gòu)師等職務。楊建在AMD工作了14年,同樣擁有深厚的GPU技術(shù)積累。
沐曦的產(chǎn)品線很清晰,分成三大系列。曦思N系列專注AI推理,首款智算推理芯片曦思N100于2022年1月交付流片,2023年4月正式量產(chǎn)。曦云C系列做訓推一體和通用計算,這是公司目前的主力產(chǎn)品,曦云C500于2024年2月正式量產(chǎn),采用7nm工藝,專注AI訓練、推理及科學計算。還有曦彩G系列負責圖形渲染,不過這個系列目前還在研發(fā)階段,尚未量產(chǎn)。
從產(chǎn)品路線看,沐曦走的是典型的,“先做推理,再做訓練,最后補齊圖形”的路徑。
2022年,沐曦先拿推理芯片打開市場,2024年訓推一體芯片量產(chǎn)后迅速成為營收支柱,圖形渲染則留到后面慢慢打磨。
業(yè)績數(shù)據(jù)能看出這家公司的爆發(fā)力。2022年營收只有42.64萬元,2023年躍升到5302.12萬元,2024年達到7.43億元,三年復合增長率高達4074.52%。2025年前三季度營收已經(jīng)達到12.36億元,同比增長453.52%,全年營收預計在15億到19.8億元之間。
但高增長的背后是持續(xù)的虧損。2022年到2024年,歸母凈利潤分別為-7.77億元、-8.71億元、-14.09億元,三年累計虧損超過30億元。2025年前三季度虧損3.46億元,雖然虧損幅度在收窄,但距離盈利還有距離。公司給出的預測是,最早將于2026年達到盈虧平衡。
這種財務狀況在國產(chǎn)GPU行業(yè)其實是常態(tài)。GPU芯片屬于資本和技術(shù)雙密集型行業(yè),前期研發(fā)投入巨大,需要持續(xù)燒錢打磨產(chǎn)品和生態(tài),只有當出貨量上來、規(guī)模效應顯現(xiàn)之后,才有可能扭虧為盈。摩爾線程也一樣,預計最早2027年才能實現(xiàn)盈利。
沐曦的客戶主要集中在國家算力平臺、智算中心、行業(yè)頭部企業(yè)這些To B場景。產(chǎn)品已經(jīng)部署在10余個智算集群,覆蓋北京、上海、杭州、長沙、香港等多地,服務對象包括教科研、金融、交通、能源等行業(yè)。2024年營收中,曦云C500系列貢獻了98%的收入,單一產(chǎn)品依賴度極高。
這既是優(yōu)勢也是風險。優(yōu)勢是資源集中、目標明確,能夠把有限的資金和人力投入到最核心的產(chǎn)品上。風險是一旦C500被競品超越或者遭遇技術(shù)瓶頸,公司的營收會立刻受到?jīng)_擊。
從累計銷量看,截至2025年第一季度,沐曦GPU累計銷量超過2.5萬片,2025年預計總出貨量在3萬到5萬片之間。這個數(shù)字和英偉達一年550萬張的出貨量比起來,差距極其巨大。但在國產(chǎn)GPU領(lǐng)域,這個銷量已經(jīng)算是頭部玩家的水平。
B
反觀摩爾線程,其創(chuàng)始人張建中,在英偉達工作了14年,曾任英偉達全球副總裁、大中華區(qū)總經(jīng)理。他親歷了GPU從圖形芯片演變?yōu)锳I基礎(chǔ)設施的全過程,對英偉達的CUDA生態(tài)體系有著深刻理解。
摩爾線程的核心高管中,也有多位都來自英偉達。
這種基因差異直接決定了兩家公司的技術(shù)路線選擇。
摩爾線程的MUSA架構(gòu),走的是轉(zhuǎn)譯兼容路線。核心工具MUSIFY能夠?qū)UDA C++源代碼自動轉(zhuǎn)換為MUSA C++源代碼,再通過MUSA編譯器生成基于MUSA指令集的二進制代碼。
這種策略的殺手锏在于零門檻遷移,開發(fā)者用CUDA寫的代碼,可以在MUSA平臺上無需修改直接運行,甚至常見的CUDA算子能即插即用。
MUSA已經(jīng)開源了Torch-MUSA、OpenCV-MUSA、vLLM-MUSA等工具鏈,全面適配PyTorch、TensorFlow、百度飛槳等主流AI框架。截至2024年11月,Torch-MUSA專屬支持的算子總數(shù)已超過1050個。
這種策略的優(yōu)勢很明顯:開發(fā)者學習成本低,現(xiàn)有的CUDA生態(tài)可以快速遷移過來,對于急需國產(chǎn)替代方案的客戶來說,這是最現(xiàn)實的選擇。
但軟肋也同樣明顯。本質(zhì)上,這是在CUDA生態(tài)上加了一層轉(zhuǎn)譯層,英偉達的專利武器庫隨時可能引爆,而且轉(zhuǎn)譯過程必然會帶來性能損耗,無論優(yōu)化得多好,都難以完全避免。更關(guān)鍵的是,這條路走到極致,也只是,更好的兼容版,很難說是真正的技術(shù)自主可控。
沐曦的MACA軟件棧,走的是自主指令集路線。GPU IP包含指令集、微架構(gòu)在內(nèi)全部自研,擁有獨立知識產(chǎn)權(quán),從底層與CUDA徹底切割。
MACA提供類C編程語言,兼容主流C/C++異構(gòu)計算語法,但需要開發(fā)者重新學習和適配。
這種策略的優(yōu)勢是長期安全,不受英偉達EULA條款約束,技術(shù)演進完全自主可控,專利風險可以規(guī)避。但代價是生態(tài)重建成本巨大。
MACA直到2025年2月才開源工具鏈,比MUSA晚了近兩年。開發(fā)者社區(qū)的活躍度遠不如摩爾線程,遷移工具的易用性也有明顯差距。除非客戶被完全禁止使用任何英偉達產(chǎn)品,包括CUDA,否則主動遷移的意愿一般都很低。
相較之下,MUSA軟件棧2022年首發(fā),已經(jīng)形成完整開發(fā)生態(tài)。
產(chǎn)品線戰(zhàn)略上,摩爾線程走的是To C加To B雙線布局。
To C端。摩爾線程的春曉芯片,220億晶體管規(guī)模,集成4096個MUSA流處理核心加128個專用張量計算核心,主頻1.9GHz,F(xiàn)P32算力15.2TFLOPS。
核心優(yōu)勢是全功能架構(gòu),單芯片同時支持現(xiàn)代圖形渲染引擎、智能多媒體引擎、AI計算加速引擎、物理仿真四大引擎,覆蓋DirectX、OpenGL、Vulkan、OpenCL等主流接口。MTT S3000是業(yè)內(nèi)首款支持PCIe 5.0標準的GPU產(chǎn)品,256bit顯存位寬配32GB GDDR6顯存。
這種設計使其可以橫跨AI智算、云游戲、云渲染、視頻云等多場景。To C端的MTT S80消費級顯卡,搭載完整的春曉芯片,能夠流暢運行《暗黑破壞神3》《英雄聯(lián)盟》等主流游戲。
這是國內(nèi)唯一支持Windows DirectX 12的游戲顯卡,也是國內(nèi)唯一能批量出貨桌面級顯卡的廠商。
To B端,摩爾線程的產(chǎn)品線更加豐富。MTT S3000,面向云渲染、云游戲等企業(yè)場景。更高端的MTT S4000是訓推一體智算卡,MTT S5000則支持FP8精度,專門針對大模型訓練和推理優(yōu)化。同時摩爾線程還有面向數(shù)據(jù)中心的萬卡互聯(lián)方案KUAE。
沐曦走的是純To B路線,產(chǎn)品線高度聚焦。
沐曦的曦云C500,采用7nm工藝,通用GPU架構(gòu),專注AI訓練、推理及科學計算,對標的是英偉達A100。
雖然其自研指令集和可重構(gòu)GPU架構(gòu),并宣稱通過獨創(chuàng)硬件加速單元優(yōu)化算力能耗比,突破了傳統(tǒng)GPU能效瓶頸。
但曦彩G系列圖形渲染GPU仍在研發(fā)階段,無法提供成熟的圖形能力。下一代旗艦曦云C700號稱接近英偉達H100,但在H100的4000TFLOPS面前,15TFLOPS的C500更像是在追趕上一代產(chǎn)品。
曦思N100專注推理,曦云C500做訓練推理兼顧,曦彩G系列圖形渲染還在PPT階段。
本質(zhì)上這是兩種不同的豪賭。摩爾線程賭的是,CUDA生態(tài)護城河會逐漸松動,通過轉(zhuǎn)譯工具搶奪英偉達的開發(fā)者。沐曦賭的是,自主可控的戰(zhàn)略價值會倒逼客戶接受生態(tài)重建成本。
前者像當年Android兼容Java應用的策略,后者則是自研內(nèi)核。
C
然而歷史已經(jīng)給出了殘酷的答案。
AMD在全球GPU市場苦戰(zhàn)20年,市占率始終徘徊在10%左右,面對英偉達的CUDA生態(tài)壁壘幾乎無解。這場國產(chǎn)AMD與國產(chǎn)英偉達的路線分歧,怎樣才能避免重復的結(jié)局?
同時沐曦和摩爾線程也面臨相同的問題,他們的產(chǎn)品性能遠低于英偉達最新的旗艦產(chǎn)品。
根據(jù)摩根大通的數(shù)據(jù),2025年英偉達出貨550萬張GPU。
相較之下,摩爾線程AI計算芯片1.5萬到2萬片,消費級顯卡及SoC 15萬片,但后者多為面向信創(chuàng)PC和輕薄本市場的低算力產(chǎn)品。沐曦截至2025年第一季度累計銷量2.5萬片,2025年預計總出貨量3萬到5萬片。
不是因為價格,而是因為性能代差至少2到3代。
光是H100單卡性能相當于國產(chǎn)旗艦GPU的3到5倍,而且英偉達的迭代速度比國產(chǎn)廠商更快。等沐曦、摩爾線程的下一代產(chǎn)品出來,英偉達的B系列已經(jīng)開始收割市場。
更要命的是,大部分所謂,國產(chǎn)化訂單,本質(zhì)上是被動替代,而非是客戶主動選擇,買不到英偉達才退而求其次。12月8日,特朗普宣布放寬英偉達H200出口政策后,字節(jié)內(nèi)部迅速成立“H200 自采項目組”,騰訊則是參與緊急會議,提交H200需求預測報告。
從現(xiàn)狀來看,目前國產(chǎn)GPU的真實應用場景大多是這些推理場景,算力要求低,國產(chǎn)勉強夠用。教育科研,不追求極致性能。以及一些采購項目,強制國產(chǎn)化要求。
但在真金白銀的商業(yè)AI訓練市場,主動選國產(chǎn)方案的客戶數(shù)量并不多。
從已有的訂單看,沐曦和摩爾線程大概率會繼續(xù)獲得融資和政策支持,營收也會隨著強制國產(chǎn)化訂單增長。
但要真正成為客戶的首選,而非備胎,需要解決三大核心問題:性能、軟件生態(tài)成熟、供應鏈穩(wěn)定性達到英偉達水平。
國產(chǎn)GPU的故事,注定是一場漫長的馬拉松,IPO首日漲5倍的狂歡,并不能代表未來。
就在摩爾線程、沐曦雙雄逐鹿科創(chuàng)板之際,另一個玩家——百度旗下的昆侖芯也傳出赴港IPO的消息。2025年12月,路透社援引知情人士稱,昆侖芯計劃最早于2026年一季度向港交所遞交上市申請,目標2027年初完成IPO,最新投后估值約210億元。
更引人注目的數(shù)據(jù)是:昆侖芯2024年營收約20億元,超過已上市的摩爾線程的4.38億元和沐曦的7.43億元,更是超過了寒武紀的11.74億元。摩根大通預測,其2026年營收或暴漲至83億元,是2025年預期的6倍。
更關(guān)鍵的是,昆侖芯是大廠自用模式的典型。百度持股59.45%,文心大模型的萬卡訓練集群就用的是昆侖芯,這種左手研發(fā),右手采購的閉環(huán)是摩爾線程、沐曦這些市場化公司無法復制的天然優(yōu)勢。
昆侖芯選擇港股而非科創(chuàng)板,可能也透露出其直至2026年才有望實現(xiàn)盈虧平衡,A股對盈利的硬性要求顯然不太友好。其外部客戶占比約40%,包括vivo、吉利汽車、招商銀行、南方電網(wǎng)等,雖然看似多元化,但核心還是靠百度內(nèi)部訂單撐起規(guī)模。
大廠自用,能保證訂單穩(wěn)定,但若找不到其他出路,那就等于天花板鎖死。
但對于一直對百度市值不滿的李彥宏來說,昆侖芯上市是一次難得的享受市場“高估”的機會。盛宴不常,盛筵難再,英偉達國產(chǎn)平替?zhèn)兾ㄓ信Τ蔀樨敻簧裨?,或許才有足夠的儲備撐到黎明。
特別聲明:本文為合作媒體授權(quán)DoNews專欄轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個人觀點,不代表DoNews專欄的立場,轉(zhuǎn)載請聯(lián)系原作者及原出處獲取授權(quán)。(有任何疑問都請聯(lián)系idonews@donews.com)