久久久九九九一级大片a|一级黄片黄片一级一级|三级无码视频免费操人视频|成人精品A片亚州一区二区|亚洲日韩欧美在线一二区|91丝袜一区二区|国摸私拍电影一区二区爱|免费久久久久久久久久久久|免费国产黄色av发布网址|国产精品人妻人伦a 6 2v久动漫

首創(chuàng)“證據(jù)錨定”技術(shù),百川推出最低幻覺循證增強醫(yī)療大模型M3 Plus

DoNews1月22日消息,1月22日,百川智能正式發(fā)布 Baichuan-M3 Plus,嚴肅醫(yī)療場景下的問答準確性、可靠性,再次刷新了剛剛推出的M3所創(chuàng)下的世界紀錄。

憑借獨創(chuàng)的六源循證技術(shù)與M3基座結(jié)合,M3 Plus將幻覺率降低至2.6%,低于 Open Evidence,達到全球最低水平;首創(chuàng)“證據(jù)錨定”技術(shù),不僅給出引文來源,還能將模型生成的每一句醫(yī)學(xué)結(jié)論,精確錨定到原始論文中的對應(yīng)證據(jù)段落,使 AI 的醫(yī)學(xué)判斷真正做到可核驗、可追責(zé)、可教學(xué)。

更具意義的是,百川宣布推出「海納百川」計劃,將全球最低幻覺的循證增強醫(yī)療大模型以API形式,免費開放給中國醫(yī)療服務(wù)機構(gòu),共同繁榮國內(nèi)的AI醫(yī)療生態(tài),推動中國AI醫(yī)療的變革,讓每一位中國醫(yī)務(wù)工作者都能擁有可靠、好用的AI助手。

低幻覺率再次刷新世界紀錄,讓AI具備邁向臨床的診療能力

對于中國的醫(yī)生而言,擁抱AI的先決條件,是AI真實具備了足夠優(yōu)秀的診療能力。當(dāng)患者頻繁使用DeepSeek、豆包等通用大模型的AI產(chǎn)品去尋求診療建議,大量的誤判、幻覺,不僅讓醫(yī)生不勝其煩,更逐漸演變?yōu)橐粓鰧χ袊t(yī)療AI技術(shù)的信任危機。

隨著上周百川M3大模型的正式開源,這一局面已被徹底打破。M3不僅在 Healthbench、Healthbench Hard 等多個權(quán)威評測中登頂榜首,實現(xiàn)了對 GPT-5.2的全面超越,更在 OpenAI 引以為傲的低幻覺領(lǐng)域完成超越,以3.5%的幻覺率領(lǐng)跑全球。

作為百川拓展低幻覺技術(shù)路線的成功實踐,M3首創(chuàng)的 Fact-Aware RL的強化學(xué)習(xí)范式,使底座模型在無工具的設(shè)定下,幻覺也能大幅降低到SOTA水平。

在此基礎(chǔ)上,M3 Plus 將 M2 Plus 模型已驗證有效的六源循證范式,引入模型訓(xùn)練和推理過程,確保模型的每條建議都有專業(yè)醫(yī)學(xué)證據(jù)支持。最終,M3 Plus的事實性幻覺降低到新的SOTA,僅2.6%,相較GPT-5.2大幅下降超30%。即便與行業(yè)標(biāo)桿 Open Evidence相比,M3 Plus 也完成了超越。

首創(chuàng)“證據(jù)錨定”技術(shù):讓 AI 的每一句醫(yī)學(xué)結(jié)論,都能被逐句核驗

在循證醫(yī)學(xué)體系中,真正決定醫(yī)生是否信任一條結(jié)論的,從來不是語言是否流暢,而是結(jié)論背后的證據(jù)是否權(quán)威、是否準確、是否可追溯。相比“說得像不像醫(yī)生”,臨床更關(guān)心的是:這句話,究竟依據(jù)哪篇論文、哪條指南、哪一段原文。

當(dāng)前行業(yè)中,無論是通用大模型還是醫(yī)療模型,大多已支持“文獻引用”——在結(jié)論后標(biāo)注論文或指南來源。但在實際使用中,醫(yī)生往往會發(fā)現(xiàn):點開引文,依然無法判斷 AI 的這句結(jié)論究竟源自哪一段證據(jù)。更常見的問題是兩類:一是“張冠李戴”,引用編號存在,但文獻內(nèi)容對不上;二是“內(nèi)容沖突”,文獻本身正確,但被引用的段落與結(jié)論并不匹配,甚至存在拼接、誤讀。

百川 M3 Plus 首創(chuàng)“證據(jù)錨定(Evidence Anchoring)”技術(shù),不是簡單標(biāo)注“引用自哪篇文獻”,而是要求模型生成的每一句醫(yī)學(xué)結(jié)論,都必須精確對應(yīng)到原始論文或指南中的具體證據(jù)段落。每一句判斷,都能被逐字溯源、逐條核驗。

為實現(xiàn)這一目標(biāo),百川將“證據(jù)錨定”作為獨立訓(xùn)練目標(biāo),引入 Citation Reward Model,對錯誤引用進行明確懲罰,讓模型只能在“確實有證據(jù)支持”的空間中推理與生成。最終,結(jié)論與證據(jù)段落的匹配準確率超過 95%,真正讓 AI 的醫(yī)學(xué)判斷做到可核驗、可追責(zé)、可教學(xué)。

M3 Plus API 調(diào)用價格較上一代模型大幅降低70%

在大模型快速演進的當(dāng)下,能力越強的模型,調(diào)用成本往往越高,許多優(yōu)秀的應(yīng)用因此難以規(guī)模化落地,更難真正走進臨床一線。百川認為,只有持續(xù)降低智力成本,AI 才能覆蓋臨床、教學(xué)等真實場景,成為醫(yī)生和患者“用得起、用得好”的基礎(chǔ)能力。

為此,M3 Plus 在系統(tǒng)層面進行了全面的工程重構(gòu),通過 MoE 架構(gòu)優(yōu)化、模型量化以及 Gated Eagle-3 投機解碼等關(guān)鍵技術(shù),在嚴格保證模型能力與可靠性的前提下,實現(xiàn)了 API 調(diào)用成本較上一代降低 70%,為 AI 在醫(yī)療場景的規(guī)?;瘧?yīng)用掃清了關(guān)鍵障礙。

百川全面開放M3 Plus的技術(shù)能力,API限時免費體驗15天,所有開發(fā)者均可申請使用。

「海納百川」計劃開啟,M3 Plus 向行業(yè)伙伴免費開放

隨著人工智能開始進入門診、病房和醫(yī)學(xué)教學(xué)等真實場景,越來越多醫(yī)生在工作中接觸到 AI:查資料、看指南、對照證據(jù)、推敲診療方案。但在高強度、強責(zé)任的臨床環(huán)境中,AI 能在多大程度上真正幫到醫(yī)生,仍需要在真實使用中不斷探索。

醫(yī)生“用好 AI”的新局面,要靠足夠多的行業(yè)伙伴在真實場景里一起打磨——怎么嵌入醫(yī)療流程、怎么做證據(jù)呈現(xiàn)、怎么做風(fēng)險提示、怎么支持年輕醫(yī)生成長。

為此,百川發(fā)起 「海納百川」計劃:面向所有服務(wù)醫(yī)務(wù)工作者的機構(gòu),免費提供全球幻覺最低循證增強醫(yī)療大模型 M3 Plus 的 API,把服務(wù)醫(yī)生的AI能力直接交到生態(tài)伙伴手里。

從核心技術(shù)的持續(xù)突破,到面向行業(yè)生態(tài)的免費開放,「海納百川」不僅是一個名字,更是一份推動中國AI+醫(yī)療發(fā)展的承諾。百川愿與行業(yè)伙伴一道,圍繞醫(yī)生、面向患者,推動醫(yī)療 AI 更安全、更可及、更有溫度地發(fā)展,讓技術(shù)進步真正轉(zhuǎn)化為人民健康的長期福祉。

「海納百川」計劃|參與條件:

適用對象:

為醫(yī)務(wù)工作者提供服務(wù)的機構(gòu)

醫(yī)務(wù)工作者包括醫(yī)生、藥劑師、醫(yī)技師、護士、健管師、醫(yī)學(xué)生等

適用場景僅限于:

臨床輔助決策、醫(yī)學(xué)教育

用途限制:

僅用于真實服務(wù)場景、不得用于數(shù)據(jù)生產(chǎn)

使用要求:

產(chǎn)品需明確展示 Powered by 百川、不得對模型輸出進行影響準確性的修改

首創(chuàng)“證據(jù)錨定”技術(shù),百川推出最低幻覺循證增強醫(yī)療大模型M3 Plus
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號-1