DoNews1月22日消息,今天,在百度文心Moment大會(huì)現(xiàn)場(chǎng),文心大模型5.0正式版上線。

文心大模型5.0正式版參數(shù)達(dá)2.4萬(wàn)億,采用原生全模態(tài)統(tǒng)一建模技術(shù),具備全模態(tài)理解與生成能力,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出。

在40余項(xiàng)權(quán)威基準(zhǔn)的綜合評(píng)測(cè)中,文心5.0正式版的語(yǔ)言與多模態(tài)理解能力穩(wěn)居國(guó)際第一梯隊(duì)。圖像與視頻生成能力與垂直領(lǐng)域?qū)>P拖喈?dāng),整體處于全球領(lǐng)先水平。
目前,用戶可在文心APP、文心一言官網(wǎng)體驗(yàn),企業(yè)與開發(fā)者可通過百度千帆平臺(tái)進(jìn)行調(diào)用。
原生全模態(tài)大模型 文心5.0正式版上線
百度集團(tuán)副總裁、深度學(xué)習(xí)技術(shù)及應(yīng)用國(guó)家工程研究中心副主任吳甜介紹,與業(yè)界多數(shù)采用“后期融合”的多模態(tài)方案不同,文心5.0的技術(shù)路線采用統(tǒng)一的自回歸架構(gòu)進(jìn)行原生全模態(tài)建模,將文本、圖像、視頻、音頻等多源數(shù)據(jù)在同一模型框架中進(jìn)行聯(lián)合訓(xùn)練,使得多模態(tài)特征在統(tǒng)一架構(gòu)下充分融合并協(xié)同優(yōu)化,實(shí)現(xiàn)原生的全模態(tài)統(tǒng)一理解與生成。

此外,文心5.0采用超大規(guī)?;旌蠈<医Y(jié)構(gòu),具備超稀疏激活參數(shù),激活參數(shù)比低于 3%,在保持模型強(qiáng)大能力的同時(shí),有效提升推理效率。
同時(shí),基于大規(guī)模工具環(huán)境,合成長(zhǎng)程任務(wù)軌跡數(shù)據(jù),并采用基于思維鏈和行動(dòng)鏈的端到端多輪強(qiáng)化學(xué)習(xí)訓(xùn)練,顯著提升了模型的智能體和工具調(diào)用能力。
得益于原生全模態(tài)建模,文心5.0在多模理解、代碼、創(chuàng)意寫作等能力上實(shí)現(xiàn)顯著突破。
跑得穩(wěn)、答得對(duì)、用得起 文心應(yīng)用模型深入千行百業(yè)
百度應(yīng)用模型研發(fā)部負(fù)責(zé)人賈磊分享了文心應(yīng)用模型的最新進(jìn)展。他指出,應(yīng)用模型的價(jià)值不在模型里,而在應(yīng)用里,希望讓模型在真實(shí)應(yīng)用場(chǎng)景里“跑得穩(wěn)、答得對(duì)、用得起”。
基于文心基礎(chǔ)大模型,百度構(gòu)建了矩陣模型和專精模型。矩陣模型面向產(chǎn)品級(jí)應(yīng)用和通用場(chǎng)景快速落地,包括文心Lite模型、視頻大模型和語(yǔ)音大模型;專精模型面向行業(yè)應(yīng)用和垂直場(chǎng)景,包括搜索閃電專精模型、電商蒸汽機(jī)模型、文心數(shù)字人大模型及行業(yè)大模型。

賈磊現(xiàn)場(chǎng)分享了三項(xiàng)技術(shù)突破:基于聲音 Token 的端到端合成大模型、5分鐘超越真人的直播技術(shù)、實(shí)時(shí)交互數(shù)字人技術(shù)。
其中,實(shí)時(shí)交互數(shù)字人技術(shù)采用三態(tài)Token聯(lián)動(dòng)架構(gòu),實(shí)現(xiàn)文本、語(yǔ)音、視頻的流式控制,突破傳統(tǒng)數(shù)字人三個(gè)模態(tài)串聯(lián)的制作模式。在此基礎(chǔ)上,系統(tǒng)自動(dòng)完成動(dòng)作銜接、動(dòng)作編排與狀態(tài)重組,并由聲音Token實(shí)時(shí)驅(qū)動(dòng)表情與口型,輸出三態(tài)合一的視頻流,具有低延遲、低成本和高表現(xiàn)力的特點(diǎn),百度羅永浩數(shù)字人即是基于這項(xiàng)技術(shù)開發(fā)。
文心5.0正式版上線百度千帆平臺(tái)
會(huì)上,百度千帆平臺(tái)產(chǎn)品負(fù)責(zé)人張婷介紹,百度千帆平臺(tái)已支持企業(yè)用戶和開發(fā)者便捷調(diào)用文心5.0正式版。

百度千帆Agent Infra提供了模型、工具、Agent開發(fā)、數(shù)據(jù)及Agent運(yùn)行環(huán)境等五個(gè)層面的能力,幫助企業(yè)和開發(fā)者低門檻打造好用的Agent。
模型層面|百度千帆提供包括文心5.0正式版在內(nèi)的全場(chǎng)景150+SOTA模型服務(wù)。同時(shí)針對(duì)Agent場(chǎng)景,提供精準(zhǔn)的思維鏈控制等大模型增強(qiáng)服務(wù)。
工具服務(wù)|百度千帆將百度沉淀多年的成熟AI能力,如百度AI搜索、百度地圖、百度文庫(kù)、百度網(wǎng)盤等通過MCP協(xié)議開放,并引入覆蓋出行、支付等企業(yè)級(jí)高頻需求的優(yōu)質(zhì)第三方MCP能力。
Agent開發(fā)服務(wù)|千帆凝聚百度工程師實(shí)際項(xiàng)目經(jīng)驗(yàn),開放企業(yè)級(jí)深度研究Agent(Deep Research)等多款官方應(yīng)用。
數(shù)據(jù)服務(wù)|通過百度千帆數(shù)據(jù)智能平臺(tái),企業(yè)可將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為模型可理解的信息。通過多模態(tài)數(shù)據(jù)統(tǒng)一管理及算力混合調(diào)度,數(shù)據(jù)處理提效達(dá)6倍,計(jì)算降本30%。
Agent運(yùn)行環(huán)境|此外,千帆提供了完善的資源部署、權(quán)限管理及高可用監(jiān)控工具鏈,確保智能體在業(yè)務(wù)場(chǎng)景中穩(wěn)定運(yùn)行。

目前,千帆平臺(tái)上已累計(jì)開發(fā)超130萬(wàn)個(gè)Agents。