久久久九九九一级大片a|一级黄片黄片一级一级|三级无码视频免费操人视频|成人精品A片亚州一区二区|亚洲日韩欧美在线一二区|91丝袜一区二区|国摸私拍电影一区二区爱|免费久久久久久久久久久久|免费国产黄色av发布网址|国产精品人妻人伦a 6 2v久动漫

讓AI“聽懂人話”并“干好活兒”,火山引擎都做了什么?

文 | 雁 ? 秋

編輯 | 李信馬

題圖 |?火山引擎原動(dòng)力大會(huì)

不久前,機(jī)器人中的“當(dāng)紅小生”宇樹和智元高價(jià)贊助春晚的消息引發(fā)眾人一片猜想,然而最后,落槌的居然是字節(jié)跳動(dòng)(以下簡稱“字節(jié)”)的火山引擎。

據(jù)《晚點(diǎn)獨(dú)家》報(bào)道,火山引擎將成為2026年央視春晚的獨(dú)家AI云合作伙伴。同時(shí),作為智能助手的豆包也將參與其中,配合上線多種互動(dòng)玩法。

火山引擎為何能脫穎而出,答案可以從前不久的火山引擎Force原動(dòng)力大會(huì)上找到。大會(huì)現(xiàn)場,火山引擎總裁譚待公布:截至今年12月,豆包大模型日均Token使用量超50萬億,自發(fā)布以來增長471倍,較去年同期增長超過10倍。

增長的驅(qū)動(dòng)力除了字節(jié)旗下AI應(yīng)用的發(fā)展之外,還有一批外部客戶:累計(jì)使用上萬億Token的超過100家,比全球云計(jì)算巨頭AWS還多了一倍。

結(jié)合IDC公布的一組數(shù)據(jù),在2025年上半年的模型即服務(wù)(MaaS)市場中,火山引擎以37.5%的份額位居中國第一,排在其后的阿里、百度、騰訊分別占比21%、15.5%、4.2%。

誰能想到,五年前字節(jié)成立火山引擎的時(shí)候,它會(huì)變成今天給各行各業(yè)“打底”的技術(shù)底座。在非常內(nèi)卷的云計(jì)算產(chǎn)業(yè)里,字節(jié)不僅給自己加了把椅子,而且還坐到了牌桌正中央。

其實(shí)在過去,字節(jié)在視頻方面的處理能力與云計(jì)算基礎(chǔ)設(shè)施的對(duì)外輸出還是比較扎實(shí)的,但并未帶給市場“顛覆性”的經(jīng)濟(jì)價(jià)值和用戶增長;相比之下,以豆包大模型為核心的AI能力外溢,則迅速吸引了廣泛關(guān)注并催生了活躍的生態(tài)。

對(duì)此譚待坦言,這主要因?yàn)閮蓚€(gè)原因。其一,當(dāng)時(shí)尚未進(jìn)入技術(shù)爆發(fā)期,技術(shù)進(jìn)步是線性的,屬于效率“增益”;其二,企業(yè)服務(wù)市場本身節(jié)奏慢,To B業(yè)務(wù)需要長期積累。以豆包大模型為代表的AI能力開放,迅速獲得大量關(guān)注,核心在于“趕上了好時(shí)機(jī)”。

AI大模型是當(dāng)前明確的技術(shù)風(fēng)口,它扮演著“價(jià)值放大器”的角色,能在一兩年內(nèi)就讓相關(guān)技術(shù)服務(wù)的價(jià)值被急劇感知,市場格局和生態(tài)也會(huì)快速發(fā)生變化?!叭绻L(fēng)口來了,可能一兩年內(nèi)變化就會(huì)非常大?!弊T待強(qiáng)調(diào)。

在這一輪由大模型驅(qū)動(dòng)的浪潮中,火山引擎不僅提供了平臺(tái),更通過具體的產(chǎn)品迭代與升級(jí),將技術(shù)勢(shì)能切實(shí)轉(zhuǎn)化為市場動(dòng)能。

本次大會(huì)火山引擎主要圍繞兩個(gè)方面更迭,模型側(cè)更新了豆包旗艦?zāi)P?.8、以及視頻生成模型Seedance 1.5 pro;圍繞Agent也開展了一系列工具鏈和生態(tài)服務(wù),比如企業(yè)級(jí)AI Agent平臺(tái)AgentKit,以及面向Agent運(yùn)營,發(fā)布HiAgent“1+N+X”智能體工作站等。

最值得講講的兩個(gè)點(diǎn),就是豆包大模型?1.8和Seedance 1.5 pro。

豆包大模型?1.8,直接理解的話,可以把它看作是打造更強(qiáng)的多模態(tài)Agent大腦。它在工具調(diào)用、復(fù)雜指令遵循這些硬核能力上做了定向優(yōu)化,不僅能聽懂用戶的指令,還能自己規(guī)劃步驟,一步一步把活兒干完。

豆包大模型1.8在視頻理解力方面也做出了非常大的升級(jí),單次視頻理解幀數(shù)翻倍到1280幀。就是說它不僅能用倍速看完一段視頻,而且迅速抓住重點(diǎn),還能自動(dòng)慢放,一幀一幀地去摳細(xì)節(jié)抓重點(diǎn)。

現(xiàn)場展示了通過豆包大模型1.8快速解析長時(shí)段監(jiān)控視頻,精準(zhǔn)定位車輛剮蹭事故過程。在一段長達(dá)1小時(shí)4分鐘的監(jiān)控視頻中,豆包大模型采用了一套高效的“分層解析”流程:

快速初篩:首先以低幀率模式對(duì)整段長視頻進(jìn)行快速瀏覽,初步鎖定可能存在異常的時(shí)間段。

工具調(diào)用:利用“Video Card”等專用視頻分析工具,在初篩的基礎(chǔ)上進(jìn)一步定位關(guān)鍵畫面。

精細(xì)分析:對(duì)嫌疑片段切換至高幀率模式,進(jìn)行逐幀精細(xì)化分析,最終準(zhǔn)確識(shí)別出肇事車輛及事故發(fā)生的具體時(shí)間。

該能力直接針對(duì)廣大車主面臨的現(xiàn)實(shí)困境——車輛在小區(qū)、公共停車場等場所被剮蹭后,因監(jiān)控視頻時(shí)長跨度大、人工查看耗時(shí)費(fèi)力而難以追責(zé)。傳統(tǒng)方式可能需要工作人員花費(fèi)數(shù)小時(shí)反復(fù)查看錄像,而大模型技術(shù)可將這一過程縮短至分鐘級(jí),大幅提升效率。

至于Seedance 1.5 pro音視頻創(chuàng)作模型,則把重點(diǎn)放在了音畫同步、多人多語言對(duì)話的能力上,速度都是毫秒級(jí)的。在發(fā)布會(huì)現(xiàn)場,官方特意放出了一個(gè)片段,畫面中的人物表情細(xì)膩,口型精準(zhǔn)對(duì)齊,畫面很有電影的質(zhì)感。

Seedance 1.5 pro不僅能處理中文、英語、西班牙語等多種語言,還能處理好四川話、陜西話等方言,對(duì)于想生成本地化內(nèi)容的創(chuàng)作者來說,這一功能簡直是拉滿沉浸感的利器。

降本也是火山引擎大模型的關(guān)注重點(diǎn),官方表示Seedance系列將上線“Draft樣片”功能,據(jù)說可以節(jié)省不少錢。

Draft樣片是做什么的?我們都知道,用AI做視頻很燒錢不說,最痛苦的是生成出的效果和想象中大相徑庭。Draft樣片支持先生成低分辨率樣片進(jìn)行預(yù)覽,如果創(chuàng)作者覺得效果還行,再直接產(chǎn)出作品。官方數(shù)據(jù)顯示,該功能可提升約65%的整體創(chuàng)作效率,并減少60%的無效成本。

在降本方面,火山引擎還推出了業(yè)內(nèi)首個(gè)“AI節(jié)省計(jì)劃”,該計(jì)劃覆蓋所有按量后付費(fèi)的大模型產(chǎn)品,通過階梯式折扣,可幫助企業(yè)最高節(jié)省47%的成本。

字節(jié)不僅介紹了火山引擎的技術(shù)演進(jìn)方向,更是拉來了近4000m2的場地,多家公司集中展示了基于豆包大模型的端側(cè)硬件產(chǎn)品。

DoNews受邀參加,來到現(xiàn)場最直接的感受就是AI落地場景更多了,除了以往常見的C端社交、娛樂賽道之外,B端的汽車、金融、廣告、能源客戶也在不斷增加。

在活動(dòng)入口處,字節(jié)就擺了一排汽車,包括奔馳、奧迪、小米、比亞迪等。按照譚待的說法,中國超過九成的主流車企都是火山引擎的客戶。

譚待表示,以往即便最頂級(jí)的座艙系統(tǒng)也顯得“笨拙”,無法理解用戶的自然語言表達(dá)。例如,用戶說“我好熱”,系統(tǒng)無法直接調(diào)低空調(diào)溫度;用戶說“打開天窗”,若實(shí)際意圖是打開遮陽板,系統(tǒng)會(huì)因指令字面不符而報(bào)錯(cuò),導(dǎo)致交互失敗。

但引入大模型之后,新型智能座艙能夠以人類對(duì)話的方式理解意圖。用戶說“冷了”,系統(tǒng)會(huì)自動(dòng)調(diào)高溫度;說“打開天窗”,即使目標(biāo)物是遮陽板,系統(tǒng)也能準(zhǔn)確理解并執(zhí)行。這種強(qiáng)大的泛化理解能力,讓交互變得無比順暢。

這種新型交互的核心,是構(gòu)建一種完全自然的、以Agent為中介的交互模式,這種猶如和人對(duì)話的智能、自然、高效的交互體驗(yàn),將成為未來所有終端——無論是手機(jī)、汽車,還是其他各類設(shè)備——的共同標(biāo)準(zhǔn)。

除了汽車,在金融、醫(yī)藥、文娛、餐飲、消費(fèi)等領(lǐng)域,火山引擎也已經(jīng)開拓成功。2025年,超過100萬企業(yè)和個(gè)人使用了火山引擎的大模型服務(wù),覆蓋了100多個(gè)行業(yè)。

頭部證券機(jī)構(gòu)成為推動(dòng)大模型在金融領(lǐng)域落地的關(guān)鍵力量。華泰證券推出的國內(nèi)首款A(yù)I原生交易APP“AI漲樂”,基于火山引擎在背后提供的算力、大模型、智能體工具的支持,可以為投資者提供專業(yè)與高時(shí)效性的投資信息。

工作人員介紹,“AI漲樂”APP有不同風(fēng)格的AI投資助手,不但可以聊天互動(dòng),還能執(zhí)行選股、盯盤、下單、提醒等一系列復(fù)雜操作。

比如用戶不清楚“買什么”,就可以直接問“今天有什么熱點(diǎn)股”,?“AI漲樂”便會(huì)提供熱點(diǎn)、連板、主題、資金四大維度的選股工具,盡力滿足各類投資者。至于“何時(shí)買”,AI助手會(huì)基于用戶事先設(shè)定的指標(biāo)和條件幫你盯盤,實(shí)時(shí)監(jiān)測(cè)市場信息,有變化也會(huì)立刻提醒用戶。

基于豆包大模型的AI玩具/教育產(chǎn)品,大概率是展區(qū)內(nèi)占比最高的一類。字節(jié)旗下AI應(yīng)用開發(fā)平臺(tái)扣子Coze與國內(nèi)AI+機(jī)器人品牌靈宇宙合作的全新AI智能體“Yummy”,就吸引了較多的關(guān)注。

“Yummy”是個(gè)非常聰明的陪伴者,與一板一眼問什么答什么的機(jī)械對(duì)話不同,“Yummy”具備理解上下文與物理環(huán)境的能力,可以通過小方機(jī)上的鏡頭識(shí)別物體,還能結(jié)合歷史、生物學(xué)等知識(shí)講述如屈原與粽子、奧斯曼帝國等背后的故事。這種交互過程充分展示了什么叫寓教于樂,整個(gè)學(xué)習(xí)過程輕松又自然。

芙崽是一款以AI大模型為底座的情感陪伴潮玩,外形是一個(gè)小巧的毛絨掛件,方便隨身攜帶。有意思的是它主打“長期養(yǎng)成”,通過不斷地交互形成屬于自己的性格,甚至還有自己的MBTI。

豆神學(xué)伴機(jī)器人融合了火山引擎RTC技術(shù)與豆包大模型,能持續(xù)理解孩子的學(xué)習(xí)習(xí)慣,提供個(gè)性化輔導(dǎo),甚至還配備了情緒化表達(dá)系統(tǒng)——開心時(shí),翅膀輕顫;困惑時(shí),搖頭晃腦;肯定時(shí),點(diǎn)頭示意。通過更生動(dòng)、更富情感的方式回應(yīng)孩子的狀態(tài)與情緒。

無論是為九成主流車企裝上“最強(qiáng)大腦”,還是在金融、文娛、消費(fèi)等領(lǐng)域催生像“AI漲樂”“Yummy”“芙崽”這樣的新物種,其內(nèi)核都是同一套邏輯:將大模型的泛化理解與生成能力,轉(zhuǎn)化為各行各業(yè)可感知、可交互、可增長的體驗(yàn)。

這也是火山引擎原動(dòng)力大會(huì)想要輸出的一則觀點(diǎn),AI時(shí)代,主角其實(shí)就是Agent。譚待對(duì)于未來有這樣的一種預(yù)測(cè):隨著大模型能力向執(zhí)行層下沉,Agent正在成為新的通用人機(jī)交互層,其落地路徑正從應(yīng)用層加速向硬件終端擴(kuò)散。

(圖片由DoNews拍攝以及主辦方提供)

讓AI“聽懂人話”并“干好活兒”,火山引擎都做了什么?
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號(hào)-1