DoNews1月20日消息,近期,MiniMax 在港交所成功上市,其與聲網(wǎng)也進一步深化了戰(zhàn)略合作關系。MiniMax 將領先的文本轉(zhuǎn)語音(TTS)技術及多模態(tài)大模型,與聲網(wǎng)對話式 AI 引擎以及全球超低延時實時傳輸網(wǎng)絡(SD-RTN)相結合。這一強強聯(lián)手將助力全球開發(fā)者與企業(yè),部署更具生命力、響應更靈敏、體驗更擬人化的對話式 AI 產(chǎn)品。

早在2024年10月,聲網(wǎng)就宣布與 MiniMax 聯(lián)手發(fā)布國內(nèi)首個 Realtime API,助力 AI 告別“機械感”,實現(xiàn)更低延時的自然交流。
從模型能力走向真實世界的交互
隨著生成式 AI 的飛速發(fā)展,行業(yè)真正的挑戰(zhàn)在于如何將高質(zhì)量的 AI 轉(zhuǎn)化為跨設備、跨復雜網(wǎng)絡環(huán)境的自然實時交互體驗。

MiniMax 的 TTS 模型具備表達豐富、可控且情感細膩的語音生成能力,支持多種語言、語調(diào)和說話風格。而聲網(wǎng)則提供了互補的核心優(yōu)勢:將 AI 輸出轉(zhuǎn)化為實時交互體驗,這使得 AI 的表現(xiàn)更貼近人類的溝通模式。
此次合作的獨特之處不僅在于技術層面的集成,更在于雙方全球化的視野:
MiniMax 帶來具備全球視野的前沿 AI 模型:其模型在設計之初就針對多語言、多文化及內(nèi)容豐富的應用場景進行了優(yōu)化。
聲網(wǎng)提供經(jīng)受過實戰(zhàn)檢驗的全球?qū)崟r網(wǎng)絡:其自建的 SD-RTN? ?網(wǎng)絡覆蓋 200 多個國家和地區(qū),旨在提供毫秒級的超低延時、優(yōu)秀的抖動控制以及大規(guī)模并發(fā)下的音視頻質(zhì)量保證。
雙方共同填補了 AI 生態(tài)系統(tǒng)中的關鍵空白:即無論用戶身處何地、使用何種設備,都能獲得穩(wěn)定、自然且富有表現(xiàn)力的 AI 語音交互體驗 。
賦能下一代實時語音 AI 產(chǎn)品
聲網(wǎng)與 MiniMax 的聯(lián)合解決方案已在多個場景中落地,包括:
· AI 陪伴與智能設備:需要實時語音反饋的交互場景
· 實時語音 Agents:用于客服和企業(yè)工作流的自動化交互?
· 互動教育與內(nèi)容平臺:對自然語音質(zhì)量和全球覆蓋能力有極高要求的應用?
· 多模態(tài) AI 應用:語音需與視覺、情感及動作保持高度同步的復雜場景?
聲網(wǎng)與 MiniMax 為開發(fā)者提供了一個從文本生成到實時語音交付的完整、端到端對話式 AI 基礎底座。隨著 AI 從云端走向日常交互的每一個瞬間,雙方將持續(xù)為開發(fā)者和企業(yè)提供強有力的支持。
未來,雙方計劃在實時語音智能體、AI 原生設備以及多模態(tài)對話體驗等領域進一步擴大合作。