DoNews1月20日消息,今日,階躍星辰宣布多模態(tài)模型 Step3-VL-10B 開(kāi)源。據(jù)介紹,僅用 10B 參數(shù)量,Step3-VL-10B 在視覺(jué)感知、邏輯推理、數(shù)學(xué)競(jìng)賽以及通用對(duì)話等一系列基準(zhǔn)測(cè)試中均達(dá)到同規(guī)模 SOTA 水平。

僅用 10B 參數(shù)量,Step3-VL-10B 在視覺(jué)感知、邏輯推理、數(shù)學(xué)競(jìng)賽以及通用對(duì)話等一系列基準(zhǔn)測(cè)試中均達(dá)到同規(guī)模 SOTA 水平,并且解決了參數(shù)量小和智能水平高難以兼優(yōu)的行業(yè)難題。
在多項(xiàng)關(guān)鍵評(píng)測(cè)中觀察到,Step3-VL-10B 媲美甚至超越規(guī)模大 10-20 倍開(kāi)源模型(如 GLM-4.6V 106B-A12B、Qwen3-VL-Thinking 235B-A22B)以及頂級(jí)閉源旗艦?zāi)P停ㄈ?Gemini 2.5 Pro、Seed-1.5-VL)。
基于這樣一個(gè)小而強(qiáng)底座,原本只能在云端運(yùn)行的復(fù)雜多模態(tài)推理(如 GUI 操作、復(fù)雜文檔解析、高精度計(jì)數(shù))能夠下沉到手機(jī)、電腦甚至工業(yè)嵌入式設(shè)備中。Base 和 Thinking 模型同時(shí)開(kāi)源。