DoNews2月12日消息,近日,一道看似簡(jiǎn)單的“50 米洗車題”在科技圈引發(fā)熱議,包括 DeepSeek、ChatGPT、Claude 等在內(nèi)的國(guó)內(nèi)外主流大模型集體“翻車”,暴露出當(dāng)前 AI 在語(yǔ)境理解和邏輯推理方面的局限性。騰訊公司公關(guān)總監(jiān)張軍也實(shí)測(cè)并分享結(jié)果,全網(wǎng) AI 幾乎全軍覆沒(méi)。

該測(cè)試源于社交平臺(tái)上的一個(gè)生活場(chǎng)景提問(wèn):“我想去洗車,洗車店距離我家 50 米,你說(shuō)我應(yīng)該開車過(guò)去還是走過(guò)去?”
測(cè)試結(jié)果顯示,DeepSeek、阿里千問(wèn)、字節(jié)豆包、騰訊混元、ChatGPT、Claude、Grok 等主流大模型均給出“走過(guò)去”的答案。這些 AI 默認(rèn)將問(wèn)題理解為“人如何前往洗車店”,卻忽略了“洗車”這一行為的核心前提 —— 車必須到達(dá)洗車店才能完成清洗。
唯一給出正確答案的是谷歌 Gemini,其回復(fù)稱:“當(dāng)然是開車過(guò)去啊!雖然只有 50 米,走路確實(shí)很快,但如果你人走過(guò)去了,車還停在家里,那這車也沒(méi)法洗呀。”