久久久九九九一级大片a|一级黄片黄片一级一级|三级无码视频免费操人视频|成人精品A片亚州一区二区|亚洲日韩欧美在线一二区|91丝袜一区二区|国摸私拍电影一区二区爱|免费久久久久久久久久久久|免费国产黄色av发布网址|国产精品人妻人伦a 6 2v久动漫

BBC 評(píng)估 AI 工具新聞總結(jié)水平,谷歌 Gemini 錯(cuò)誤比例最高

DoNews10月24日消息,據(jù)外媒 Android Authority 報(bào)道,歐洲廣播聯(lián)盟(EBU)與 BBC 近日聯(lián)合評(píng)估了 ChatGPT、Gemini 及 Perplexity 等多款 AI 系統(tǒng)在新聞?wù)矫娴谋憩F(xiàn)。研究動(dòng)因在于,現(xiàn)有約 15% 的 25 歲以下年輕人主要通過(guò) AI 獲取新聞。

BBC 最初通過(guò)大規(guī)模問(wèn)卷調(diào)查及六場(chǎng)焦點(diǎn)小組訪談收集公眾對(duì) AI 新聞工具的使用體驗(yàn)與看法,隨后 EBU 將這項(xiàng)研究擴(kuò)展至國(guó)際范圍。

研究顯示,約 42% 的英國(guó)成年人表示信任 AI 內(nèi)容的準(zhǔn)確性,年輕群體的信任度更高。不過(guò),84% 的受訪者認(rèn)為,一旦出現(xiàn)事實(shí)性錯(cuò)誤,將嚴(yán)重削弱自己對(duì) AI 的信任。問(wèn)題在于,這些系統(tǒng)的“不準(zhǔn)確度”究竟為何,以及用戶是否真的察覺(jué)到了這些錯(cuò)誤。

結(jié)果顯示,大多數(shù) AI 生成的內(nèi)容都存在問(wèn)題。各模型整體表現(xiàn)差距不大,但 Gemini 成為明顯“異類”,不僅錯(cuò)誤數(shù)量最多,嚴(yán)重錯(cuò)誤的比例也遠(yuǎn)高于其他系統(tǒng)。

研究指出,Gemini 的問(wèn)題主要包括:缺乏清晰的資料來(lái)源鏈接、未能區(qū)分可靠信息與諷刺內(nèi)容、過(guò)度依賴維基百科、缺乏足夠語(yǔ)境,以及錯(cuò)誤引用原文。

在六個(gè)月的研究周期中,各大 AI 系統(tǒng)的表現(xiàn)都有改進(jìn),新聞?wù)臏?zhǔn)確率普遍提升,Gemini 的進(jìn)步尤為明顯。但即使如此,Gemini 的表現(xiàn)仍明顯落后于其他系統(tǒng)。

標(biāo)簽: Gemini BBC AI新聞 ChatGPT
BBC 評(píng)估 AI 工具新聞總結(jié)水平,谷歌 Gemini 錯(cuò)誤比例最高
掃描二維碼查看原文
分享自DoNews
Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號(hào)-1