国产一区二区三区无码视频,一级免费成人黄山

DoNews > 商業(yè) > 現(xiàn)在的年輕人，已經(jīng)在用AI原生數(shù)據(jù)庫競賽了？

現(xiàn)在的年輕人，已經(jīng)在用AI原生數(shù)據(jù)庫競賽了？

原創(chuàng) 2026-01-22 17:50:31

430400

分享到

撰文 | 李信馬

題圖 | AI生圖

在去年11月的一篇文章《三次浪潮：從OceanBase看國產(chǎn)數(shù)據(jù)庫的崛起》中，我們曾提到一個“新物種”——seekdb，一款輕量級、嵌入式、面向AI應(yīng)用的原生搜索數(shù)據(jù)庫。

這款產(chǎn)品是隨著AI的快速發(fā)展應(yīng)運而生的，當(dāng)時OceanBase CEO楊冰表示：“這一次seekdb的發(fā)布，其實也是一個比較大的動作，它是完全獨立于現(xiàn)在OceanBase的一個分支，這也是我們下的決心?！?/p>

時隔不久后，seekdb的名字又出現(xiàn)在了一場高規(guī)格的競賽之中。1月18日，2025年全國大學(xué)生計算機系統(tǒng)能力大賽暨第五屆OceanBase數(shù)據(jù)庫大賽在北京科技大學(xué)落幕，OceanBase數(shù)據(jù)庫大賽是教育部認定的A類學(xué)科競賽，五年來賽事累計覆蓋500余所高校、超1.1萬名學(xué)生，本屆賽事吸引了全國1223支隊伍、2620名學(xué)生參賽，是我國數(shù)據(jù)庫領(lǐng)域核心人才培養(yǎng)的重要平臺。

而且本屆大賽全面升級，首次聚焦在了AI原生場景上，決賽基于seekdb設(shè)置兩大前沿賽題，一是優(yōu)化“全文檢索+結(jié)構(gòu)化過濾”的混合查詢性能；二是基于同一數(shù)據(jù)庫內(nèi)核，構(gòu)建可溯源的多模態(tài)RAG系統(tǒng)。選手要用自己優(yōu)化的數(shù)據(jù)庫內(nèi)核，搭建一個既快又準(zhǔn)、還能溯源答案來源的多模態(tài)RAG系統(tǒng)。

這兩道賽題，可以說都是針對AI產(chǎn)業(yè)中真實瓶頸的工程攻堅，而更有趣的是，賽事方對AI原生數(shù)據(jù)庫這一新生事物的力推，和參賽團隊的積極響應(yīng)。

談起AI時代，我們一般討論的是大模型、是芯片、是Agent，以至于經(jīng)常會忽視基礎(chǔ)軟件的價值。但數(shù)據(jù)庫，可能比我們想象的更重要。

01、AI越熱，數(shù)據(jù)庫越關(guān)鍵？

很多人覺得，數(shù)據(jù)庫就是個存放數(shù)據(jù)的“倉庫”，但現(xiàn)實是，再聰明的模型，如果缺乏高質(zhì)量、高效率、可治理的數(shù)據(jù)支撐，實際表現(xiàn)也會一塌糊涂。大模型的計算能力強，但沒有記憶，需要數(shù)據(jù)庫產(chǎn)品來存儲和管理上下文，可見AI帶來的技術(shù)革命絕不是孤立的，而是一場系統(tǒng)性重構(gòu)。

在這場重構(gòu)中，數(shù)據(jù)庫依舊位于底座的重要位置，同時也被提出了新的需求。就像大數(shù)據(jù)時代Hadoop引發(fā)的技術(shù)革命一樣，AI時代，數(shù)據(jù)庫需要處理的數(shù)據(jù)量會進一步變大，數(shù)據(jù)類型也發(fā)生明顯變化。

隨著大模型與RAG（檢索增強生成）技術(shù)加速落地，數(shù)據(jù)系統(tǒng)既要支持語義檢索與結(jié)構(gòu)化過濾等混合查詢，也要滿足權(quán)限控制、可追溯與一致性等治理要求，傳統(tǒng)的“搜索引擎+數(shù)據(jù)庫”拼接架構(gòu)逐漸過時。

舉個例子，“查找過去7天內(nèi)，來自?VIP?用戶、內(nèi)容包含‘支付失敗’的工單”，這一類同時處理語義關(guān)鍵詞（全文）與結(jié)構(gòu)化條件（標(biāo)量過濾）的“帶標(biāo)量過濾的全文搜索”已經(jīng)成為高頻的AI應(yīng)用需求，但傳統(tǒng)架構(gòu)，用?Elasticsearch?等外部搜索引擎再與數(shù)據(jù)庫結(jié)果在應(yīng)用層拼接，不但架構(gòu)復(fù)雜，還可能導(dǎo)致數(shù)據(jù)不一致、端到端延遲高。

還有在構(gòu)建企業(yè)級智能問答、知識庫助手和語義搜索系統(tǒng)時，傳統(tǒng)方案將向量檢索與全文檢索割裂處理，可能會帶來架構(gòu)冗余與一致性風(fēng)險，導(dǎo)致搜索的內(nèi)容缺失或者不準(zhǔn)確，運維也復(fù)雜。

近幾年，業(yè)界新的數(shù)據(jù)庫產(chǎn)品，比如向量數(shù)據(jù)庫、supabase，也包括seekdb在內(nèi)，其實都是面向AI的。業(yè)界主流的數(shù)據(jù)庫如Oracle和MongoDB，在引擎內(nèi)部也逐步增加了搜索的能力，支持AI原生的場景。

不過，目前行業(yè)還處于初級階段。OceanBase的CTO楊傳輝去年11月就提出：“只要談到AI數(shù)據(jù)庫，很多人的腦海里面想到的第一個詞叫向量搜索，我認為向量搜索只是AI數(shù)據(jù)庫的初級階段，最終所有的向量搜索都會逐步演進為混合搜索，能不能支持混合搜索是AI數(shù)據(jù)庫核心能力的分水嶺。”

實際的AI應(yīng)用中，在金融、醫(yī)療等領(lǐng)域，數(shù)據(jù)的來源和處理過程必須清晰可查。這也倒逼了數(shù)據(jù)庫的演進，混合檢索成為高頻負載，“可追溯”成為硬指標(biāo)，推動數(shù)據(jù)庫與搜索、向量、RAG鏈路重新組合。

未來，原生支持混合查詢與多模態(tài)檢索的AI原生數(shù)據(jù)庫，很可能將迎來新一輪爆發(fā)式需求。本屆競賽的全面升級，和對AI原生場景的聚焦，也是對這一趨勢的順應(yīng)。

02、AI時代中國數(shù)據(jù)庫的機遇

這個問題，其實在上一篇文章中也有提到。

由于數(shù)據(jù)庫技術(shù)正面臨重構(gòu)，為中國數(shù)據(jù)庫實現(xiàn)技術(shù)引領(lǐng)和全球“彎道超車”提供了關(guān)鍵機遇。在AI原生數(shù)據(jù)庫領(lǐng)域，中國與國際處于同一起跑線，甚至在部分開源生態(tài)方面已領(lǐng)先。

引用一下楊冰的講話：“AI的話，它對于數(shù)據(jù)庫產(chǎn)生了新的需求，這些其實是讓我們一下子跟世界級的數(shù)據(jù)庫領(lǐng)域的玩家站在同一起跑線，因為這個場景全球都是新的，都是一樣的。而且可能因為中國應(yīng)用比較發(fā)達，數(shù)據(jù)基建發(fā)展得比較快，數(shù)據(jù)量比較大，反而我們在這個場景當(dāng)中，中國數(shù)據(jù)庫的玩家有更多的機會?！?/p>

這個邏輯是可以跑通的，因為數(shù)據(jù)庫是為應(yīng)用服務(wù)的，在AI時代，中國有著海量的應(yīng)用，自然有潛力誕生世界級的AI原生數(shù)據(jù)庫。

額外說一點，事情還是要人去做的，現(xiàn)在的“AI熱”，讓許多有志青年投身于人工智能領(lǐng)域，不過正如上文提到的，數(shù)據(jù)庫領(lǐng)域也在高速發(fā)展中，同樣將產(chǎn)生不小的人才缺口。曾經(jīng)的“IOE”中現(xiàn)在最堅挺的，還是Oracle，依舊是世界級的數(shù)據(jù)庫，足以證明數(shù)據(jù)庫本身的價值。

AI時代，“會用工具”很重要，“能做系統(tǒng)”也很重要，就像大賽的冠軍團隊「編程高手」賽后所說：“如果數(shù)據(jù)庫拖后腿，再強的模型也會卡殼?！?/p>

最后，引用一下華東師范大學(xué)數(shù)據(jù)學(xué)院教授，CCF會士、常務(wù)理事，數(shù)據(jù)庫專委會主任周傲英教授的一段演講內(nèi)容作為對未來的預(yù)測（有部分微調(diào)）：

“去年的7月份，Satya Nadella說‘未來的軟件就等于Agent+Database’，當(dāng)然他講的Database不是傳統(tǒng)的Database。我們知道中國很多IT企業(yè)還在沿著這條路（傳統(tǒng)的Database），還當(dāng)作先進的路線?，F(xiàn)在年輕孩子們有特別好的機會，因為我們到了一個轉(zhuǎn)折點，我們找到了新的思路來做這個事。

我們說說他的話，他說：‘AI Agent將重塑業(yè)務(wù)邏輯與數(shù)據(jù)庫交互方式。隨著AI技術(shù)的飛速發(fā)展，Agent已經(jīng)具備了取代傳統(tǒng)業(yè)務(wù)邏輯的雄厚實力。它們能夠直接與數(shù)據(jù)庫中的核心基礎(chǔ)數(shù)據(jù)進行深度交互，從而完成各種復(fù)雜的任務(wù)。在這個過程當(dāng)中，以往需要在數(shù)據(jù)庫之上進行的硬編碼業(yè)務(wù)邏輯會變得不再必要?！?/em>

想一想，這是很可怕的一件事，讓數(shù)字化轉(zhuǎn)型變成可能，數(shù)據(jù)庫的選擇變得多元化，要特別講究它的適應(yīng)性。AI Agent時代，后端數(shù)據(jù)庫的選擇變得尤為重要，這種數(shù)據(jù)庫并非傳統(tǒng)意義上某一種特定的數(shù)據(jù)庫，比如Oracle這樣的數(shù)據(jù)庫。Oracle為什么要發(fā)生根本的改變，其實我覺得它是看到了這種趨勢，它必須具備廣泛的兼容性，并且與AI Agent配合默契，成本低廉，這是Satya Nadella的原話。

數(shù)據(jù)庫現(xiàn)在處于一個‘因為相信，所以看見’的時代，我們要相信相信的力量，相信Data就是Power，我們要相信數(shù)據(jù)庫將進化成一個數(shù)據(jù)賦能平臺?！?/em>

標(biāo)簽: AI 數(shù)據(jù)庫

現(xiàn)在的年輕人，已經(jīng)在用AI原生數(shù)據(jù)庫競賽了？

掃描二維碼查看原文

分享自DoNews

關(guān)于我們| 電子協(xié)議| 合作聯(lián)系| 蜀ICP備2024059877號-1

網(wǎng)站信息

Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號-1
聯(lián)系地址：北京市海淀區(qū)寶盛東路興華綠色產(chǎn)業(yè)樓3層307室（東升地區(qū)）
郵箱：jubao@infinities.com.cn
網(wǎng)上有害信息舉報專區(qū): www.12377.cn

Copyright ? DoNews 2000-2026 All Rights Reserved
蜀ICP備2024059877號-1

京公網(wǎng)安備11010802023059號