在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

押注向量數據庫,為時過早?

科技云報到 ? 來源:jf_60444065 ? 作者:jf_60444065 ? 2023-10-07 14:15 ? 次閱讀

科技云報道原創。

在大模型的高調火熱之下,向量數據庫也獲得了前所未有的關注。

近兩個月內,向量數據庫迎來融資潮,Qdrant、Chroma、Weaviate先后獲得融資,Pinecone宣布1億美元B輪融資,估值達到7.5億美元。

東北證券預測,到2030年,全球向量數據庫市場規模有望達到500億美元,國內向量數據庫市場規模有望超600億人民幣。

但是在這蒸蒸日上的發展態勢下,向量數據庫依然面臨著不可忽視的挑戰。

有聲音認為,不必專門開發一款純粹的向量數據庫,而是可以在現有數據庫的基礎上添加一些層,賦予其向量檢索的能力。更有業內人士認為,現在入局向量數據庫可能并非合適的時機。

那么,向量數據庫是否算得上AI時代的標配?其熱度能維持到幾時,此時押注后續又要擠出多少泡沫?

向量數據庫 大模型的“海馬體”

與傳統數據庫不同,向量數據庫不依賴于結構化格式,而是將數據作為數學向量存儲在高維空間中并對其進行索引。

這種方法被稱為“向量化”,可以更有效地搜索相似性并更好地處理復雜的數據類型(圖像、音視頻、自然語言)。

某種程度上,向量數據庫代表了數據存儲和檢索的范式轉變。隨著大模型的興起,向量數據庫的優勢得以充分發揮,甚至有人將其視為AIGC成功的基石。

一種通俗的比方是,行業內將大模型稱為“大腦”,向量數據庫則是其“海馬體”。

目前的大模型都是預訓練模型,對于訓練截止日之后發生的事情一無所知,第一是沒有實時的數據,第二是缺乏私域數據或者企業數據。

向量數據庫可以通過存儲最新信息或者企業數據有效彌補了這些不足,讓大模型突破在時間和空間上的限制,加速大模型落地行業場景。

同時,通過向量數據的本地存儲,還能夠協助解決目前企業界最擔憂的大模型泄露隱私的問題。

不過值得一提的是,向量技術并不新鮮,早在ChatGPT橫空出世之前,向量數據庫非常小眾。前文提到的兩家初創公司Pinecone和Weaviate都成立于2019年,但此前無論是融資還是營收都是乏善可陳的狀態。

Pinecone聯合創始人兼首席執行官Edo Liberty曾坦率地提到,如果沒有ChatGPT的出現,我們根本不可能獲得巨額融資。

軟件服務初創公司Heltar的創始人Avyukt Aggarwal也談到,AIGC的爆火成就了向量數據庫。

“每次淘金熱都會有人賣鏟子。對于生成式AI,鏟子是什么?向量數據庫。幾乎每一個LLM支持的應用程序都在使用它們或即將使用它們?!?/p>

向量數據庫 有必要走向專業化嗎?

向量數據庫系統的誕生,來源于具體業務需求——想要高效處理海量的向量數據,就需要更細分、更專業的數據基礎設施,為向量構建專門的數據庫處理系統。

但這種路徑是必須的嗎?

產品層面講,如果傳統數據庫廠商不單獨研發向量數據庫,那么基本上會主張支持原生的向量詞嵌入和向量搜索引擎。

向量數據庫市場的陣營,在ChatGPT影響之前就已經在形成分化,既包括提供開源組件的Milvus、Vald、Weaviate、Qdrant、Vaspa、Vearch、AquilaDB、Marqo,到商業化服務產品Pinecone,再到大廠谷歌推出的Vertex AI匹配引擎,數據庫廠商Elastic和Redis基于自身提供的向量檢索功能等等。

這其實也表明了當前向量數據庫市場存在的兩種路線:

一個是基于分析數據庫的向量化執行引擎,英文是Vectorization,這是學術界2013年提出的名詞,如Clickhouse、Spark引擎,是一種新型的執行方式,用于處理傳統的結構化數據如表單等,更多的是結構化數據分析數據里面做并行執行的一種方式,在新型的處理芯片上進行處理。

另一個則是推出向量數據庫(Vector Database),本質上處理的是AI領域的一類新型數據類型,例如對多模數據的處理,相比其他的向量檢索技術在檢索速度和精準性上都有了一個很高的提升。

后者的做法也基本在幾家主流云廠商如亞馬遜云、阿里云上能夠看到,而這些云平臺應用市場也會提供給這些第三方向量數據庫企業進行托管。

例如,阿里云開發的內存數據庫Tair,在兼容Redis生態的同時,也具備向量檢索能力,實現緩存+向量二合一,已經投入在電商等場景。

有業內人士認為,對于簡單的用戶和場景來說,在傳統數據庫上添加一個向量分層來滿足技術發展需求,這種方法是可行的。

然而,考慮到 AI 場景和產業需求,情況可能有所不同。AI領域的迭代非常快,隨著數據量和應用場景的增加,傳統數據庫可能不再適用于高要求的計算密集型場景,向量數據庫可能才是最終的解決方案。

押注向量數據庫 挑戰頗多

作為今年以來的熱門技術賽道,向量數據庫已吸引了大量廠商和創業團隊入場,先發者與后來者,老牌廠商與新生力量之間的競爭正在持續升溫。

但值得注意的是,向量數據庫真的值得廠商全力投入嗎?

在《為什么你不應該投資向量數據庫?》一文中,吳英駿表示,現在入局向量數據庫可能并非合適的時機。其理由主要集中于以下幾點:

其一,先發優勢明顯。目前向量化技術目前已十分成熟,并存在大量開源解決方案,在不同的領域也存在不同的向量化方案,潛在用戶可以很容易地在現有市場中找到合適的選擇。

其二,需求層次不同。如果一家公司已經采用了Elastic,Redis,SingleStore或Rockset等商業數據庫,并且不需要高度先進的向量搜索功能,則可以充分利用這些數據庫的現有功能。

盡管在向量數據處理方面的表現不如專業的向量數據庫,但依然可以滿足多數用戶的一般要求。

其三,技術在不斷前進。隨著數據庫領域技術的進步,越來越多的數據庫會考慮納入向量搜索功能,以滿足當前用戶群的需求。對于目前缺乏向量搜索功能的數據庫,實現這些功能或許只是時間問題。

也有聲音認為,相較于大模型的高調火熱,向量數據庫仍然靠近底層,并沒有達到真正意義上的全民皆知,向量數據庫更多時候是需要集成到其他平臺或云上被銷售。

而從需求端看,過去向量檢索還主要聚焦于機器學習和數據挖掘領域,通過高效的數據存儲和查詢工具,使得相似性搜索和聚類分析成為可能。

推薦系統中,向量數據庫助力個性化推薦,根據用戶興趣和商品相似性,呈現給用戶最貼切的推薦結果。

簡言之,“與其投資新的向量數據庫項目,不如集中精力于現有數據庫,并探索利用向量引擎增強這些數據庫的機會,使其更加健壯和強大”。

結語

無論如何,在技術的快速迭代下,數據庫市場的持續擴張是不可避免的。當前存在著大量的需求,將吸引越來越多的數據庫甚至向量數據庫加入競爭。

不過從長遠來看,向量數據庫的市場需求尚處于初期,中遠期規模尚難以預估。在若干輪優勝劣汰之后,我們或許才能看清誰是真正的執棋者。

【關于科技云報道】

專注于原創的企業級內容行家——科技云報道。成立于2015年,是前沿企業級IT領域Top10媒體。獲工信部權威認可,可信云、全球云計算大會官方指定傳播媒體之一。深入原創報道云計算、大數據、人工智能區塊鏈等領域。

審核編輯 黃宇

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31028

    瀏覽量

    269381
  • 數據庫
    +關注

    關注

    7

    文章

    3817

    瀏覽量

    64496
收藏 人收藏

    評論

    相關推薦

    數據庫加密辦法

    企業對于數據的重視程度不言而喻,也衍生出了數據=資產的概念。但是數據泄漏的事件頻繁發生,為了保護數據資產,企業有必要對數據庫做一些針對性的措
    的頭像 發表于 12-24 09:47 ?90次閱讀

    數據庫數據恢復—Mysql數據庫表記錄丟失的數據恢復流程

    Mysql數據庫故障: Mysql數據庫表記錄丟失。 Mysql數據庫故障表現: 1、Mysql數據庫表中無任何數據或只有部分
    的頭像 發表于 12-16 11:05 ?176次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—Mysql<b class='flag-5'>數據庫</b>表記錄丟失的<b class='flag-5'>數據</b>恢復流程

    數據庫事件觸發的設置和應用

    數據庫無論對于生產管理還是很多的實際應用都非常重要。小編這次聊一下數據庫事件觸發的應用。示例使用了postgresql和Python。
    的頭像 發表于 12-13 15:14 ?150次閱讀

    數據庫數據恢復—MYSQL數據庫ibdata1文件損壞的數據恢復案例

    mysql數據庫故障: mysql數據庫文件ibdata1、MYI、MYD損壞。 故障表現:1、數據庫無法進行查詢等操作;2、使用mysqlcheck和myisamchk無法修復數據庫
    的頭像 發表于 12-09 11:05 ?174次閱讀

    數據庫數據恢復—通過拼接數據庫碎片恢復SQLserver數據庫

    一個運行在存儲上的SQLServer數據庫,有1000多個文件,大小幾十TB。數據庫每10天生成一個NDF文件,每個NDF幾百GB大小。數據庫包含兩個LDF文件。 存儲損壞,數據庫
    的頭像 發表于 10-31 13:21 ?255次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—通過拼接<b class='flag-5'>數據庫</b>碎片恢復SQLserver<b class='flag-5'>數據庫</b>

    科技云報到:大模型時代下,向量數據庫的野望

    科技云報到:大模型時代下,向量數據庫的野望
    的頭像 發表于 10-14 17:18 ?267次閱讀

    Oracle數據恢復—異常斷電后Oracle數據庫報錯的數據恢復案例

    Oracle數據庫故障: 機房異常斷電后,Oracle數據庫報錯:“system01.dbf需要更多的恢復來保持一致性,數據庫無法打開”。數據
    的頭像 發表于 09-30 13:31 ?319次閱讀
    Oracle<b class='flag-5'>數據</b>恢復—異常斷電后Oracle<b class='flag-5'>數據庫</b>啟<b class='flag-5'>庫</b>報錯的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫出現823錯誤的數據恢復案例

    SQL Server數據庫故障: SQL Server附加數據庫出現錯誤823,附加數據庫失敗。數據庫沒有備份,無法通過備份恢復數據庫
    的頭像 發表于 09-20 11:46 ?365次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—SQL Server<b class='flag-5'>數據庫</b>出現823錯誤的<b class='flag-5'>數據</b>恢復案例

    數據庫數據恢復—SQL Server數據庫所在分區空間不足報錯的數據恢復案例

    SQL Server數據庫數據恢復環境: 某品牌服務器存儲中有兩組raid5磁盤陣列。操作系統層面跑著SQL Server數據庫,SQL Server數據庫存放在D盤分區中。
    的頭像 發表于 07-10 13:54 ?520次閱讀

    大模型卷價格,向量數據庫“卷”什么?

    被大模型“帶飛”這一年,向量數據庫才剛剛寫下序言
    的頭像 發表于 05-23 09:24 ?1795次閱讀
    大模型卷價格,<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>“卷”什么?

    數據庫數據恢復—raid5陣列上層Sql Server數據庫數據恢復案例

    數據庫數據恢復環境: 5塊硬盤組建一組RAID5陣列,劃分LUN供windows系統服務器使用。windows系統服務器內運行了Sql Server數據庫,存儲空間在操作系統層面劃分了三個邏輯分區
    的頭像 發表于 05-08 11:43 ?523次閱讀
    <b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復—raid5陣列上層Sql Server<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復案例

    搭載英偉達GPU,全球領先的向量數據庫公司Zilliz發布Milvus2.4向量數據庫

    在美國硅谷圣何塞召開的 NVIDIA GTC 大會上,全球領先的向量數據庫公司 Zilliz 發布了 Milvus 2.4 版本。這是一款革命性的向量數據庫系統,在業界首屈一指,它首次
    的頭像 發表于 04-01 14:33 ?490次閱讀
    搭載英偉達GPU,全球領先的<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>公司Zilliz發布Milvus2.4<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>

    與NVIDIA深度參與GTC,向量數據庫大廠Zilliz與全球頂尖開發者共迎AI變革時刻

    近日,備受關注的 NVIDIA GTC 已拉開序幕。來自世界各地的頂尖 AI 開發者齊聚美國加州圣何塞會議中心,共同探索行業未來,全球領先的向量數據庫公司 Zilliz 也不例外。作為去年被
    的頭像 發表于 03-26 11:01 ?421次閱讀

    數據庫數據恢復】Oracle數據庫ASM實例無法掛載的數據恢復案例

    oracle數據庫ASM磁盤組掉線,ASM實例不能掛載。數據庫管理員嘗試修復數據庫,但是沒有成功。
    的頭像 發表于 02-01 17:39 ?534次閱讀
    【<b class='flag-5'>數據庫</b><b class='flag-5'>數據</b>恢復】Oracle<b class='flag-5'>數據庫</b>ASM實例無法掛載的<b class='flag-5'>數據</b>恢復案例

    騰訊云把向量數據庫“卷”到哪一步了?

    被大模型“帶飛”這一年,向量數據庫才剛剛寫下序言
    的頭像 發表于 01-15 09:49 ?1593次閱讀
    騰訊云把<b class='flag-5'>向量</b><b class='flag-5'>數據庫</b>“卷”到哪一步了?
    主站蜘蛛池模板: 国产精品漂亮美女在线观看| 一级免费看片| 三级黄色短视频| 四虎影院免费在线播放| 四虎国产永久在线观看| 色狠狠狠狠综合影视| 日韩精品一级毛片| 欧美伦理一区二区三区| 久久精品乱子伦观看| 丁香花高清在线观看| 午夜大片免费完整在线看 | 婷婷久操| 日本乱理论片免费看| 精品色综合| ass嫩美女胴体| 色天天综合色天天看| 操xxx| 亚洲一卡2卡3卡4卡5卡乱码| 99久久久久久久| 色综久久| 黄 色 片 在 线 看| 1717国产精品久久| 欧美午夜影院| 6080yy午夜不卡一二三区| 最好看的最新中文字幕2018免费视频 | 国产在线色| 天天激情综合| 91精品福利久久久| 欧美一区二区视频三区| 天堂最新版免费观看| 另类毛片| 午夜精品久久久久久99热| 国产午夜三区视频在线| 一区二区中文字幕在线观看| 一级毛片真人免费观看| 欧洲一级鲁丝片免费| 国产成人a毛片| 激情五月激情综合网| 啪啪福利视频| 色婷婷一区| 国产激烈无遮挡免费床戏视频|