騰訊正式發(fā)布向量數(shù)據(jù)庫,用于大模型訓(xùn)練

        獵云網(wǎng)韓文靜2023-07-05 10:55 大公司
        向量數(shù)據(jù)庫主要應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域。

        今日,騰訊云正式發(fā)布向量數(shù)據(jù)庫Tencent Cloud VectorDB,預(yù)計(jì)8月上線騰訊云官網(wǎng)。

        騰訊介紹道,該數(shù)據(jù)庫能夠被廣泛應(yīng)用于大模型的訓(xùn)練、推理和知識(shí)庫補(bǔ)充等場(chǎng)景,是國內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期AI化的向量數(shù)據(jù)庫。

        據(jù)了解,該數(shù)據(jù)庫面向大模型訓(xùn)練,可以讓企業(yè)原先花一個(gè)月時(shí)間才能完成的大模型接入,縮短到三天時(shí)間。


        大模型的“黃金搭檔”


        什么是向量數(shù)據(jù)庫?

        向量數(shù)據(jù)庫是一種專門用于存儲(chǔ)、 管理、查詢、檢索向量的數(shù)據(jù)庫,可以把復(fù)雜的非結(jié)構(gòu)化數(shù)據(jù)通過向量化,處理統(tǒng)一成多維空間里的坐標(biāo)值。

        目前,向量數(shù)據(jù)庫主要應(yīng)用于人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等領(lǐng)域。

        具體來看,向量數(shù)據(jù)庫被廣泛地用于大模型訓(xùn)練、推理和知識(shí)庫補(bǔ)充等場(chǎng)景:支撐訓(xùn)練階段海量數(shù)據(jù)的分類、去重和清洗,給大模型的訓(xùn)練降本增效;通過新數(shù)據(jù)的帶入,幫助大模型提升處理新問題的能力,突破預(yù)訓(xùn)練帶來的知識(shí)時(shí)間限制,避免大模型出現(xiàn)幻覺;提供一種私有數(shù)據(jù)連接大模型的方式,解決私有數(shù)據(jù)注入大模型帶來的安全和隱私問題,加速大模型在產(chǎn)業(yè)落地。

        簡(jiǎn)而言之,向量數(shù)據(jù)庫可以解決大模型預(yù)訓(xùn)練成本高、沒有“長期記憶”、知識(shí)更新不足、提示詞工程復(fù)雜等問題,突破大模型在時(shí)間和空間上的限制,加速大模型落地行業(yè)場(chǎng)景。

        據(jù)第三方調(diào)研數(shù)據(jù)預(yù)測(cè),全球向量數(shù)據(jù)庫到2030年預(yù)計(jì)將迎來超過500億美元的市場(chǎng)。國內(nèi)也將以每年超過20%的速度在增長。目前全球已有的向量數(shù)據(jù)庫產(chǎn)品主要包括 Pinecone、Milvus、Weaviate、Vespa 、Tencent Cloud VectorDB等。其中,超過一半的向量數(shù)據(jù)庫具有云化部署的能力。


        提供10億級(jí)向量檢索能力


        據(jù)介紹,騰訊云向量數(shù)據(jù)庫最高支持10億級(jí)向量檢索規(guī)模,延遲控制在毫秒級(jí),相比傳統(tǒng)單機(jī)插件式數(shù)據(jù)庫檢索規(guī)模提升10倍,同時(shí)具備百萬級(jí)每秒查詢(QPS)的峰值能力。

        具體而言,騰訊發(fā)布的向量數(shù)據(jù)庫有以下特點(diǎn)。

        一是高性能向量存儲(chǔ)、檢索。騰訊云向量數(shù)據(jù)庫具備高性能的向量存儲(chǔ)和檢索能力,單索引能夠輕松支持10億級(jí)別的向量規(guī)模。在分布式彈性擴(kuò)展的架構(gòu)下,單實(shí)例可支持百萬級(jí)別QPS,AI場(chǎng)景下向量檢索的P99響應(yīng)延遲可控制在20ms以內(nèi),能夠覆蓋絕大多數(shù)AI場(chǎng)景對(duì)向量存儲(chǔ)和檢索的業(yè)務(wù)需求。

        二是可視化數(shù)據(jù)管理。在向量存儲(chǔ)、檢索能力之上,騰訊云向量數(shù)據(jù)庫還提供了可視化的數(shù)據(jù)管理界面,進(jìn)一步降低向量數(shù)據(jù)庫的接入和使用門檻。用戶可以通過控制臺(tái)進(jìn)行數(shù)據(jù)庫、集合層面的數(shù)據(jù)管理,還可以快速執(zhí)行向量檢索等常用操作。此外,騰訊云向量數(shù)據(jù)庫還提供了可視化的數(shù)據(jù)上傳能力,幫助用戶快速構(gòu)建專屬知識(shí)庫。

        三是一站式向量檢索方案。為了進(jìn)一步提升產(chǎn)品的易用性,騰訊云向量數(shù)據(jù)庫會(huì)提供一站式的向量檢索方案,實(shí)現(xiàn)從文本輸入到文本搜索的端到端檢索能力,用戶可以直接上傳.pdf、.txt等原始文本文件,通過平臺(tái)自動(dòng)化地執(zhí)行文本分割、embedding向量化,全托管地完成知識(shí)構(gòu)建和檢索任務(wù)。

        騰訊官方信息稱,使用騰訊云向量數(shù)據(jù)庫后,企業(yè)接入大模型需要花費(fèi)的時(shí)間,能從一個(gè)月降低至三天左右,極大降低企業(yè)的接入成本。

        在具體落地應(yīng)用層面,騰訊方面表示,該向量數(shù)據(jù)庫目前已經(jīng)應(yīng)用在騰訊視頻、QQ瀏覽器、QQ音樂等30多款騰訊內(nèi)部產(chǎn)品之中。

        數(shù)據(jù)顯示,使用騰訊云向量數(shù)據(jù)庫后,QQ音樂人均聽歌時(shí)長提升3.2%、騰訊視頻有效曝光人均時(shí)長提升1.74%、QQ瀏覽器成本降低37.9%。

        騰訊方面表示,在未來“向量數(shù)據(jù)庫+大模型+數(shù)據(jù)”將產(chǎn)生“飛輪效應(yīng)”,共同助力企業(yè)步入AI Native(AI原生)時(shí)代。

        【本文為合作媒體授權(quán)博望財(cái)經(jīng)轉(zhuǎn)載,文章版權(quán)歸原作者及原出處所有。文章系作者個(gè)人觀點(diǎn),不代表博望財(cái)經(jīng)立場(chǎng),轉(zhuǎn)載請(qǐng)聯(lián)系原作者及原出處獲得授權(quán)。有任何疑問都請(qǐng)聯(lián)系(聯(lián)系(微信公眾號(hào)ID:AppleiTree)。免責(zé)聲明:本網(wǎng)站所有文章僅作為資訊傳播使用,既不代表任何觀點(diǎn)導(dǎo)向,也不構(gòu)成任何投資建議。】

        猜你喜歡

        亚洲国产精品一区二区第一页免| 亚洲AV色无码乱码在线观看| 国产亚洲精品国产福利在线观看| 亚洲国产精品无码久久| 国产亚洲精aa在线看| 亚洲Av高清一区二区三区| 亚洲va成无码人在线观看| 亚洲中文无码a∨在线观看| 亚洲精品视频观看| 亚洲性一级理论片在线观看| 亚洲精品美女在线观看| 亚洲国产日产无码精品| 精品亚洲成在人线AV无码| 亚洲av无码片区一区二区三区| 亚洲乱码一二三四区麻豆| 国产成人亚洲精品| 中日韩亚洲人成无码网站| 亚洲欧美国产国产一区二区三区| 亚洲啪AV永久无码精品放毛片| 亚洲AV永久无码天堂影院| 青青青亚洲精品国产| 亚洲第一成人影院| 亚洲中文字幕视频国产| 在线日韩日本国产亚洲| 国产亚洲婷婷香蕉久久精品 | 亚洲精品国产精品| 久久精品国产亚洲av天美18| 亚洲国产成人精品女人久久久| 亚洲国产中文v高清在线观看| 精品国产人成亚洲区| 亚洲国产精品一区二区第一页| 亚洲AV日韩AV永久无码绿巨人| 久久精品国产亚洲AV无码麻豆| 亚洲午夜精品在线| 亚洲精品无码专区久久| 国产一区二区三区亚洲综合| 亚洲综合色婷婷七月丁香| 午夜亚洲www湿好大| 亚洲一区二区三区无码国产| 亚洲gay片在线gv网站| 中文字幕亚洲综合久久男男|