加速大模型落地:火山引擎向量數(shù)據(jù)庫(kù)的實(shí)踐應(yīng)用
近兩年隨著大模型技術(shù)的快速發(fā)展,圖片、視頻、自然語(yǔ)言等多模態(tài)、非結(jié)構(gòu)化數(shù)據(jù)的查找需求變大,非結(jié)構(gòu)化數(shù)據(jù)的量級(jí)也遠(yuǎn)大于結(jié)構(gòu)化數(shù)據(jù),傳統(tǒng)數(shù)據(jù)庫(kù)已經(jīng)無(wú)法滿足如此多樣化數(shù)據(jù)的處理需求。向量數(shù)據(jù)庫(kù)以其海量的數(shù)據(jù)存儲(chǔ)規(guī)模、高效的計(jì)算查詢能力,正在成為大模型時(shí)代重要的基礎(chǔ)設(shè)施。
3 月23 日,火山引擎開(kāi)發(fā)者社區(qū) Meetup 第十三期邀請(qǐng)到了火山引擎的三位技術(shù)專家,將從火山引擎的實(shí)踐應(yīng)用出發(fā),為大家詳解向量檢索功能的設(shè)計(jì)實(shí)現(xiàn)以及大規(guī)模云原生向量數(shù)據(jù)庫(kù)的核心技術(shù)和優(yōu)化,和大家共同探討大模型時(shí)代向量數(shù)據(jù)庫(kù)的落地實(shí)踐。
?時(shí)間:2024/03/23(周六) 14:00-17:00
地點(diǎn) :北京市海淀區(qū)北三環(huán)西路甲 18 號(hào)院大鐘寺廣場(chǎng) 1 號(hào)樓 3F-17
形式:線下+線上同步直播
精彩議程
《VikingDB:大規(guī)模云原生向量數(shù)據(jù)庫(kù)的前沿實(shí)踐與應(yīng)用》謝劍橋|火山引擎向量數(shù)據(jù)庫(kù)高級(jí)工程師
向量數(shù)據(jù)庫(kù)是解決海量非結(jié)構(gòu)化數(shù)據(jù)檢索與分析問(wèn)題的行業(yè)共識(shí),我們從 19 年解決大規(guī)模分布式向量檢索問(wèn)題,到推出云原生、AI 原生的向量數(shù)據(jù)庫(kù),持續(xù)應(yīng)對(duì)抖音集團(tuán)內(nèi)外部業(yè)務(wù)的復(fù)雜技術(shù)挑戰(zhàn),積累了豐富實(shí)踐經(jīng)驗(yàn)。本次演講將重點(diǎn)介紹 VikingDB 解決各類(lèi)應(yīng)用中極限性能、規(guī)模、精度問(wèn)題上的探索實(shí)踐,并通過(guò)落地的案例向聽(tīng)眾介紹如何在多模態(tài)信息檢索、RAG 與知識(shí)庫(kù)等領(lǐng)域進(jìn)行合理的技術(shù)選型和規(guī)劃。
主要內(nèi)容:
1. AI 原生、云原生的向量數(shù)據(jù)庫(kù)是怎樣的
a. 不止RAG——AIGC 時(shí)代的向量庫(kù)應(yīng)用
b. AI 原生的能力推導(dǎo)
c. 大規(guī)模云原生架構(gòu)設(shè)計(jì)要點(diǎn)
2. 極端性能、規(guī)模、精度問(wèn)題是怎么解決的
a. 向量數(shù)據(jù)庫(kù)的關(guān)鍵性能維度和極限案例
b. 極致性能優(yōu)化探索
c. 極端規(guī)模場(chǎng)景的解決之道
d. 精度:追逐相關(guān)性本質(zhì)
3. 如何用好檢索型向量數(shù)據(jù)庫(kù)
a. 從應(yīng)用場(chǎng)景進(jìn)行技術(shù)選擇
b. 真實(shí)業(yè)務(wù)場(chǎng)景的避坑指南
《解析云原生數(shù)倉(cāng) ByteHouse 如何構(gòu)建高性能向量檢索技術(shù)》田昕暉|火山引擎 ByteHouse 技術(shù)專家
向量檢索被廣泛使用于以圖搜圖、內(nèi)容推薦以及大模型推理等場(chǎng)景。隨著業(yè)務(wù)升級(jí)與 AI 技術(shù)的廣泛使用,用戶期望處理的向量數(shù)據(jù)規(guī)模越來(lái)越大,對(duì)向量數(shù)據(jù)庫(kù)產(chǎn)品的穩(wěn)定性、易用性與性能需求也越來(lái)越高。為此火山引擎ByteHouse 團(tuán)隊(duì)基于社區(qū) ClickHouse 進(jìn)行技術(shù)演進(jìn),提出了全新的向量檢索功能設(shè)計(jì)思路,滿足業(yè)務(wù)對(duì)向量檢索穩(wěn)定性與性能方面的需求。
主要內(nèi)容:
1. 向量檢索概念以及在 LLM 場(chǎng)景的應(yīng)用
2. 當(dāng)前業(yè)界向量數(shù)據(jù)庫(kù)發(fā)展情況
3. ClickHouse 結(jié)合向量檢索的優(yōu)勢(shì),以及社區(qū)當(dāng)前向量檢索局限性與性能問(wèn)題分析
4. ByteHouse 向量檢索功能設(shè)計(jì)思路介紹
5. 性能比較
《在火山引擎云搜索服務(wù)上構(gòu)建混合搜索的設(shè)計(jì)與實(shí)現(xiàn)》魯蘊(yùn)鋮|火山引擎云搜索服務(wù)高級(jí)研發(fā)工程師
當(dāng)今,隨著圖片和視頻數(shù)據(jù)的爆炸式增長(zhǎng),人們對(duì)于多樣化數(shù)據(jù)搜索的需求也越來(lái)越迫切。多模態(tài)搜索場(chǎng)景已經(jīng)成為當(dāng)前搜索領(lǐng)域的主要趨勢(shì)。在這個(gè)背景下,本次演講將重點(diǎn)介紹字節(jié)跳動(dòng)在混合搜索領(lǐng)域的探索,并探討如何在多模態(tài)數(shù)據(jù)場(chǎng)景下進(jìn)行海量數(shù)據(jù)搜索。
主要內(nèi)容:
1. 混合搜索的應(yīng)用場(chǎng)景
2. 云搜索服務(wù)在混合搜索中具備的搜索能力
a. 云搜索服務(wù)在混合搜索中的生態(tài)能力
b. 云搜索服務(wù)在混合搜索中的搜索增強(qiáng)能力
c. 云搜索服務(wù)在混合搜索中的排序打分增強(qiáng)能力
3. 云搜索的混合搜索引擎
a. 當(dāng)前不同向量引擎能力介紹
b. 多種向量引擎及優(yōu)化編碼
c. 不同場(chǎng)景下的向量搜索能力對(duì)比與選擇
掃碼立即報(bào)名
掃碼進(jìn)入活動(dòng)群
閱讀原文鏈接:https://zjsms.com/iFdjBHb3/