“初雪”與“向量化”| StarRocks Hacker Meetup小記
StarRocks Hacker Meetup是StarRocks社區(qū)組織的面向開發(fā)者的線下活動,旨在通過面對面的交流幫助開發(fā)者深入了解StarRocks核心功能的實現(xiàn)原理,和開發(fā)者共同探討數(shù)據(jù)庫領(lǐng)域的前沿技術(shù)。
第一季Hacker Meetup共4期,將持續(xù)2個月,每兩周探討一個StarRocks的核心功能。歡迎大家持續(xù)關(guān)注。第二期Hacker Meetup將在11月20日與大家見面!
上周六,北京迎來了2021年的初雪。StarRocks社區(qū)也迎來了第一期Hacker Meetup:向量化編程的精髓。盡管雨雪交加,但開發(fā)者們熱情不減,現(xiàn)場座無虛席。小伙伴們對這次的活動都感覺收獲滿滿:

干貨回顧
在本次Meeup上,康凱森同學(xué)深入淺出的從幾個方面向大家介紹了數(shù)據(jù)庫向量化編程的要點(diǎn):
·How to build a fast database
如何構(gòu)建一個性能卓越的數(shù)據(jù)庫?凱森分別從預(yù)處理VS現(xiàn)場處理、架構(gòu)、數(shù)據(jù)流、系統(tǒng)資源4個角度進(jìn)行了回答。
·The basics of CPU vectorization
凱森用Top-down的性能分析方法介紹了影響CPU性能的關(guān)鍵點(diǎn),然后介紹了CPU向量化的基本概念和6種向量化編程的方式。
·The key points of database vectorization
數(shù)據(jù)庫的向量化不僅僅是CPU指令的向量化,而是一個巨大的性能優(yōu)化工程。凱森首先介紹了數(shù)據(jù)庫向量化的關(guān)鍵點(diǎn):數(shù)據(jù)組織方式、算子和表達(dá)式的向量化,SIMD如何加速Filter、Agg和Join,然后通過具體實例介紹了數(shù)據(jù)庫單核CPU性能優(yōu)化的幾個關(guān)鍵點(diǎn):數(shù)據(jù)結(jié)構(gòu)和算法、自適應(yīng)策略、SIMD優(yōu)化、內(nèi)存管理優(yōu)化、C++Low Level優(yōu)化和CPU Cache優(yōu)化等,最后推薦了一些好用的性能優(yōu)化工具。
·Thinking of StarRocks vectorization
凱森介紹了StarRocks向量化工程的一些思考和總結(jié)。

即使頂著風(fēng)雪也要相見的開發(fā)者們,期待下次相聚!
下期預(yù)告
數(shù)據(jù)驅(qū)動的前提是能夠快速、準(zhǔn)確地獲取和分析數(shù)據(jù)。為了滿足業(yè)務(wù)日益增長的實時更新需求,StarRocks重新設(shè)計并開發(fā)了存儲引擎,在保持查詢性能不受影響的前提下支持實時更新,并在單表簡單查詢下獲得了10倍以上的性能提升。
下一期,將由StarRocks核心研發(fā)、Apache Kudu PMC常冰琳帶來【列式存儲中實時更新與查詢性能如何兼得】。本次Meetup,冰琳會詳細(xì)解讀StarRocks 2.0版本中最新發(fā)布的實時更新引擎,一起來一探究竟吧!

時間:2021年11月20日14:00-17:00
地點(diǎn):拓荒族三層(中關(guān)村創(chuàng)業(yè)大街10號樓)
演講嘉賓:常冰琳(StarRocks核心研發(fā),Apache Kudu PMC)
*受疫情影響的原因,本次Meetup入場券有限,先到先得。社區(qū)將會審核您的報名信息,StarRocks項目的Contributor擁有優(yōu)先通過權(quán),請以報名成功的短信通知為準(zhǔn)。
這個冬天,讓StarRocks陪你盡數(shù)領(lǐng)略技術(shù)之美!