自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

英特爾助力快手實(shí)現(xiàn)異構(gòu)計(jì)算加速 顯著提升性能,降低系統(tǒng)TCO

企業(yè)動(dòng)態(tài)
將負(fù)載卸載到英特爾?FPGA,顯著提升系統(tǒng)吞吐性能,降低請(qǐng)求延時(shí)。

昨晚睡得好嗎?睡不好可以刷快手的《11 點(diǎn)睡吧》。這部當(dāng)代人睡眠困境的微綜藝,總曝光量達(dá)到 107億,不但科普睡眠知識(shí),更深度探討都市人的喜怒哀樂(lè)[1]。驚人的曝光量背后,是快手對(duì)用戶畫像數(shù)據(jù)的精準(zhǔn)分析,離不開強(qiáng)大技術(shù)支持下的推薦系統(tǒng),得以讓優(yōu)質(zhì)的內(nèi)容被更多喜歡它的人看到。

作為超 3 億日活、日均千萬(wàn)級(jí)短視頻上傳、強(qiáng)調(diào)社區(qū)普惠的短視頻 APP,快手推薦系統(tǒng)在大規(guī)模復(fù)雜業(yè)務(wù)中面臨著巨大性能挑戰(zhàn)。想要化解算力瓶頸,異構(gòu)計(jì)算是一個(gè)重要選項(xiàng),這種使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式,能夠針對(duì)不同任務(wù)選擇最優(yōu)的計(jì)算架構(gòu),從而充分揮各種計(jì)算機(jī)構(gòu)的優(yōu)勢(shì),協(xié)同完成復(fù)雜的工作任務(wù)。

1、異構(gòu)計(jì)算助拳,緩解參數(shù)服務(wù)器瓶頸

快手作為短視頻內(nèi)容平臺(tái),內(nèi)容生產(chǎn)、內(nèi)容理解、內(nèi)容分發(fā)、內(nèi)容消費(fèi)、用戶互動(dòng)這些環(huán)節(jié),構(gòu)成了大規(guī)模的復(fù)雜業(yè)務(wù),對(duì)算力產(chǎn)生更多元的需求。舉例來(lái)說(shuō):在推薦業(yè)務(wù)場(chǎng)景中,需要根據(jù)用戶畫像推薦感興趣的內(nèi)容,就要從海量信息中選擇與用戶特征相關(guān)的結(jié)果,再通過(guò)“排序”來(lái)劃分內(nèi)容的優(yōu)先級(jí)別。在這一過(guò)程中,參數(shù)服務(wù)器的作用非常重要,它負(fù)責(zé)存儲(chǔ)、處理海量數(shù)據(jù)特征以及排序模型參數(shù),保證任務(wù)高效、準(zhǔn)確地完成。

 

快手的推薦系統(tǒng)為了應(yīng)對(duì)海量數(shù)據(jù)沖擊,在架構(gòu)上分離了計(jì)算與存儲(chǔ)。參數(shù)服務(wù)器屬于存儲(chǔ)型服務(wù),該服務(wù)要保存和實(shí)時(shí)更新上億規(guī)模的用戶畫像、數(shù)十億規(guī)模的短視頻特征、以及千億規(guī)模的排序模型參數(shù)。受限于容量和帶寬的參數(shù)服務(wù)器,還要支撐每秒數(shù)億次的 KV 請(qǐng)求,耗費(fèi)大量 CPU 資源。

要解決此類瓶頸,最佳方案是使用不同計(jì)算設(shè)備處理不同負(fù)載。快手的LaoFe NDP 近數(shù)據(jù)架構(gòu),在計(jì)算體系結(jié)構(gòu)上實(shí)現(xiàn)創(chuàng)新,使用英特爾? 至強(qiáng)?可擴(kuò)展處理器、英特爾?? Agilex? FPGA 英特爾?? 傲騰? 持久內(nèi)存,借助軟硬一體化、領(lǐng)域?qū)S眉铀倨髟O(shè)計(jì),從而做到網(wǎng)絡(luò)、存儲(chǔ)、計(jì)算三重加速,為各個(gè)業(yè)務(wù)系統(tǒng)提供低延遲、高并發(fā)、高吞吐、低總體擁有成本的基礎(chǔ)資源。

2、持久內(nèi)存+FGPA 專用硬件,

確保三重加速創(chuàng)新

在網(wǎng)絡(luò)層面,LaoFe NDP 架構(gòu)將 CPU的網(wǎng)絡(luò)數(shù)據(jù)處理轉(zhuǎn)移到英特爾? Stratix 10 FPGA 上,同時(shí)基于該 FPGA 實(shí)現(xiàn)了“軟件定義遠(yuǎn)程直接內(nèi)存訪問(wèn)”協(xié)議(SD-RDMA),大幅降低了請(qǐng)求延時(shí)。

在存儲(chǔ)層面,該架構(gòu)打造了支持 SSD、英特爾? 傲騰? 持久內(nèi)存、以及 DRAM 的Key-Value 存儲(chǔ)引擎,將CPU 層面的存儲(chǔ)操作也轉(zhuǎn)移到 FPGA 中,最大程度發(fā)揮 FPGA 的能力,相比 CPU 方案,將存儲(chǔ)引擎的吞吐能力提升 5 倍以上。該引擎還利用英特爾? 傲騰? 持久內(nèi)存的特性,讓基于異構(gòu)存儲(chǔ)的索引系統(tǒng)幾乎達(dá)到純 DRAM 相同的性能指標(biāo),成本降低 30%。同時(shí)相比之前小時(shí)級(jí)的故障恢復(fù)速度,異構(gòu)存儲(chǔ)的索引系統(tǒng)只需幾分鐘就能重新上線。

LaoFe NDP 的計(jì)算加速仰仗 FPGA 作為領(lǐng)域?qū)S锰幚?,可以更有效地并行處理?shù)據(jù),提供更高效的內(nèi)存層次結(jié)構(gòu)與定制化的執(zhí)行單元,從而支持機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和大數(shù)據(jù)等場(chǎng)景。英特爾?? FPGA 具備富于彈性的可編程硬件能力,延時(shí)低且可精確控制,單位算力功耗低、 片上內(nèi)存大,適合于快手延時(shí)要求高、批處理比較小、
并發(fā)性和重復(fù)性強(qiáng)的應(yīng)用場(chǎng)景。

 

快手LaoFe NDP 架構(gòu)在英特爾軟硬件優(yōu)化下,最終實(shí)現(xiàn)了如下優(yōu)勢(shì):

■ 系統(tǒng)吞吐顯著提升,延時(shí)顯著降低:參數(shù)服務(wù)器的吞吐性能提升了 5-6 倍,整體請(qǐng)求延時(shí)降低了 70%-80%,提供更好的用戶體驗(yàn)。

■ 更好地控制 TCO:FPGA 的強(qiáng)大性能提供遠(yuǎn)超傳統(tǒng)方案的吞吐能力,僅需部署少量的服務(wù)器就能滿足特性的性能指標(biāo)要求,替代比可達(dá)到 1:5,有效降低 TCO。

■ 降低性能抖動(dòng):基于CPU的軟件方案常因需要進(jìn)行高頻率更新而出現(xiàn)性能抖動(dòng),而通過(guò)FPGA來(lái)處理負(fù)載,能大幅減少性能抖動(dòng)。

通過(guò)快手的實(shí)踐能夠看出,以異構(gòu)計(jì)算加速不同負(fù)載,能夠顯著提升在推薦等場(chǎng)景下的系統(tǒng)吞吐與延時(shí)表現(xiàn)。未來(lái),英特爾還會(huì)和快手等合作伙伴一起,推進(jìn)面向未來(lái)數(shù)據(jù)中心的異構(gòu)參考架構(gòu),通過(guò)CPU、IPU、XPU的產(chǎn)品組合以及軟件堆棧,以及智能網(wǎng)絡(luò)結(jié)構(gòu),提供跨越整個(gè)數(shù)據(jù)管道的解決方案,高效挖掘海量數(shù)據(jù)中的智慧,讓用戶與用戶、用戶與內(nèi)容、用戶與商品可及時(shí)按需建立高效、有溫度的連接互動(dòng)。

掃描下方二維碼或點(diǎn)擊“閱讀原文”了解更多案例詳情。

 

[1] 微內(nèi)容時(shí)代,快手娛樂(lè)憑借創(chuàng)新內(nèi)容搶先一步?

https://www.sohu.com/a/563124514_121321820

[2] 快手?jǐn)y手英特爾,通過(guò)LaoFeNDP架構(gòu)加速異構(gòu)計(jì)算提供多元算力

責(zé)任編輯:張燕妮 來(lái)源: 英特爾數(shù)據(jù)中心
相關(guān)推薦

2021-04-08 09:47:09

云計(jì)算

2009-07-02 17:41:08

英特爾高性能計(jì)算石油

2012-06-25 09:51:57

AMDARM英特爾

2021-02-18 07:23:17

CPU英特爾微軟

2017-05-02 14:02:43

華為

2012-03-19 17:12:05

英特爾軟件大會(huì)并行編程高性能計(jì)算

2021-12-20 17:50:59

元宇宙VR英特爾

2013-11-06 09:01:49

移動(dòng)異構(gòu)計(jì)算移動(dòng)計(jì)算

2015-11-18 17:32:36

英特爾

2021-08-20 11:14:41

英特爾架構(gòu)

2014-11-21 15:48:39

英特爾高性能計(jì)算模塊

2018-04-24 14:24:39

云發(fā)布異構(gòu)計(jì)算

2018-04-17 20:19:24

加速云異構(gòu)計(jì)算AI

2013-07-12 15:24:53

業(yè)務(wù)英特爾計(jì)算力

2010-06-03 18:28:54

英特爾高性能計(jì)算

2013-04-24 09:36:44

英特爾云計(jì)算創(chuàng)新

2012-09-24 10:37:33

英特爾零能耗計(jì)算

2017-02-20 20:05:19

阿里云英特爾ECS實(shí)例

2009-06-17 17:49:06

英特爾云計(jì)算網(wǎng)絡(luò)

2013-05-20 11:02:31

英特爾CEO移動(dòng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)