自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="83lxl"></style>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

Kafka為什么會這么快

作者：攻城獅Bilbo 2020-03-30 15:05:46

大數(shù)據(jù) Kafka

在系統(tǒng)設(shè)計中，會用到消息中間件來做服務(wù)異步化，系統(tǒng)解耦，或者是做流量削峰，常用的消息中間件有rabbitMq，activeMq以及阿里的RocketMq等等，都各自有各自的優(yōu)勢，但是就吞吐量來說，kafka是其中的佼佼者。

在系統(tǒng)設(shè)計中，會用到消息中間件來做服務(wù)異步化，系統(tǒng)解耦，或者是做流量削峰，常用的消息中間件有rabbitMq，activeMq以及阿里的RocketMq等等，都各自有各自的優(yōu)勢，但是就吞吐量來說，kafka是其中的佼佼者。在單機情況下，網(wǎng)友做的對比如下：

Kafka為什么會這么快

性能對比

為什么kafka會這么快呢?

發(fā)布訂閱模式

一個普通的發(fā)布訂閱模型如下圖所示：

Kafka為什么會這么快

發(fā)布訂閱模式

以kafka為例，生產(chǎn)者產(chǎn)生消息，并將消息Push到kafka集群，消費者主動去kafka集群Pull數(shù)據(jù)。這種模型有個好處，消費的速率完全由消費者控制，kafka集群類似于一個蓄水池，避免因生產(chǎn)者產(chǎn)生消息過快消費者來不及消費而導(dǎo)致消費者被壓垮的現(xiàn)象。

kafka為什么快要從兩方面分析，生產(chǎn)者產(chǎn)生的消息寫入集群時快和消費者消費消息時從集群讀取快。

寫入快

寫入快主要是兩方面原因：順序?qū)懭牒蚆MFile。

順序?qū)懭?/strong>

kafka將消息存儲在硬盤，通常認為硬盤的讀寫是比較慢，但是為什么kafka快呢?平時所說的磁盤讀寫慢是指隨機讀寫比較慢，因為磁盤每次隨機讀寫都要物理尋址，這是非常耗時的操作，順序讀寫的速度還是比較快的。如下圖所示：

順序?qū)懭?/center>
kafka每次收到新的消息之后都會將消息存儲在尾部，按照順序存儲消息。但是消息一旦存儲無法刪除。

當消費者消費時也是順序消費，每個消費者會有一個偏移量，記錄當前消費的消息的位置。如下圖所示：

順序消費
MMFile

MMFile是指Memory Mapped Files，即內(nèi)存映射技術(shù)。操作系統(tǒng)為了解決內(nèi)存和硬盤讀寫速度之間的差異，采用了內(nèi)存映射技術(shù)，內(nèi)存被劃分為若干頁，每一頁被映射到一塊磁盤空間，因為內(nèi)存是遠遠小于磁盤空間的，所以分頁經(jīng)常會按照一定的算法加載到內(nèi)存，例如先進先出(FIFO)，最近最少使用(LRU)等。內(nèi)存中分頁和磁盤空間對應(yīng)，操作系統(tǒng)會在合適的時候?qū)?nèi)存分頁中的數(shù)據(jù)定時刷磁盤中去。這種方式為什么可以提高寫入效率呢?通常CPU執(zhí)行過程中為了安全分為內(nèi)核態(tài)和用戶態(tài)。只有內(nèi)核態(tài)才能操作iO設(shè)備，內(nèi)存空間分為內(nèi)核空間和用戶空間。通常內(nèi)存中的數(shù)據(jù)寫入到磁盤要以下幾步：

write操作
數(shù)據(jù)會先從用戶空間拷貝到內(nèi)核空間，然后再由內(nèi)核空間寫入IO設(shè)備。而MMFile則省去了一次用數(shù)據(jù)從戶空間到內(nèi)核空間復(fù)制的開銷。

讀取快

讀取快主要是因為零拷貝(Zero Copy)技術(shù)。上面介紹到數(shù)據(jù)從內(nèi)存空間寫入磁盤的步驟，那么從磁盤讀取數(shù)據(jù)剛好相反，具體過程如下：

read操作
數(shù)據(jù)先從磁盤讀取到內(nèi)核空間，然后再從內(nèi)核空間復(fù)制到用戶空間，然后再到Socket，最后傳輸?shù)较M者。

Linux提供了一種sendFile系統(tǒng)調(diào)用，可以將數(shù)據(jù)直接由磁盤拷貝到內(nèi)核空間。省去了一次數(shù)據(jù)從用戶空間到內(nèi)核空間的復(fù)制。這就是所謂的零拷貝技術(shù)。

上面從讀寫兩個角度分析了為什么kafka吞吐量高，其實還有一個重要的原因。

批量數(shù)據(jù)壓縮

kafka不會對每個消息都做壓縮，而是對一批消息壓縮，然后將數(shù)據(jù)統(tǒng)一發(fā)送。將所有的消息變?yōu)橐粋€批量文件，然后直接丟給消費者。

綜上所述，kafka通過MMFile技術(shù)快速將數(shù)據(jù)順序?qū)懭氪疟P，在讀取時通過零拷貝技術(shù)快速讀取，然后通過批量數(shù)據(jù)壓縮將數(shù)據(jù)傳輸?shù)较M者。這就是kafka快的秘訣。然而魚與熊掌不可兼得，速度和可靠性不可能同時滿足，需要根據(jù)實際業(yè)務(wù)情況在二者之間作出取舍。例如當用kafka做日志聚合和網(wǎng)站用戶行為分析時速度要比可靠性重要，而在某些消息不允許丟失的場景，可靠性可能是首選。

責任編輯：未麗燕來源：今日頭條

Kafka 消息數(shù)據(jù)

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

Kafka 為什么這么快？
客戶端producer有個參數(shù)batch.size，默認是16KB。它會為每個分區(qū)緩存消息，一旦滿了就打包將消息批量發(fā)出?？瓷先ミ@是個能夠提升性能的設(shè)計。不過很顯然，因為這個參數(shù)是分區(qū)級別的，如果分區(qū)數(shù)越多，這部分緩存所需的內(nèi)存占用也會更多。

2024-02-26 21:15:20

Kafka 緩存參數(shù)

字節(jié)一面：Kafka為什么這么快？
生產(chǎn)者在發(fā)送消息到Kafka集群之前，可以對消息進行壓縮。這種在生產(chǎn)者端進行壓縮的方式能夠減少發(fā)送到Kafka集群的數(shù)據(jù)量，從而降低網(wǎng)絡(luò)傳輸?shù)膸捪?，并提高?shù)據(jù)傳輸?shù)男省?/a>

2024-11-26 08:52:34

SQL 優(yōu)化 Kafka

Go 為什么這么“快”
本文主要從Go調(diào)度器架構(gòu)層面上介紹了GPM模型，通過該模型怎樣實現(xiàn)少量內(nèi)核線程支撐大量Goroutine的并發(fā)運行。以及通過NetPoller、sysmon等幫助Go程序減少線程阻塞，充分利用已有的計算資源，從而最大限度提高Go程序的運行效率。

2020-02-27 21:03:30

調(diào)度器架構(gòu)效率

Nginx 為什么這么快？
Nginx是一個免費的，開源的，高性能的HTTP服務(wù)器和反向代理，以及IMAPPOP3代理服務(wù)器。Nginx以其高性能，穩(wěn)定性，豐富的功能，簡單的配置和低資源消耗而聞名。本文從底層原理分析Nginx為什么這么快!

2020-02-27 15:44:41

Nginx 服務(wù)器反向代理

剖析Disruptor:為什么會這么快？(四)內(nèi)存屏障
我寫這個系列的博客主要目的是解析Disruptor是如何工作的，并深入了解下為什么這樣工作。理論上，我應(yīng)該從可能準備使用disruptor的開發(fā)人員的角度來寫，以便在代碼和技術(shù)論文[Disruptor1.0.pdf]之間搭建一座橋梁。這篇文章提及到了內(nèi)存屏障，我想弄清楚它們到底是什么，以及它們是如何應(yīng)用于實踐中的。

2013-06-19 10:55:40

Disruptor 并發(fā)框架

剖析Disruptor:為什么會這么快？(三)偽共享
緩存行上的寫競爭是運行在SMP系統(tǒng)中并行線程實現(xiàn)可伸縮性最重要的限制因素。有人將偽共享描述成無聲的性能殺手，因為從代碼中很難看清楚是否會出現(xiàn)偽共享。

2013-06-14 10:12:22

共享并行

剖析Disruptor:為什么會這么快？(一)鎖的缺點
“Disruptor究竟是什么＂。目前我正準備在回答這個問題，但首先回答＂為什么它會這么快＂

2013-06-17 14:41:10

Disruptor 并發(fā)編程

面試提問：Redis 為什么這么快？
一般的，當我們插入數(shù)據(jù)的時候，數(shù)組的長度不會很長，但是當我們在不斷的往內(nèi)部插入數(shù)據(jù)的過程中，就會擴容，比如我們擴容是N倍，這個時候就會涉及到我們原有數(shù)據(jù)元素的移動，而這個過程，我們流稱之為ReHash了。

2023-08-29 07:46:08

Redis 數(shù)據(jù)ReHash

「不懂就問」Esbuild 為什么這么快?
每次運行打包器時，JavaScriptVM都會在沒有任何優(yōu)化提示的情況下看到打包程序的代碼。在esbuild忙于解析JavaScript時，node忙于解析打包程序的JavaScript。

2021-05-27 20:56:51

esbuild 工具 JavaScript

Elasticsearch查詢速度為什么這么快？
這段時間在維護產(chǎn)品的搜索功能，每次在管理臺看到Elasticsearch這么高效的查詢效率我都很好奇他是如何做到的。

2020-10-15 09:19:36

Elasticsear 查詢速度

云為什么會這么熱？
云計算模式符合經(jīng)濟學(xué)規(guī)律，恰如其時地融合了地產(chǎn)概念，為互聯(lián)網(wǎng)技術(shù)創(chuàng)新回歸傳統(tǒng)IT提供了關(guān)鍵路徑，同時蘊含廣闊的市場空間。這些都持續(xù)帶熱著云計算市場。

2012-08-17 10:01:07

云計算

Kafka 為什么這么快的七大秘訣，漲知識了
KafkaReactorIO網(wǎng)絡(luò)模型是一種非阻塞IO模型，利用事件驅(qū)動機制來處理網(wǎng)絡(luò)請求。該模型通過Reactor模式實現(xiàn)，即一個或多個IO多路復(fù)用器（如Java的Selector）監(jiān)聽多個通道的事件，當某個通道準備好進行IO操作時，觸發(fā)相應(yīng)的事件處理器進行處理。

2024-07-30 09:01:12

Kafka 為什么這么快的七大秘訣，漲知識了
KafkaReactorIO網(wǎng)絡(luò)模型是一種非阻塞IO模型，利用事件驅(qū)動機制來處理網(wǎng)絡(luò)請求。該模型通過Reactor模式實現(xiàn)，即一個或多個IO多路復(fù)用器（如Java的Selector）監(jiān)聽多個通道的事件，當某個通道準備好進行IO操作時，觸發(fā)相應(yīng)的事件處理器進行處理。

2024-09-14 09:41:17

互聯(lián)網(wǎng)企業(yè)都在用的Kafka為什么可以這么快？
在數(shù)據(jù)為王的時代，對于海量數(shù)據(jù)的存儲、傳輸、分析變得尤為重要。在數(shù)據(jù)的存儲上有clickhouse、Hbase等大數(shù)據(jù)庫來完成，在數(shù)據(jù)的分析上一般也是借助clickhouse或hbase的特性將數(shù)據(jù)分維度進行，而在數(shù)據(jù)的傳輸上，大家都不約而同使用了Kafka。

2020-10-13 17:54:18

開發(fā)Kafka 數(shù)據(jù)

Kafka性能篇：為何Kafka這么"快"？
在學(xué)習(xí)Kafka的過程中，發(fā)現(xiàn)Kafka也是一個性能十分優(yōu)秀的中間件，遂要求『碼哥』講一講Kafka性能優(yōu)化方面的知識，所以『碼哥』決定將這篇性能方面的博文作為Kafka系列的開篇之作。

2021-03-22 08:30:33

Kafka 源碼架構(gòu)開發(fā)技術(shù)

剖析Disruptor:為什么會這么快？(二)神奇的緩存行填充
我在上一篇文章中提到RingBuffer后，我們收到一些關(guān)于RingBuffer中填充高速緩存行的評論和疑問。由于這個適合用漂亮的圖片來說明，所以我想這是下一個我該解決的問題了。

2013-06-18 10:30:45

Disruptor 框架

終于知道Kafka為什么這么快了！
無論Kafka作為MQ也好，還是作為存儲層也罷，無非就是兩個功能，一是Producer生產(chǎn)的數(shù)據(jù)存到Broker，二是Consumer從Broker讀取數(shù)據(jù)。

2020-08-13 09:19:10

Kafka 存儲 MQ

為什么Kafka如此之快？
Kafka是由LinkedIn公司推出的一個高吞吐的分布式消息系統(tǒng)，通俗地說就是一個基于發(fā)布和訂閱的消息隊列，溫故而知新，反復(fù)學(xué)習(xí)優(yōu)秀的框架，定有所獲。

2021-05-31 07:44:08

Kafka 分布式系統(tǒng)

Redis為什么選擇單線程？Redis為什么這么快？
Redis6.0引入IO多線程的讀寫，更高效的處理請求，Redis只是將IO讀寫變成了多線程，命令的執(zhí)行還是由主線程單線程執(zhí)行，因此，多線程下操作Redis不會出現(xiàn)線程安全的問題，不用像Java那樣加鎖，解鎖，這也是Redis為什么這么快的根本原因。

2023-03-21 08:02:36

Redis6.0 IO多線程

從底層原理分析Nginx為什么這么快
請求是連接到Nginx，Master進程負責處理和轉(zhuǎn)發(fā)如何選定哪個Worker進程處理請求請求的處理結(jié)果，是否還要經(jīng)過Master進程

2020-04-27 07:13:37

Nginx 底層進程

相似話題

數(shù)據(jù)分析
 1669內(nèi)容

數(shù)據(jù)可視化
 308內(nèi)容

商業(yè)智能
 138內(nèi)容

Hadoop
839內(nèi)容
全部話題

同話題下的熱門內(nèi)容

終于明白了！數(shù)字化轉(zhuǎn)型的本質(zhì)、價值與路徑 AI、BI、大數(shù)據(jù)與數(shù)據(jù)科學(xué)的底層邏輯 AI三駕馬車：數(shù)據(jù)、算力和算法，誰更重要？從“人找服務(wù)”到“服務(wù)找人”：政務(wù)數(shù)字化轉(zhuǎn)型的智治新范式字節(jié)面試：StarRocks 中如何優(yōu)化大表 JOIN？AI數(shù)據(jù)自動化：是革命還是泡沫？揭開“全流程替代”的真相 Orange：一個免費的交互式數(shù)據(jù)挖掘與機器學(xué)習(xí)平臺從困局到破局的AI+數(shù)據(jù)分析

相關(guān)專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長學(xué)院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動態(tài)

站點地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號：110108002980號
營業(yè)執(zhí)照京ICP備09067568號

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請勿轉(zhuǎn)載

營業(yè)執(zhí)照出版物經(jīng)營許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動科技科技行者 TechWeb 艾瑞網(wǎng)站長之家速途網(wǎng)中國經(jīng)濟新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會議中國IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷

^{<thead id="1lpmt"></thead>}