自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="04ayh"></ruby>

<style id="04ayh"></style>

^{<blockquote id="04ayh"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

數(shù)據(jù)流時代，Teads如何做到每天賦予1000億事件價值？

作者：佚名 2018-04-24 10:53:28

大數(shù)據(jù)

在這篇文章中，我們描述了如何協(xié)調(diào)Kafka，Dataflow和BigQuery共同采集和轉(zhuǎn)換大數(shù)據(jù)流。當(dāng)增加了模式和延時的約束時，調(diào)優(yōu)和重新排序成了很大的挑戰(zhàn)，下面展示了我們是如何解決它的。

在這篇文章中，我們描述了如何協(xié)調(diào)Kafka，Dataflow和BigQuery共同采集和轉(zhuǎn)換大數(shù)據(jù)流。當(dāng)增加了模式和延時的約束時，調(diào)優(yōu)和重新排序成了很大的挑戰(zhàn)，下面展示了我們是如何解決它的。

發(fā)布者Tead是由Analytics提供支持的web應(yīng)用之一

在數(shù)字廣告中，日常運營產(chǎn)生了許多我們需要跟蹤的事件，以便透明地報道活動的效益。這些事件來自：

用戶與廣告互動，通過瀏覽器發(fā)送。這些事件被稱為可以標(biāo)準化的(開始、完成、暫停、回復(fù)等)跟蹤事件，或者使用Teads Studio構(gòu)建的具有互動創(chuàng)意的自定義事件。我們每天收到大約100億個跟蹤事件。

來自我們的后端這些事件都是關(guān)于廣告拍賣的大部分(實時出價流程)細節(jié)。在抽樣之前我們每天產(chǎn)生的這些事件超過600億，在2018年這個數(shù)字將翻一番。

在這篇文章中，我們聚焦于跟蹤事件，因為它們是我們業(yè)務(wù)上最關(guān)鍵部分的。

簡單概述了我們技術(shù)環(huán)境的兩個主要事件源

瀏覽器通過HTTP將跟蹤數(shù)據(jù)發(fā)送到一個專用組件，其他的事情都列進了Kafka的topic中。Analytics是這些事件的服務(wù)對象之一。

我們用一個Analytics小組，他們的任務(wù)是按照如下定義管理這些事件：

我們獲取了log的增長量，
我們將它們轉(zhuǎn)化成面向業(yè)務(wù)的數(shù)據(jù)
我們?yōu)槊恳晃活櫩吞峁└咝叶ㄖ频姆?wù)。

為了完成這個任務(wù)，我們建立和維護了一系列處理工具和管道。由于公司的有機增長和新產(chǎn)品的需求，我們定期挑戰(zhàn)我們的結(jié)構(gòu)。

為什么我們移向了BigQuery

回顧2016年，我們的Analytics跟蹤基于lambda architecture系統(tǒng)架構(gòu)(Storm、 Spark和Cassandra項目)，并且出現(xiàn)了一些問題：

數(shù)據(jù)的模式使它不可能存放在單一的Cassandra表中，這會妨礙高效的交叉查詢，
它是一個復(fù)雜的基礎(chǔ)框架，在批處理和速度層都會出現(xiàn)代碼復(fù)制，這阻礙了我們新功能的高效發(fā)布，
最終它將難以發(fā)展且不具有成本效益。

這時候，我們有了幾種可能的選擇。首先，我們可以建立一個增強的lambda，但它只能推遲我們要面臨的問題。

我們考慮了幾個有前景的替代品，像Druid何BigQuery。我們最終選擇遷移到BiQuery，因為他有很多強大的功能。

通過BigQuery我們能夠：

工作在原始事件，
使用SQL作為高效的數(shù)據(jù)處理語言，
使用BigQuery作為處理引擎，
使解釋性訪問數(shù)據(jù)更容易(相比Spark SQL或者Hive)

感謝flat-rate計劃，我們高強度的用法(查詢和存儲方式)是具有高成本效益的。

然而，我們的技術(shù)環(huán)境不適合BigQuery。我們想用它來存儲和轉(zhuǎn)換來自多個Kafka topic 的所有事件。我們無法讓我們的Kafka群組移出AWS，也無法使用與Kafka托管等效的Pub/Sub，因為這些群集也被我們托管在AWS上的一些廣告投放組件使用。因此，我們不得不處理來自運營的多云基礎(chǔ)框架的挑戰(zhàn)。

今天，BigQuery是我們的數(shù)據(jù)倉庫系統(tǒng)，用于我們的跟蹤數(shù)據(jù)與其他的原始數(shù)據(jù)的協(xié)調(diào)核對。

獲取

當(dāng)處理追蹤事件的時候，你面對的首要問題就是，你必須在不知道延遲的情況下無序地處理他們。

事件實際發(fā)生的時間(事件觸發(fā)時間，event time)和系統(tǒng)注意到這個事件的時間(處理時間，processing time)之間的時間間隔的范圍涵蓋了從毫秒級到小時級。這些巨大的延遲并不罕見，而且當(dāng)用戶在瀏覽會話的時間中間連接斷開了或者開啟了飛行模式，就會出現(xiàn)這種情況。

事件觸發(fā)時間和處理時間的時間差

如果要獲取流數(shù)據(jù)處理遇到的問題相關(guān)更多信息，我們建議去看Google Cloud Next’17 中Tyler Akidau(Google數(shù)據(jù)處理技術(shù)主管)和 Loïc Jaures(Teads的共同創(chuàng)始人和技術(shù)部高級副總裁)討論《批處理和流處理之間的來回轉(zhuǎn)換》。本文就是受到這個討論的啟發(fā)。

流的嚴酷現(xiàn)實

Dataflow是一個管理流系統(tǒng)，為了應(yīng)對我們面對的事件的混亂本質(zhì)的挑戰(zhàn)而生。Dataflow有一個統(tǒng)一的流和批處理編程模型，流是它的主推特性。

由于Dataflow的承諾和對流模式的大膽嘗試，我們購買了它。不幸的是，在面對真實生產(chǎn)環(huán)境的數(shù)據(jù)傳輸，我們感到了驚駭：BigQuery的流插入代價。

我們對壓縮數(shù)據(jù)大小(即，通過網(wǎng)絡(luò)的字節(jié)的實際數(shù)據(jù)卷)和非BigQuery的原始數(shù)據(jù)格式大小已經(jīng)有了基本估算。幸運的是現(xiàn)在已經(jīng)為每個數(shù)據(jù)類型提供了文檔，因此你也可以做計算。

那時候，我們低估了這個額外代價的100倍，這幾乎是我們整個獲取渠道(Dataflow + BigQuery)的兩倍代價。我們也遇到了其他的局限，例如100,000 events/s 速率限制，這已經(jīng)幾乎接近我們在做的事情了。

好消息是，有一種方法可以完全避免流插入限制:批量加載到BigQuery。

理想情況下，我們希望在流模式中使用Dataflow，在批處理模式下使用BigQuery。在那個時候，Dataflow SDK中沒有用于無限制數(shù)據(jù)流的BigQuery批處理接收器。

然后我們考慮開發(fā)自己的自定義接收器。不幸的是，當(dāng)時不可能在無限制的數(shù)據(jù)流中添加一個自定義的接收器(見Dataflow計劃為在將來的版本中增加對編寫無界數(shù)據(jù)的自定義接收器的支持——現(xiàn)在這是有可能的，Beam是官方的Dataflow SDK)。

我們別無選擇，只能把我們的數(shù)據(jù)轉(zhuǎn)換成批處理模式。由于Dataflow的統(tǒng)一模型，這僅僅是幾行代碼的問題。幸運的是，我們可以接收由切換到批處理模式所引入的額外數(shù)據(jù)處理延遲。

繼續(xù)向前推進，我們目前的接入架構(gòu)是基于Scio，這是一個由Spotify提供的Dataflow開源的Scala API。如前所述，Dataflow原生支持Pub/Sub，但集成Kafka還不太成熟。我們必須擴展Scio以支持檢查點持久性和有效的并行性。

微型的批處理管道

我們的結(jié)果處理架構(gòu)是一個30個節(jié)點的Dataflow批處理作業(yè)的鏈，按順序排列，讀取Kafka topic，并使用加載作業(yè)來寫入BigQuery。

數(shù)據(jù)流小批量處理的多個階段。

其中一個關(guān)鍵是找到理想的分批時間。我們發(fā)現(xiàn)在成本和讀取性能之間有一個最佳的平衡點(因此延遲)。調(diào)整的變量是Kafka讀取階段的持續(xù)時間。

要得到完整的批處理時間，您必須將寫入操作添加到BigQuery階段也算在里面(不是成比例增加的，而是與讀操作時間密切相關(guān))，再加上一個常量，也就是啟動和關(guān)閉消耗的時間。

值得一提：

讀取階段太短會降低讀取和非讀取階段之間的比例。在一個理想的情況下，1：1的比值意味著你必須能夠以同樣的速度進行讀取和寫入。在上面的例子中，我們有20分鐘的讀取階段，對一個30分鐘的批處理(比值為3：2)。這意味著我們必須能夠在讀取數(shù)據(jù)時比我們寫入數(shù)據(jù)的速度快1.5倍。小的比值意味著需要更大的實例。
過長的讀取階段將簡單地增加事件的發(fā)生時刻與BigQuery中其可用的時刻之間的延遲。

性能調(diào)優(yōu)

為簡便以及更易于失敗管理，數(shù)據(jù)流作業(yè)按順序啟動。這是我們愿意采取的延遲所做的折衷。如果某項作業(yè)失敗了，我們只需返回上次所提交的Kafka偏移即可。

我們必須修改我們的Kafka集群的拓撲結(jié)構(gòu)，并增加分區(qū)的數(shù)量，以便能夠更快地unstack消息。根據(jù)你在Dataflow中所進行的轉(zhuǎn)換，受限的因素很可能是在處理能力或網(wǎng)絡(luò)吞吐量上。為了實現(xiàn)高效的并行，你應(yīng)該始終嘗試保留大量CPU線程，這個數(shù)字是你所擁有的分區(qū)數(shù)量的一個因子(推論：Kafka分區(qū)的數(shù)量是多因子合數(shù)，這是很不錯的)。

在極少數(shù)的延遲情況下，我們可以用較長的讀取序列對作業(yè)進行微調(diào)。通過使用更大的批處理，我們也能夠以延遲為代價來趕上這類延遲。

為了處理大部分情況，我們調(diào)整Dataflow使其讀取速度以比實際速度快3倍。用單個n1-highcpu-16實例讀取20分鐘可以unstack 60分鐘的消息。

隨著時間變化的攝取延時(單位：分鐘)

在我們的用例中，我們最終得到的鋸齒式延遲，震蕩范圍在3分鐘(Write BQ階段的最小時長)和30分鐘(作業(yè)的總時長)之間。

轉(zhuǎn)換

原始數(shù)據(jù)是不可避免地體積龐大，我們有太多的事件，并照目前狀態(tài)無法查詢它們。我們需要匯總這些原始數(shù)據(jù)以保持較低的讀取時間和緊湊的體積大小。以下是我們在BigQuery中的做法：

跨AWS和GCP的架構(gòu)綜述

與傳統(tǒng)ETL過程中數(shù)據(jù)在加載之前進行轉(zhuǎn)換不同的是，我們選擇以原始格式首先存儲它(ELT)。

它有兩個主要的好處：

它讓我們可以訪問每一個原始事件以進行精確的分析和調(diào)試，
它通過讓BigQuery用簡單但強大的SQL方言完成轉(zhuǎn)換來簡化整個鏈。

我們希望直接寫入每天分區(qū)的原始事件表。我們不能因為Dataflow批處理就必須使用特定的目標(biāo)(表或分區(qū))來定義，并且可以包含針對不同分區(qū)的數(shù)據(jù)。我們通過將每個批裝載到一個臨時表中來解決這個問題，然后開始轉(zhuǎn)換它。

對于這些臨時批處理表，我們運行一組轉(zhuǎn)換，這些轉(zhuǎn)換被具體化成SQL查詢，輸出到其他表。其中一個轉(zhuǎn)換只是將所有數(shù)據(jù)附加到大型原始事件表，并在白天進行分區(qū)。

另一個轉(zhuǎn)換是rollup:給定一組維度數(shù)據(jù)的聚合。所有這些轉(zhuǎn)換都是冪等的，可以在錯誤或需要進行數(shù)據(jù)再處理的情況下安全地重新運行。

Rollups

直接查詢原始事件表是很好的調(diào)試，也有利于深入分析，但是直接查詢原始表不可能達到可接受的性能，更不用說這種操作的成本了。

為了給你一個想法，這個表格只保留了4個月，包含1萬億個事件，大小接近250TB。

rollup轉(zhuǎn)換的示例。

在上面的示例中，我們將事件計數(shù)設(shè)置為3個維度:小時、Ad ID、網(wǎng)站ID。事件也被旋轉(zhuǎn)并轉(zhuǎn)換為列。該示例顯示了2.5x的減少，而實際情況則接近70x。

在BigQuery大型并行上下文中，查詢運行時不會受到太大影響，改進是根據(jù)使用的槽數(shù)來衡量的。

Rollups還讓我們將數(shù)據(jù)劃分為小塊:事件被分組到小的表中，每一個小時(事件時間的小時，而不是處理時間)。因此，如果您需要查詢給定小時的數(shù)據(jù)，您將查詢單個表(<10M行，<10GB)。

Rollups是一種通用的聚合，我們可以更有效地查詢所有事件，給定了大量的維度。還有一些其他的用例，我們希望對數(shù)據(jù)有專門的視圖。它們每個都可以實現(xiàn)一組特定的轉(zhuǎn)換，最終得到一個專門的和優(yōu)化的表。

管理服務(wù)的限制

BigQuery，雖然功能很強大但是也存在限制：

BigQuery不允許查詢具有不同模式(即使查詢沒使用不同的字段)的多個表。當(dāng)我們需要添加一個字段，我們用一個腳本來做上百個表的批量更新。
BigQuery不支持列刪除。沒什么大不了的，因為這對技術(shù)而言沒什么負擔(dān)。
查詢多個小時：BigQuery的表名支持通配符，但是性能非常差，我們生成查詢的時候，需要使用UNION ALL來明確要查詢的每張表。
我們總是需要連接帶有托管在其他數(shù)據(jù)庫(例如，給事件提供更多的廣告活動信息)上數(shù)據(jù)的這些事件，但是BigQuery也不支持這個。我們現(xiàn)在不得不定期把完整的表拷貝到BigQuery上，以便能在單個查詢中做數(shù)據(jù)連接。

云間數(shù)據(jù)傳輸?shù)臉啡?/strong>

通過在AWS中Teads的廣告投放基礎(chǔ)設(shè)施和Kafka群組來與其它組件共享，我們別無選擇，只能在AWS和GCP云之間移動大量數(shù)據(jù)，當(dāng)然這不容易，無疑也不會便宜。我們將Dataflow實例(這主要的是GCP的切入點)盡可能靠近放置在我們的AWS基礎(chǔ)設(shè)施旁邊。幸運的是，AWS和GCP之間的連接足夠好，以至于我們可以簡便的使用托管的VPN。

雖然我們運行這些VPN遇到了一些不穩(wěn)定性，但我們想辦法整理出了一個簡單的腳本，用來再一次的打開和關(guān)閉VPN。我們從未面對過一個足夠巨大的問題來證明專用鏈路的成本。

又一次，費用成了你不得不密切關(guān)注的事情，出口是令人擔(dān)憂的，在你看到賬單之前費用是難以估計的。為了壓縮成本，你需要仔細選擇壓縮數(shù)據(jù)的方法。

只有一半

分析大局
在BigQuery中所擁有的這些事件是不夠的。為了給業(yè)務(wù)帶來價值，數(shù)據(jù)必須與不同的規(guī)則和度量相結(jié)合。此外，BigQuery不適合實時用例。

由于并發(fā)限制和不可壓縮的查詢延遲3到5秒(可接受和固有的設(shè)計)，BigQuery必須與其他工具混合，以服務(wù)應(yīng)用程序(指示板、web ui等)。

這個任務(wù)由我們的分析服務(wù)來執(zhí)行，它是一個Scala組件，它利用BigQuery來生成按需報告(電子表格)和定制的數(shù)據(jù)集市(每日或每小時更新)。

我們選擇了AWS Redshift來存儲和服務(wù)我們的數(shù)據(jù)集市。盡管服務(wù)于面向用戶的應(yīng)用程序似乎不是一個清晰的選擇，但Redshift對我們很適用，因為我們的并發(fā)用戶數(shù)量是有限的。

另外，使用鍵/值存儲器需要更多的開發(fā)工作。通過保持中間的關(guān)系數(shù)據(jù)庫，數(shù)據(jù)集市的消費變得更容易了。

關(guān)于如何規(guī)劃化地構(gòu)建、維護和查詢這些數(shù)據(jù)集市，這會有很多話題，但他們將成為另一篇文章的主題。

責(zé)任編輯：未麗燕來源：開源中國編譯

數(shù)據(jù)流 Kafka 數(shù)據(jù)處理

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

大數(shù)據(jù)架構(gòu)如何做到流批一體？
大數(shù)據(jù)分析場景需要解決哪些技術(shù)挑戰(zhàn)目前，有哪些主流大數(shù)據(jù)架構(gòu)模式及其發(fā)展今天，我們都會一一解讀，并介紹如何結(jié)合云上存儲、計算組件，實現(xiàn)更優(yōu)的通用大數(shù)據(jù)架構(gòu)模式，以及該模式可以涵蓋的典型數(shù)據(jù)處理場景。

2019-07-01 15:40:53

大數(shù)據(jù)架構(gòu)流處理

耗時3天，上億數(shù)據(jù)如何做到秒級查詢？
最近在忙著優(yōu)化集團公司的一個報表。優(yōu)化完成后，報表查詢速度由從半小時以上(甚至查不出)到秒查的質(zhì)變。

2020-08-17 08:21:31

數(shù)據(jù)查詢項目

崛起的GPU數(shù)據(jù)庫大揭秘：多數(shù)據(jù)流實時分析，如何做到快如閃電？
從應(yīng)用上來講，GPU數(shù)據(jù)庫帶來了三大方面的進步：加載速度、實時處理和寬表多條件查詢。它最大的革新點之一在于，提供了一種不依靠索引，并大幅提升速度的手段。所以，要搞清楚GPU數(shù)據(jù)庫，先讓我們聊聊數(shù)據(jù)庫，尤其是數(shù)據(jù)存儲。

2017-08-29 16:25:21

數(shù)據(jù)庫 GPU 數(shù)據(jù)存儲

如何做到單機毫秒完成上億規(guī)模大數(shù)據(jù)常規(guī)統(tǒng)計
雖然現(xiàn)在最火的是AI，但是大數(shù)據(jù)和計算能力仍然是機器學(xué)習(xí)AI算法的重要支撐，我們的業(yè)務(wù)場景大部分是通過手機終端、服務(wù)器日志不斷產(chǎn)生日志數(shù)據(jù)，為此，我們的關(guān)鍵任務(wù)是需要從海量數(shù)據(jù)里統(tǒng)計分析每項產(chǎn)品的去重用戶、新增用戶、pv、uv、dau(日活)、mau(月活)等指標(biāo)，這個過程存儲占用越少，計算時間越快越好。

2017-12-22 10:34:02

大數(shù)據(jù)AI 存儲

Elasticsearch如何做到億級數(shù)據(jù)查詢毫秒級返回？
如果面試的時候碰到這樣一個面試題：ES在數(shù)據(jù)量很大的情況下(數(shù)十億級別)如何提高查詢效率

2019-05-28 09:31:05

Elasticsear 億級數(shù)據(jù)ES

區(qū)塊鏈如何做到將隱藏價值數(shù)字化
今天動蕩的市場，從研究性的思維模式向克服恐懼和不信任的思維模式轉(zhuǎn)變，對“價值的數(shù)字化”至關(guān)重要。要想根除遺留系統(tǒng)中隱藏的價值，或因為低效流程而留下的資金，就意味著要轉(zhuǎn)向新技術(shù)，這種技術(shù)能夠支持將物理和虛擬世界結(jié)合起來，以開發(fā)全新企業(yè)模型和流程。

2021-04-21 15:46:23

區(qū)塊鏈互聯(lián)網(wǎng)技術(shù)

每天處理千億級日志量，Kafka是如何做到的?
之前為大家分享了不少Kafka原理解析類的干貨，今天咱們一起來看看360基于Kafka千億級數(shù)據(jù)量的深度實踐!

2019-12-23 09:25:29

日志 Kafka 消息隊列

如何做到API兼容
本文主要介紹什么是API，以及API兼容的重要性，最終給出方案如何評估API，以及如何做到API兼容。

2011-11-09 15:49:52

API

CIO如何做到并保持數(shù)據(jù)驅(qū)動
五月里不斷發(fā)生一些的事件和出版的書籍將對數(shù)據(jù)、人工智能和分析世界產(chǎn)生深遠的影響。下面我們快速回顧一下在過去一個月可能錯過了的東西。

2021-06-04 05:54:53

CIO 數(shù)據(jù)驅(qū)動數(shù)字轉(zhuǎn)型

每天5萬條告警，騰訊如何做到“咖啡運維”？
大家好，我從2006年進入騰訊至今，差不多12年了，而且是在一個部門里待了12年。

2018-09-13 09:39:03

騰訊運維 IT

綜合布線如何做到防范火災(zāi)數(shù)據(jù)保護
高樓大廈內(nèi)管道密布，各種強弱電線纜縱橫交錯，只要一處有火情，若不能及時撲滅，很快就會蔓延至整幢大樓。同時，在火災(zāi)中喪身的人群中，大部分不是被燒死的，而是由于吸入各種燃燒物所散發(fā)出的濃煙和毒素窒息而死的。在大廈中，煙感探測、消防聯(lián)動、噴水系統(tǒng)、防火卷簾、防火培訓(xùn)、裝修系統(tǒng)以及防火意識等，這些因素都是需要注意的，只有這樣，才能達到防...

2010-01-13 21:58:02

綜合布線數(shù)據(jù)安全

如何做到Oracle完全卸載
這里介紹Oracle完全卸載步驟開始－＞程序－＞OracleOraHome81－＞OracleInstallationProducts－＞UniversalInstaller－＞卸裝所有Oracle產(chǎn)品。

2009-11-20 11:37:11

Oracle完全卸載

蘇寧6億會員是如何做到快速精確分析的？
隨著蘇寧業(yè)務(wù)的高速發(fā)展，大數(shù)據(jù)平臺對海量的業(yè)務(wù)數(shù)據(jù)分析越來越具有挑戰(zhàn)，尤其是在精確去重、復(fù)雜JOIN場景下，如用戶畫像、UV、新老買家、留存、流失用戶等。

2020-06-01 08:41:29

蘇寧分析大數(shù)據(jù)

Confluent在云更新中保護事件數(shù)據(jù)流
ConfluentCloud2022年第二季度更新中的新功能包括，增強的基于角色的訪問控制(RBAC)功能，旨在通過更精確地控制數(shù)據(jù)訪問方式來提高安全性。

2022-04-26 16:48:44

Confluent RBAC 數(shù)據(jù)流

給你10億數(shù)據(jù)，如何做遷移？
某次金融系統(tǒng)遷移項目中，原計劃8小時完成的用戶數(shù)據(jù)同步遲遲未能完成。24小時后監(jiān)控警報顯示：由于全表掃描SELECTFROMusers導(dǎo)致源庫CPU幾乎熔毀，業(yè)務(wù)系統(tǒng)被迫停機8小時。

2025-02-21 08:20:33

在硅谷，如何做到贏家通吃？
互聯(lián)網(wǎng)時代，生死只在一瞬間。如何在競爭激烈人才涌動的市場里自由游走，是每個領(lǐng)袖都在做著的夢。然而，我們究竟應(yīng)該怎么做？

2016-01-08 10:03:07

硅谷通吃互聯(lián)網(wǎng)

服務(wù)變更如何做到高可用？
近期，Cloudflare在更新WAF配置規(guī)則時，因其中一個規(guī)則包含了正則表達式，導(dǎo)致Cloudflare全球機器上的CPU峰值使用率達到100%，在最糟糕的時候，流量下降了82%，對整個互聯(lián)網(wǎng)都產(chǎn)生了明顯的影響。

2019-08-08 10:18:15

運維架構(gòu)技術(shù)

大數(shù)據(jù)時代之hadoop：了解hadoop數(shù)據(jù)流（生命周期）
了解hadoop，首先就需要先了解hadoop的數(shù)據(jù)流，就像了解servlet的生命周期似的。hadoop是一個分布式存儲（hdfs）和分布式計算框架（mapreduce），但是hadoop也有一個很重要的特性：hadoop會將mapreduce計算移動到存儲有部分數(shù)據(jù)的各臺機器上。

2014-11-11 10:47:19

hadoop 數(shù)據(jù)流

Netty如何做到單機百萬并發(fā)？
今天給大家分享一篇萬字長文《微言Netty：百萬并發(fā)基石上的epoll之劍》。

2021-05-24 10:55:05

Netty 單機并發(fā)

Netty 如何做到單機百萬并發(fā)？
說起Netty的異步模型，我相信大多數(shù)人，只要是寫過服務(wù)端的話，都是耳熟能詳?shù)?，bossGroup和workerGroup被ServerBootstrap所驅(qū)動，用起來簡直是如虎添翼。

2022-09-09 08:41:43

Netty 服務(wù)端驅(qū)動

相似話題

數(shù)據(jù)分析
 1669內(nèi)容

數(shù)據(jù)可視化
 308內(nèi)容

商業(yè)智能
 138內(nèi)容

Hadoop
839內(nèi)容
全部話題

同話題下的熱門內(nèi)容

終于明白了！數(shù)字化轉(zhuǎn)型的本質(zhì)、價值與路徑 AI、BI、大數(shù)據(jù)與數(shù)據(jù)科學(xué)的底層邏輯 AI三駕馬車：數(shù)據(jù)、算力和算法，誰更重要？從“人找服務(wù)”到“服務(wù)找人”：政務(wù)數(shù)字化轉(zhuǎn)型的智治新范式字節(jié)面試：StarRocks 中如何優(yōu)化大表 JOIN？Orange：一個免費的交互式數(shù)據(jù)挖掘與機器學(xué)習(xí)平臺 AI數(shù)據(jù)自動化：是革命還是泡沫？揭開“全流程替代”的真相一文帶您讀懂DGI數(shù)據(jù)治理框架

相關(guān)專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長學(xué)院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復(fù)制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學(xué)堂精培企業(yè)培訓(xùn)CTO訓(xùn)練營

51CTO學(xué)堂

51CTO學(xué)堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動態(tài)

站點地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號：110108002980號
營業(yè)執(zhí)照京ICP備09067568號

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請勿轉(zhuǎn)載

營業(yè)執(zhí)照出版物經(jīng)營許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動科技科技行者 TechWeb 艾瑞網(wǎng)站長之家速途網(wǎng)中國經(jīng)濟新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會議中國IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷