自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用于大數(shù)據(jù)處理高性能計(jì)算的4個(gè)實(shí)現(xiàn)步驟

大數(shù)據(jù)
如果企業(yè)需要采用處理其大數(shù)據(jù)的高性能計(jì)算,則在內(nèi)部部署運(yùn)營(yíng)可能效果最佳。以下是企業(yè)需要了解的內(nèi)容,其中包括高性能計(jì)算和Hadoop的不同之處。在大數(shù)據(jù)領(lǐng)域,并非每家公司都需要高性能計(jì)算(HPC),但幾乎所有使用大數(shù)據(jù)的企業(yè)都采用了Hadoop式分析計(jì)算。

如果企業(yè)需要采用處理其大數(shù)據(jù)的高性能計(jì)算,則在內(nèi)部部署運(yùn)營(yíng)可能效果最佳。以下是企業(yè)需要了解的內(nèi)容,其中包括高性能計(jì)算和Hadoop的不同之處。

在大數(shù)據(jù)領(lǐng)域,并非每家公司都需要高性能計(jì)算(HPC),但幾乎所有使用大數(shù)據(jù)的企業(yè)都采用了Hadoop式分析計(jì)算。

用于大數(shù)據(jù)處理的高性能計(jì)算的4個(gè)實(shí)現(xiàn)步驟

HPC和Hadoop之間的區(qū)別很難區(qū)分,因?yàn)榭梢栽诟咝阅苡?jì)算(HPC)設(shè)備上運(yùn)行Hadoop分析作業(yè),但反之亦然。 HPC和Hadoop分析都使用并行數(shù)據(jù)處理,但在Hadoop 和分析環(huán)境中,數(shù)據(jù)存儲(chǔ)在硬件上,并分布在該硬件的多個(gè)節(jié)點(diǎn)上。在高性能計(jì)算(HPC)中,數(shù)據(jù)文件的大小要大得多,數(shù)據(jù)存儲(chǔ)集中。高性能計(jì)算(HPC)由于其文件體積龐大,還需要更昂貴的網(wǎng)絡(luò)通信(如InfiniBand),因此需要高吞吐量和低延遲。

企業(yè)首席信息官的目的很明確:如果企業(yè)可以避免使用HPC并只將Hadoop用于分析,可以執(zhí)行此操作。這種方式成本更低,更易于員工操作,甚至可以在云端運(yùn)行,其他公司(如第三方供應(yīng)商)可以運(yùn)行它。

不幸的是,對(duì)于需要高性能計(jì)算(HPC)進(jìn)行處理的生命科學(xué)、氣象、制藥、采礦、醫(yī)療、政府、學(xué)術(shù)的企業(yè)和機(jī)構(gòu)來說,全部采用Hadoop是不可能的。由于文件規(guī)模較大,處理需求極其嚴(yán)格,采用數(shù)據(jù)中心或與采用云計(jì)算都不是很好的方案。

簡(jiǎn)而言之,高性能計(jì)算(HPC)是一個(gè)在數(shù)據(jù)中心內(nèi)部運(yùn)行的大數(shù)據(jù)平臺(tái)的完美示例。正因?yàn)槿绱?,企業(yè)如何確保其投資巨大的硬件完成需要的工作成為了一個(gè)挑戰(zhàn)。

大數(shù)據(jù)Hadoop和HPC平臺(tái)提供商PSCC Labs首席戰(zhàn)略官Alex Lesser表示:“這是必須使用HPC來處理其大數(shù)據(jù)的許多公司面臨的挑戰(zhàn)。大多數(shù)這些公司都有支持傳統(tǒng)IT基礎(chǔ)設(shè)施,他們很自然地采用了這種思路,自己構(gòu)建Hadoop分析計(jì)算環(huán)境,因?yàn)檫@使用了他們已經(jīng)熟悉的商用硬件,但是對(duì)于高性能計(jì)算(HPC)來說,其響應(yīng)通常是讓供應(yīng)商來處理。”

考慮采用高性能計(jì)算(HPC)的公司需要采取以下四個(gè)步驟:

1.確保企業(yè)高層對(duì)高性能計(jì)算(HPC)的支持

企業(yè)的高層管理人員和董事會(huì)成員不一定要求是高性能計(jì)算領(lǐng)域的專家,但絕不能沒有他們的理解和支持。這些管理人員都應(yīng)該對(duì)高性能計(jì)算(HPC)有足夠的了解,以及可以為企業(yè)明確支持可能制定的大規(guī)模硬件、軟件和培訓(xùn)投資。這意味著他們必須在兩個(gè)方面受到教育:(1)HPC是什么,為什么它與普通分析不同,需要采用特殊的硬件和軟件。(2)為什么企業(yè)需要使用HP​​C而不是原有的分析來實(shí)現(xiàn)其業(yè)務(wù)目標(biāo)。這兩項(xiàng)教育工作都應(yīng)由首席信息官(CIO)或首席開發(fā)官(CDO)負(fù)責(zé)。

Lesser表示:“采用HPC的最積極的公司是那些相信他們真正的科技公司,他們指的是亞馬遜AWS云服務(wù),最初只是亞馬遜公司的零售業(yè)務(wù),現(xiàn)在已成為一個(gè)龐大的利潤(rùn)中心。”

2.考慮一個(gè)可以自定義的預(yù)配置硬件平臺(tái)

PSSC Labs等公司提供預(yù)打包和預(yù)配置的HPC硬件。“我們有一個(gè)基于HPC最佳實(shí)踐的基本軟件包,可以與客戶一起根據(jù)客戶的計(jì)算需求定制這個(gè)基礎(chǔ)軟件包。”Lesser說,他指出幾乎每個(gè)數(shù)據(jù)中心都必須進(jìn)行一些定制。

3.了解回報(bào)

與任何IT投資一樣,HPC必須符合成本效益,并且企業(yè)應(yīng)該能夠獲得投資回報(bào)(ROI),這一點(diǎn)在管理層和董事會(huì)的頭腦中已經(jīng)闡明。“一個(gè)很好的例子是飛機(jī)設(shè)計(jì)。”Lesser說。 “高性能計(jì)算(HPC)的投資規(guī)模很大,但是當(dāng)公司發(fā)現(xiàn)它可以使用HPC進(jìn)行設(shè)計(jì)模擬并獲得5個(gè)9的準(zhǔn)確性,并且不再需要租用物理風(fēng)洞時(shí),就會(huì)很快收回了HPC投資。”

4.培訓(xùn)自己的IT員工

HPC計(jì)算對(duì)企業(yè)的IT員工來說不是一個(gè)簡(jiǎn)單的過渡,但是如果企業(yè)要運(yùn)行內(nèi)部部署操作,則應(yīng)該讓團(tuán)隊(duì)定位以實(shí)現(xiàn)自給自足。

最初,企業(yè)可能需要聘請(qǐng)外部咨詢?nèi)藛T才能開始工作。但咨詢?nèi)蝿?wù)的目標(biāo)應(yīng)始終是雙重目標(biāo):(1)讓HPC應(yīng)用程序繼續(xù)運(yùn)行,(2)將知識(shí)傳授給員工,以便他們能夠接管操作。企業(yè)不應(yīng)該滿足于此。

HPC團(tuán)隊(duì)的核心是需要一名數(shù)據(jù)科學(xué)家,他能夠開發(fā)高性能計(jì)算所需的高度復(fù)雜的算法來回答企業(yè)的問題。它還需要一名精通C +或Fortran技能,并能夠在并行處理環(huán)境中工作的強(qiáng)大系統(tǒng)的程序員,或者是網(wǎng)絡(luò)通信專家。

“最重要的是,如果企業(yè)每?jī)芍芤\(yùn)行一次或兩次工作,就應(yīng)該到云端來承載其HPC。”Lesser說,“但是如果企業(yè)正在使用HPC資源和運(yùn)行作業(yè),如制藥公司或生物學(xué)公司可能每天多次運(yùn)行,那么在云端運(yùn)行就會(huì)浪費(fèi)資金,應(yīng)該考慮運(yùn)行自己的內(nèi)部操作。”

責(zé)任編輯:未麗燕 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2016-10-17 13:56:48

大數(shù)據(jù)大數(shù)據(jù)分析

2015-11-09 09:58:31

大數(shù)據(jù)Lambda架構(gòu)

2023-12-18 11:21:40

MongoDB數(shù)據(jù)庫(kù)

2017-10-17 12:17:13

大數(shù)據(jù)云計(jì)算云端

2017-07-26 17:45:05

2017-11-14 05:04:01

大數(shù)據(jù)編程語(yǔ)言數(shù)據(jù)分析

2017-07-21 14:22:17

大數(shù)據(jù)大數(shù)據(jù)平臺(tái)數(shù)據(jù)處理

2018-12-07 14:50:35

大數(shù)據(jù)數(shù)據(jù)采集數(shù)據(jù)庫(kù)

2020-11-02 15:56:04

大數(shù)據(jù)數(shù)據(jù)庫(kù)技術(shù)

2021-04-13 14:39:08

谷歌Logica語(yǔ)言

2015-12-17 14:53:59

大數(shù)據(jù)云計(jì)算技術(shù)

2018-07-04 14:15:48

2018-05-28 08:13:17

數(shù)據(jù)中心性能IT基礎(chǔ)

2012-09-20 10:15:41

大數(shù)據(jù)處理挑戰(zhàn)服務(wù)器性能

2023-08-25 15:13:16

大數(shù)據(jù)云計(jì)算

2021-07-20 15:37:37

數(shù)據(jù)開發(fā)大數(shù)據(jù)Spark

2023-11-29 13:56:00

數(shù)據(jù)技巧

2020-11-09 17:15:08

戴爾

2020-07-22 08:13:22

大數(shù)據(jù)

2022-11-17 11:52:35

pandasPySpark大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)