“人有千算,天則一算”--天算是何物?
原創(chuàng)大數(shù)據(jù),無疑是這幾年最熱門的話題。利用數(shù)據(jù),可以幫助企業(yè)贏得更多的客戶,利用數(shù)據(jù),可以為人們的生活出謀劃策。作為***的中文搜索引擎百度來說,對大數(shù)據(jù)有著天然的優(yōu)勢,通過搜索引擎可以產(chǎn)生大量的數(shù)據(jù),從而進(jìn)行數(shù)據(jù)的組織、分析和挖掘,帶來商業(yè)價值。百度云作為百度的技術(shù)輸出,自然在大數(shù)據(jù)方面也不甘示弱,那么百度云的大數(shù)據(jù)有著怎樣不凡的實(shí)力呢?
大數(shù)據(jù)改變生活
你是否還記得,在2015年的春節(jié)時期,央視的新聞中公布了中國大遷徙的路線圖?
你是否還記得,在2015年的五一小長假,我們足不出戶就知道峨眉山景區(qū)的游客擁擠程度指數(shù)為嚴(yán)重?fù)矶拢?/p>
你是否知道,外賣點(diǎn)餐,送餐人員的行走路線都是經(jīng)過***優(yōu)化的,以保證在最短時間送到用戶手中?
這些都是百度在大數(shù)據(jù)領(lǐng)域的突出表現(xiàn)。2014年,百度發(fā)布大數(shù)據(jù)引擎,***對外開放了自己的大數(shù)據(jù)能力。除了開放自己大數(shù)據(jù)技術(shù)外,百度還將自己的能力產(chǎn)品化,服務(wù)著人們的衣食住行。
我們可以通過百度統(tǒng)計(jì),來查看網(wǎng)站各方面的數(shù)據(jù),從而進(jìn)行商業(yè)布局;我們可以通過百度遷徙產(chǎn)品,來查看全國人口的流向;我們也可以通過景區(qū)熱力圖,來查看景點(diǎn)的擁擠指數(shù),從而對出行做出計(jì)劃。百度的大數(shù)據(jù)不僅僅是停留在技術(shù)上以及商業(yè)方面,還融入到人們的生活,利用科技改變?nèi)藗兊纳睢?/p>
百度云的大數(shù)據(jù)天算
數(shù)據(jù)光是存儲下來,其實(shí)一點(diǎn)意義都沒有,只有利用數(shù)據(jù)提煉出價值,進(jìn)行分析預(yù)測,才是將數(shù)據(jù)變活,從而成為企業(yè)的重要資產(chǎn)。而作為大數(shù)據(jù)背后支撐的云計(jì)算平臺,承載著大量的數(shù)據(jù)運(yùn)算。
俗話說“人算不如天算”,的確,人所掌握的信息數(shù)據(jù)是非常少的,并且人的計(jì)算能力也比較有限,很難處理錯綜復(fù)雜的數(shù)據(jù)。因此,也就要依靠天算,那么天算是什么呢?天算是百度云推出的大數(shù)據(jù)平臺,提供了大數(shù)據(jù)托管服務(wù)、智能API以及眾多業(yè)務(wù)場景模板,幫助用戶實(shí)現(xiàn)智能業(yè)務(wù)。
百度云在大數(shù)據(jù)應(yīng)用方面,更加強(qiáng)調(diào)開源開放,擁抱開源生態(tài),將自己的能力融入到開源社區(qū)中,更多的做出貢獻(xiàn),因此我們也看到,百度云的大數(shù)據(jù)產(chǎn)品中也更多的融入了開源技術(shù),用戶也無需擔(dān)心被特定平臺或者技術(shù)綁定。而開放就是要有開放的心態(tài),與合作伙伴一起共同建設(shè)并完善大數(shù)據(jù)生態(tài)。
此外,百度云希望幫助用戶降低行業(yè)使用成本,所以百度云選擇了特定的領(lǐng)域和行業(yè)進(jìn)行深度的集成支持。目前主要在五個方向上進(jìn)行定制化開發(fā),包括生命科學(xué)、日志分析、金融風(fēng)控、數(shù)字營銷和輿情分析。
天算的強(qiáng)兵利器
天算平臺整合了百度大數(shù)據(jù)服務(wù)和人工智能技術(shù),提供從數(shù)據(jù)收集、存儲、處理分析到應(yīng)用場景的一站式服務(wù)。在天算平臺下,百度云推出了九大產(chǎn)品,包括百度MapReduce BMR、百度機(jī)器學(xué)習(xí)BML、報讀深度學(xué)習(xí)Paddle、百度OLAP引擎Palo、百度Elasticsearch、百度日志服務(wù)BLS、百度批量計(jì)算、百度BigSQL、百度Kafka。
·百度MapReduce:百度MapReduce提供全托管的Hadoop/Spark計(jì)算集群服務(wù),用戶可以按需部署并彈性擴(kuò)展集群,而集群的運(yùn)維工作由百度的運(yùn)維團(tuán)隊(duì)來負(fù)責(zé),用戶可以更加專注于大數(shù)據(jù)處理、分析、報告。
·百度機(jī)器學(xué)習(xí)BML:百度機(jī)器學(xué)習(xí)BML是云端托管的分布式機(jī)器學(xué)習(xí)平臺,提供特征工程、統(tǒng)計(jì)、訓(xùn)練、評估、預(yù)測和模型發(fā)布等功能,覆蓋機(jī)器學(xué)習(xí)全流程,高效易用。
·百度深度學(xué)習(xí)Paddle:百度深度學(xué)習(xí)平臺Paddle是云端托管的分布式深度學(xué)習(xí)平臺,對于序列輸入、稀疏輸入和大規(guī)模數(shù)據(jù)的模型訓(xùn)練有著良好的支持,支持GPU運(yùn)算,支持?jǐn)?shù)據(jù)并行和模型并行,幫助用戶輕松使用深度學(xué)習(xí)技術(shù),降低使用成本。
·百度OLAP引擎Palo:百度OLAP引擎Palo是PB級聯(lián)機(jī)分析處理引擎,為用戶提供穩(wěn)定、高效、低成本的在線報表和多維分析服務(wù)。
·百度Elasticsearch:百度Elasticsearch提供托管的Elasticsearch服務(wù),幫助用戶快速具備對日志、點(diǎn)擊流等海量半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行在線分析的能力。
·百度日志服務(wù)BLS:百度日志服務(wù)是百度云提供的日志收集與投遞服務(wù),依托云計(jì)算與大數(shù)據(jù)的技術(shù)優(yōu)勢,用戶只需簡單地部署配置,就可以獲取到海量日志,低成本、高效率地實(shí)現(xiàn)日志的采集、聚合與傳輸,輕松應(yīng)對設(shè)備運(yùn)維管理、商業(yè)趨勢洞察、安全監(jiān)控審計(jì)等業(yè)務(wù)場景。
·百度批量計(jì)算(Baidu Batch Compute)是高效運(yùn)行大規(guī)模并行作業(yè)的分布式云計(jì)算服務(wù),支持海量規(guī)模的并發(fā)作業(yè),系統(tǒng)自動完成數(shù)據(jù)加載和作業(yè)調(diào)度、并彈性縮放計(jì)算資源。
·百度BigSQL:通過SQL接口實(shí)現(xiàn)超大規(guī)模(TB級至PB級)結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)集上的即席查詢,洞察行業(yè)實(shí)現(xiàn)智能商業(yè),而無須擔(dān)心集群與運(yùn)維。
·百度Kafka:基于Apache Kafka的分布式、高可擴(kuò)展、高通量的消息托管服務(wù),用戶可以直接享用Kafka的功能而無需考慮集群運(yùn)維,并按照使用量付費(fèi)。