大數(shù)據(jù)初創(chuàng)企業(yè)Paxata獲800萬美元融資
幫助數(shù)據(jù)科學(xué)家干臟活累活的云數(shù)據(jù)服務(wù)初創(chuàng)企業(yè)Paxata剛剛獲得由 Accel Partners 領(lǐng)投的 800 萬美元融資。
Paxata 成立于 2012 年,其聯(lián)合創(chuàng)始人兼 CEO 是 Prakash Nanduri。在數(shù)據(jù)服務(wù)領(lǐng)域,存儲和提供數(shù)據(jù)來源的數(shù)據(jù)管理系統(tǒng)(如 Hadoop)和利用數(shù)據(jù)的分析應(yīng)用之間普遍存在的一道鴻溝,即分析應(yīng)用在對數(shù)據(jù)分析之前需要抽取、處理和整合多個(gè)來源的數(shù)據(jù)才能進(jìn)行分析。這個(gè)數(shù)據(jù)準(zhǔn)備的過程以往大都需要人工處理,耗時(shí)費(fèi)力,Paxata 的目的就是要填補(bǔ)這道鴻溝。
Paxata 的解決方案包括連接、發(fā)掘、轉(zhuǎn)換、合并、發(fā)布、協(xié)作控制等功能。其中連接可將多種來源的數(shù)據(jù)(Hadoop 等,支持 Excel、文本文件、關(guān)系數(shù)據(jù)庫、XML、JSON 等格式)接入然后自動解析數(shù)據(jù)。發(fā)掘功能可支持全文檢索、交互式文本及數(shù)字過濾器、直方圖、熱點(diǎn)圖等幫助識別錯(cuò)誤與重復(fù)或缺失數(shù)據(jù);轉(zhuǎn)換功能可實(shí)時(shí)完成數(shù)據(jù)的分解、連接、去重、空行檢測等。合并功能則可自動檢測多數(shù)據(jù)集的共同屬性然后合并為單一視圖。數(shù)據(jù)準(zhǔn)備的結(jié)果可以發(fā)布到各種 BI 工具上。
Paxata 提供的服務(wù)與ClearStory有點(diǎn)類似,均能從不同的數(shù)據(jù)源抽取數(shù)據(jù),但是 Paxata 還可以將多個(gè)數(shù)據(jù)源進(jìn)一步整合為單一的數(shù)據(jù)集,從而更方便業(yè)務(wù)分析師和可視化工具的理解。
Paxata 目前已經(jīng)與 Tableau、Cloudera 及 Qlikview 等商業(yè)智能公司建立了合作關(guān)系,其客戶包括 Dannon、Box、UBS、Pabst Brewing Company 等。目前該公司共有 28 名員工。
原文鏈接:http://www.36kr.com/p/207272.html