如何從SaaS應(yīng)用程序查詢和提取數(shù)據(jù)?
譯文【51CTO.com快譯】每個(gè)SaaS應(yīng)用程序背后的數(shù)據(jù)庫(kù)存儲(chǔ)有關(guān)員工、供應(yīng)商、客戶及其他合作伙伴的業(yè)務(wù)信息。SaaS應(yīng)用程序支持諸多工作流程,比如面向銷售和營(yíng)銷的CRM、面向財(cái)務(wù)的云ERP、面向人力資源的勞動(dòng)力管理以及其他企業(yè)和部門服務(wù)。如今,許多公司使用眾多SaaS應(yīng)用程序:從Salesforce、Slack、Workday和Atlassian之類的主流產(chǎn)品,到許多小型的SaaS工具,不一而足。
SaaS應(yīng)用程序不會(huì)在孤島中運(yùn)行,大多數(shù)企業(yè)需要將它們的功能與私有云或公共云中管理的其他企業(yè)應(yīng)用程序集成起來(lái)。
如果跨多個(gè)應(yīng)用程序的工作流程需要集成應(yīng)用程序,開(kāi)發(fā)團(tuán)隊(duì)可以利用SaaS平臺(tái)的API來(lái)觸發(fā)從一個(gè)平臺(tái)到另一個(gè)平臺(tái)的事件。許多應(yīng)用程序和服務(wù)需要集成時(shí),可以選擇Boomi、SnapLogic或MuleSoft之類的企業(yè)集成平臺(tái)。如果需要遵循“如果這樣,需要那樣”模式的輕量級(jí)集成,IFTTT平臺(tái)可以提供有效的集成。如果開(kāi)發(fā)團(tuán)隊(duì)在開(kāi)發(fā)連接到多個(gè)SaaS和企業(yè)工作流程的新應(yīng)用程序,還應(yīng)探究Appian、OutSystems和PowWow之類的低代碼平臺(tái)。
利用SaaS數(shù)據(jù)以滿足不同的業(yè)務(wù)需求
如果你需要將來(lái)自SaaS平臺(tái)的數(shù)據(jù)與其他數(shù)據(jù)源集成起來(lái)怎么辦?可能需要跨SaaS工具集成數(shù)據(jù),出于這幾個(gè)原因:
- 業(yè)務(wù)分析員想使用該數(shù)據(jù)來(lái)開(kāi)發(fā)報(bào)告和儀表板。
- 數(shù)據(jù)科學(xué)團(tuán)隊(duì)想要用于機(jī)器學(xué)習(xí)實(shí)驗(yàn)的數(shù)據(jù)。
- 業(yè)務(wù)團(tuán)隊(duì)想要集中數(shù)據(jù)以支持工作流程及其他類型的應(yīng)用程序。比如說(shuō),營(yíng)銷團(tuán)隊(duì)常常使用客戶數(shù)據(jù)平臺(tái)或主數(shù)據(jù)平臺(tái)來(lái)集中有關(guān)客戶、產(chǎn)品和其他業(yè)務(wù)實(shí)體的數(shù)據(jù)。
- IT團(tuán)隊(duì)?wèi)?yīng)提取備份所需的數(shù)據(jù),或?qū)?shù)據(jù)遷移到其他平臺(tái)。
- 法務(wù)團(tuán)隊(duì)有時(shí)需要對(duì)基礎(chǔ)數(shù)據(jù)執(zhí)行法律發(fā)現(xiàn)。
- 數(shù)據(jù)管理員常常想要清理、轉(zhuǎn)換或豐富基礎(chǔ)數(shù)據(jù)。
當(dāng)然,你可以利用SaaS平臺(tái)的API來(lái)提取數(shù)據(jù),但這可能需要大量的開(kāi)發(fā)工作來(lái)學(xué)習(xí)API、了解SaaS平臺(tái)的數(shù)據(jù)模型、為任何新數(shù)據(jù)創(chuàng)建數(shù)據(jù)存儲(chǔ)區(qū)、編寫代碼以加載數(shù)據(jù),并為任何轉(zhuǎn)換開(kāi)發(fā)邏輯。此外,IT團(tuán)隊(duì)要定義托管該應(yīng)用程序或服務(wù)的云或數(shù)據(jù)中心基礎(chǔ)架構(gòu)。最后,任何旨在按計(jì)劃或按需要運(yùn)行的數(shù)據(jù)集成都需要日常的支持。對(duì)于面臨其他更重要的優(yōu)先事項(xiàng)的開(kāi)發(fā)團(tuán)隊(duì)和IT部門而言,從頭開(kāi)始開(kāi)發(fā)集成可能成本高昂。
另一種方法是考慮數(shù)據(jù)集成、數(shù)據(jù)流、ETL(提取轉(zhuǎn)換和加載)或其他數(shù)據(jù)準(zhǔn)備平臺(tái)。處理頻繁變化的大量數(shù)據(jù)時(shí),使用數(shù)據(jù)集成平臺(tái)可能是最佳方法,因?yàn)檫@種平臺(tái)可實(shí)現(xiàn)靈活的提取和轉(zhuǎn)換。然而,在最終用戶訪問(wèn)和使用信息之前,它們也需要事先開(kāi)發(fā)集成機(jī)制。
可能需要查詢和管理SaaS數(shù)據(jù)的更輕量級(jí)的手段。有時(shí),這種方法對(duì)于快速實(shí)驗(yàn)、發(fā)現(xiàn)和構(gòu)建原型很有用。有時(shí),這種方法可以輕松用于運(yùn)營(yíng)或生產(chǎn)需求,尤其在數(shù)據(jù)量很少且查詢吞吐量不大的情況下。以下是三種選擇。
1. 直接查詢SaaS應(yīng)用程序的BI平臺(tái)
如果你的主要需求是報(bào)告,那么許多自助式BI和數(shù)據(jù)可視化平臺(tái)可以直接連接到更流行的SaaS應(yīng)用程序。
- Tableau可以連接到Intuit Quickbook、Google Analytics、LinkedIn Sales Navigator、ServiceNow、Eloqua、Marketo和Salesforce等平臺(tái)。
- Microsoft Power BI還與Adobe Analytics、Facebook、GitHub、MailChimp、Stripe、Quick Base和Zendesk等在線服務(wù)集成。
- Domo聲稱有1000多個(gè)連接件,支持的平臺(tái)包括HubSpot、Jira、Instagram、Qualtrics、Shopify、SurveyMonkey、Twitter和Workday等。
至少,這些集成提供了一種查詢和發(fā)現(xiàn)基礎(chǔ)SaaS數(shù)據(jù)源的簡(jiǎn)易方法。往好里說(shuō),現(xiàn)成的集成足以使最終用戶創(chuàng)建所需的數(shù)據(jù)混合、報(bào)告和儀表板。
有幾個(gè)方面要考慮。
- 當(dāng)列有匹配的鍵時(shí),這些平臺(tái)可支持連接和數(shù)據(jù)混合。如果在集成數(shù)據(jù)源或?qū)⑵渑c其他數(shù)據(jù)源混合之前需要大量的數(shù)據(jù)轉(zhuǎn)換,它們就變得較難使用。
- 評(píng)估是否通過(guò)實(shí)時(shí)查詢執(zhí)行SaaS數(shù)據(jù)集成,或者數(shù)據(jù)是提取還是緩存。
- 如果SaaS應(yīng)用程序含有大量數(shù)據(jù)、與許多其他數(shù)據(jù)源存在復(fù)雜的連接,或者儀表板將被許多用戶同時(shí)使用,性能可能是一個(gè)因素。
2. 模擬ODBC、JDBC、OData或其他驅(qū)動(dòng)程序的平臺(tái)
如果業(yè)務(wù)需要的不僅僅是報(bào)告和儀表板,仍需要輕量級(jí)的集成方法,那么一些商業(yè)工具可將SaaS API轉(zhuǎn)換成標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)驅(qū)動(dòng)程序,比如ODBC、JDBC或OData。對(duì)于常用SaaS平臺(tái)的驅(qū)動(dòng)程序而言,兩個(gè)選擇是Progress DataDirect和CData Driver Technologies。
如果數(shù)據(jù)科學(xué)團(tuán)隊(duì)想要在提取數(shù)據(jù)以供分析之前對(duì)SaaS數(shù)據(jù)庫(kù)執(zhí)行臨時(shí)查詢,驅(qū)動(dòng)程序方法可能最有用。對(duì)于需要實(shí)時(shí)查詢SaaS應(yīng)用程序數(shù)據(jù)的應(yīng)用開(kāi)發(fā)人員來(lái)說(shuō),這也是不錯(cuò)的選擇。
開(kāi)發(fā)和數(shù)據(jù)科學(xué)團(tuán)隊(duì)?wèi)?yīng)調(diào)查該集成的性能,尤其是在需要大量查詢、龐大數(shù)據(jù)集或低延遲的情況下。此外,許多SaaS應(yīng)用程序根據(jù)API使用情況來(lái)限制客戶或向客戶收費(fèi),因此如果需要更高的查詢量或數(shù)據(jù)量,這可能是個(gè)因素。
3. 可將SaaS數(shù)據(jù)同步到云數(shù)據(jù)庫(kù)的輕量級(jí)ETL平臺(tái)
最后一個(gè)方法是將數(shù)據(jù)集成從SaaS應(yīng)用程序搬到貴企業(yè)建立和管理的云數(shù)據(jù)庫(kù)中。該策略增添了一些操作復(fù)雜性和成本,如果需要實(shí)時(shí)查詢SaaS應(yīng)用程序數(shù)據(jù),可能不是理想的選擇。但它確實(shí)有幾個(gè)優(yōu)點(diǎn):
- 它讓企業(yè)可以更大程度地控制業(yè)務(wù)用戶、數(shù)據(jù)科學(xué)家(包括平民數(shù)據(jù)科學(xué)家)和應(yīng)用開(kāi)發(fā)人員使用的數(shù)據(jù)庫(kù)平臺(tái)和數(shù)據(jù)架構(gòu)。平臺(tái)和架構(gòu)應(yīng)滿足容量、性能和延遲等方面的要求。
- 獨(dú)立于SaaS數(shù)據(jù)庫(kù)存儲(chǔ)數(shù)據(jù)可提供更大的靈活性,可根據(jù)下游用戶和應(yīng)用程序的要求,靈活地轉(zhuǎn)換、連接、清理或聚合數(shù)據(jù)。
- 如果面向查詢?cè)摂?shù)據(jù)的數(shù)據(jù)安全、數(shù)據(jù)隱私或其他數(shù)據(jù)治理控制措施有別于SaaS應(yīng)用程序中的訪問(wèn)和權(quán)利控制措施,那么可能需要將數(shù)據(jù)托管在單獨(dú)的數(shù)據(jù)庫(kù)中。
- 獨(dú)立于SaaS平臺(tái)托管數(shù)據(jù)對(duì)于更高的數(shù)據(jù)量和查詢量需求而言可能更具成本效益。
雖然你可以將該集成與數(shù)據(jù)集成或準(zhǔn)備平臺(tái)結(jié)合起來(lái),但是仍有一些SaaS數(shù)據(jù)集成平臺(tái)擁有可直接連接到許多SaaS應(yīng)用程序的機(jī)制。如果你的目標(biāo)是將數(shù)據(jù)從SaaS應(yīng)用程序流式傳輸?shù)皆茢?shù)據(jù)庫(kù),Talend旗下的Stitch是一款即插即用的解決方案。你可以選擇要復(fù)制的數(shù)據(jù)和復(fù)制頻次,但是它不提供用于轉(zhuǎn)換或過(guò)濾數(shù)據(jù)的任何工具。Skyvia提供了一款類似的產(chǎn)品,兩者都有讓開(kāi)發(fā)團(tuán)隊(duì)可以試一試集成的免費(fèi)版本。谷歌云旗下的Alooma致力于將數(shù)據(jù)轉(zhuǎn)移至Google BigQuery、Amazon Redshift和Snowflake之類的大數(shù)據(jù)平臺(tái),并提供一些數(shù)據(jù)轉(zhuǎn)換功能。
如果貴公司在使用許多SaaS平臺(tái),那么一刀切的策略可能行不通。每條集成路徑都支持不同的SaaS集成,集成的類型必須與預(yù)期的業(yè)務(wù)需求相一致。比較工具并考慮多種選擇是一條優(yōu)選實(shí)踐,數(shù)據(jù)集成需求變化時(shí)尤為如此。
原文標(biāo)題:How to query and extract data from SaaS applications,作者:Isaac Sacolick
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】