引起硅谷熱議的大數(shù)據(jù)創(chuàng)業(yè)公司
要找到科技行業(yè)的下一個(gè)大創(chuàng)意,你需要沿著谷歌(Goolgle)和LinkedIn位于加州山景城的總部道路再深入幾英里,在一家牙醫(yī)診所隔壁的一棟平房,經(jīng)過一扇沒有標(biāo)志的門,你會(huì)找到剛剛成立一年時(shí)間的Confluent。這家初創(chuàng)公司開發(fā)的數(shù)據(jù)“流”處理技術(shù),客戶包括硅谷一些規(guī)模***和信息最豐富的公司,比如優(yōu)步(Uber)和LinkedIn。到目前為止,Confluent唯一的一間會(huì)議室仍然能夠容納下全公司的人,包括幾位聯(lián)合創(chuàng)始人以及17名員工。每到開會(huì)時(shí),會(huì)議室總是回蕩著***執(zhí)行官杰伊·克雷普斯(Jay Kreps)的笑聲。“我們已經(jīng)從‘車庫創(chuàng)業(yè)’階段邁上了一個(gè)臺(tái)階。”他說話間撲哧笑出聲來。
不過他們也不會(huì)在這個(gè)臺(tái)階上停留太久。Confluent很快將搬進(jìn)位于帕洛阿爾托的一處光鮮亮麗的新公室,那里更襯得上這家公司的身份——Twitter管理推文分析的方法、Netflix的影片推薦功能、優(yōu)步的“峰時(shí)定價(jià)”,這些技術(shù)都是Confluent發(fā)明的。
Confluent正在開源數(shù)據(jù)處理軟件Apache Kafka的基礎(chǔ)上打造業(yè)務(wù),這套軟件是2010年公司創(chuàng)始團(tuán)隊(duì)在LinkedIn工作期間開發(fā)出來的。免費(fèi)版本的Apache Kafka現(xiàn)在已經(jīng)被數(shù)千家公司和數(shù)萬名用戶所使用,其下載量在2015年前六個(gè)月增長了400%。Confluent打算建立一項(xiàng)銷售管理工具和服務(wù)的業(yè)務(wù),讓人們能夠便利地使用Kafka。Confluent剛剛從指數(shù)創(chuàng)投(Index Ventures)和主打早期投資的標(biāo)桿資本(Benchmark)那里完成了一輪2,400萬美元的融資,該公司計(jì)劃將人手?jǐn)U大一倍,并在10月份推出重要的新軟件版本,把實(shí)時(shí)數(shù)據(jù)流的福音傳播給更多的非科技公司。
對(duì)大部分公司來說,不管它們是否屬于科技行業(yè),提高對(duì)數(shù)據(jù)的使用和訪問已經(jīng)成為重中之重。更好的數(shù)據(jù)可以告訴一家公司向誰投放廣告,把銷售電話打給誰,以及什么時(shí)候會(huì)出現(xiàn)需求高峰。不過,可供參考的數(shù)據(jù)量正在達(dá)到無法管理的水平。舉例來說,LinkedIn每天要處理3,000億次跟用戶相關(guān)的事件——請(qǐng)注意,是“億”次。從網(wǎng)站訪問到移動(dòng)電話使用以及各種各樣的傳感器,公司難以實(shí)時(shí)消化那些數(shù)據(jù)。在通常情況下,數(shù)據(jù)是分批次進(jìn)行提取和分析的,但這種分批次的做法可能需要幾小時(shí)來完成計(jì)算。
Confluent的軟件恰恰能夠解決這個(gè)問題,其方法是保證所有輸入的數(shù)據(jù)流是接連不斷到來的,就像有一條巧克力河流入每位客戶的“旺卡工廠”。在瞬時(shí)之間,公司就能根據(jù)這些數(shù)據(jù)流來調(diào)整價(jià)格(比如優(yōu)步的“峰時(shí)定價(jià)”),或者是把***的產(chǎn)品展示給消費(fèi)者(比如Netflix推薦影視作品)。那些優(yōu)化調(diào)整所創(chuàng)造的新信息點(diǎn)又能反饋回“河流”當(dāng)中,讓整個(gè)系統(tǒng)一點(diǎn)點(diǎn)地變得更加智能。“用眼下市面上流行的那些技術(shù),自己數(shù)據(jù)中蘊(yùn)藏那些寶藏只能每天挖一次,還是在午夜時(shí)分。”Confluent聯(lián)合創(chuàng)始人妮哈·納克黑德說道,她是工程師團(tuán)隊(duì)的負(fù)責(zé)人,“而我們把數(shù)據(jù)變成一種中樞神經(jīng)系統(tǒng),這樣你就能更快地對(duì)事件做出反應(yīng)。”
早在Confluent出現(xiàn)之前,通過“流”技術(shù)來處理數(shù)據(jù)的想法就已經(jīng)存在了。但這種做法被局限在大型科技公司內(nèi)部,它們往往籠絡(luò)了一批熟悉數(shù)據(jù)實(shí)時(shí)處理技術(shù)的工程人才,就像Confluent的三位聯(lián)合創(chuàng)始人。35歲的克雷普斯大半輩子都生活在加州,他在LinkedIn的工程師隊(duì)伍中脫穎而出,晉升為該公司相關(guān)性算法和數(shù)據(jù)系統(tǒng)的技術(shù)主管。納克黑德來自印度,她在喬治亞理工學(xué)院(Georgia Institute of Technology)獲得了碩士學(xué)位,之后進(jìn)入LinkedIn為內(nèi)部項(xiàng)目效力,再然后參與了Kafka的研發(fā)。擁有博士學(xué)位的饒軍(Jun Rao,音譯)是北京人,在2010年加入LinkedIn的數(shù)據(jù)團(tuán)隊(duì)之前,他曾在IBM做了十年的研究工作。目前,饒軍專注于Kafka開源項(xiàng)目以及早期用戶的應(yīng)用普及。這三人,連同LinkedIn的其他幾位員工,一道開發(fā)出了基礎(chǔ)的Kafka軟件,并公開發(fā)布,供其他公司使用和改進(jìn)。“這是我們的熱情所在,”饒軍說,“因?yàn)榛A(chǔ)設(shè)施是很多事情達(dá)到目的的手段或方法。”
Kafka很快獲得了早期用戶的青睞,包括Airbnb、Box、思科(Cisco)、PayPal、Square以及雅虎(Yahoo)。去年年初,三人覺得他們可以圍繞Kafka建立一家獨(dú)立的公司。這時(shí)候,他們獲得了LinkedIn高層的強(qiáng)力支持,后者決定對(duì)Confluent進(jìn)行投資,這也是LinkedIn***投資初創(chuàng)公司。目前,Confluent的營收仍然微不足道,但存在強(qiáng)有力的證據(jù)表明,該公司可以迅速打開局面。Confluent出品的Kafka每月下載量達(dá)到了50,000次,在沒有真正銷售團(tuán)隊(duì)或營銷推廣的情況下,該公司已經(jīng)贏得了付費(fèi)客戶,其中包括一家領(lǐng)先的傳統(tǒng)零售商,全球***的廣告公司之一,一家大型信用卡發(fā)卡機(jī)構(gòu),以及一家媒體控股公司。在未來幾個(gè)月,Confluent將為Kafka添加一系列安全功能和教程,讓更多類型的開發(fā)者能夠更容易使用它。指數(shù)創(chuàng)投負(fù)責(zé)投資Confluent的邁克爾·沃爾皮(Mike Volpi)表示:“你擁有的匝道越多,高速公路的價(jià)值就越大。”
分析專家預(yù)測,Confluent的營收到明年能接近1,000萬美元,并且在2017年突破5,000萬美元。Confluent的成功會(huì)讓人想起另一個(gè)受寵的開源項(xiàng)目Docker,其普及率創(chuàng)紀(jì)錄的“容器”計(jì)算工具已經(jīng)發(fā)展成為一款不斷增長的企業(yè)套件,以及一家估值10億美元的公司。Confluent目前的估值可能只有那個(gè)數(shù)字的六分之一左右,但這種情況不會(huì)持續(xù)太久。“我們每新加一個(gè)人手,都能為公司新增數(shù)百萬美元的銷售收入。”來自標(biāo)桿資本的早期投資者埃里克·維什利亞(Eric Vishria)說,“(Confluent)真正有潛力成為一家制造潮流的企業(yè)。”