Hadoop成功實(shí)施案例之旅游行業(yè)
譯文前言:上文講過(guò)《Hadoop成功部署案例之eBay篇》與《Hadoop成功部署案例之eBay篇》后,為大家?guī)?lái)第三篇Hadoop成功案例介紹。在本文中為大家介紹的是Orbitz Worldwide旗下的全球消費(fèi)者旅游品牌每天要處理數(shù)以百萬(wàn)計(jì)的搜索和交易。
Orbitz Worldwide旗下的全球消費(fèi)者旅游品牌每天要處理數(shù)以百萬(wàn)計(jì)的搜索和交易。通過(guò)關(guān)系數(shù)據(jù)庫(kù)等傳統(tǒng)系統(tǒng),存儲(chǔ)和處理這類活動(dòng)生成的越來(lái)越龐大的數(shù)據(jù)量變得越來(lái)越難,因而這家公司求助于Hadoop,幫助消除部分復(fù)雜性。
這家公司的首席軟件工程師Jonathan Seidman和另一名工程師Ramesh Venkataramiah一向樂(lè)于討論這家旅游網(wǎng)站的基礎(chǔ)設(shè)施如何加以管理。他們倆在最近面向多位聽眾的一次交流中討論了Hive的作用,尤其是對(duì)一些關(guān)鍵搜索功能所起的作用。
Hadoop和Hive幫助這家在線旅游中心處理各項(xiàng)事務(wù):改進(jìn)讓游客可以迅速篩選和分類酒店的功能,到查看更宏觀內(nèi)部趨勢(shì)的功能,不一而足。據(jù)這兩位工程師聲稱,Orbitz的大數(shù)據(jù)問(wèn)題讓它成為運(yùn)用Hadoop的“典型”。他們倆表示,面對(duì)很分散的服務(wù)網(wǎng)絡(luò)——這些服務(wù)每天生成數(shù)百GB大小的當(dāng)天日志,處理每天數(shù)百萬(wàn)的這些搜索和交易,這絕非易事。
在上面的幻燈片中,他們倆演示了如何利用Hadoop和Hive來(lái)處理數(shù)據(jù);可能更重要的是,演示了什么使得這家公司的特定問(wèn)題最適合用Hadoop來(lái)處理(因?yàn)樾枰嵝训氖且稽c(diǎn),并非所有業(yè)務(wù)都有Hadoop的用武之地。)