自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

開(kāi)源搜索應(yīng)用進(jìn)入企業(yè) 應(yīng)對(duì)大數(shù)據(jù)搜索

開(kāi)源
Twitter、Facebook和國(guó)會(huì)圖書(shū)館等所有這些機(jī)構(gòu)都有令人心煩意亂的大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)必須做出索引并且能夠快速搜索。

  Twitter、Facebook和國(guó)會(huì)圖書(shū)館等所有這些機(jī)構(gòu)都有令人心煩意亂的大量的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。這些數(shù)據(jù)必須做出索引并且能夠快速搜索。在Twitter的案例中,每天要索引大約3億條新信息。

  因此,這種機(jī)構(gòu)將進(jìn)入尚未充分開(kāi)發(fā)的開(kāi)源軟件搜索應(yīng)用領(lǐng)域是不會(huì)讓人感到意外的。這不僅是為了節(jié)省成本,而且是為了迅速地客戶化和修改應(yīng)用程序。此外,開(kāi)源軟件有一個(gè)活躍的社區(qū),能夠幫助解決相關(guān)的問(wèn)題。

[[77603]]

  但是,企業(yè)用戶如何呢?據(jù)市場(chǎng)研究公司Gartner稱(chēng),在普通的企業(yè),目前大約80%的信息是非結(jié)構(gòu)化數(shù)據(jù),如文本、電子郵件、博客和視頻等。這個(gè)比例正在增長(zhǎng)。所有這些數(shù)據(jù)都可能有價(jià)值。目前,每一個(gè)網(wǎng)站預(yù)計(jì)都會(huì)像互聯(lián)網(wǎng)搜索引擎那樣盡快地查詢和制作相關(guān)的結(jié)果。Gartner分析師惠特·安德魯斯(Whit Andrews)稱(chēng),實(shí)際上,人們目前做的一切事情都需要搜索技術(shù)。每一個(gè)人都認(rèn)為搜索功能將嵌入到一切事情中。 

  安德魯斯補(bǔ)充說(shuō),現(xiàn)在,大多數(shù)機(jī)構(gòu)的搜索能力都有限。這些搜索能力通常以SQL查詢?yōu)榛A(chǔ)或者以具體的格式或報(bào)告為基礎(chǔ)。這種范例將很快被打破,因?yàn)榇罅康臄?shù)據(jù)都非常大,并且在每周7天每天24小時(shí)的環(huán)境中迅速地出現(xiàn)。 

***的搜索

  各種規(guī)模的企業(yè)都在開(kāi)始探索開(kāi)源軟件搜索應(yīng)用以便初步了解其收集的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。一個(gè)這種產(chǎn)品是位于加州圣馬特奧市的Lucid Imagination軟件公司開(kāi)發(fā)的開(kāi)源軟件搜索平臺(tái)Lucene Solr。 

  Black Duck Software旗下的開(kāi)源軟件咨詢公司Olliance Group的高級(jí)經(jīng)理格雷格·奧爾森(Greg Olson)稱(chēng),對(duì)于開(kāi)源軟件搜索應(yīng)用的興趣是在三年前開(kāi)始增強(qiáng)的。當(dāng)時(shí),我們看到創(chuàng)建了Lucid Imagination公司。這家公司是開(kāi)源軟件的一個(gè)商業(yè)性技術(shù)支持的來(lái)源。那是很好的指示器,表明了對(duì)這種服務(wù)的主流需求或者圍繞類(lèi)似Lucene的技術(shù)的解決方案的需求。

  安德魯斯稱(chēng),Lucene是為大量使用搜索的人提供的。這是沒(méi)有錯(cuò)誤的。Lucene對(duì)于需要高級(jí)搜索產(chǎn)品或服務(wù)的人是非常重要的。它的典型用戶是需要在技術(shù)應(yīng)用中進(jìn)行大規(guī)模搜索的人。那是使用Lucene的好地方。你需要能夠搜索數(shù)量極大的東西。當(dāng)一個(gè)內(nèi)部網(wǎng)需要在下周四之前進(jìn)行一次搜索的時(shí)候,你看不到使用Lucene的地方。

  還有一些廠商提供基于同樣的Lucene開(kāi)源軟件技術(shù)的輕型搜索工具。例如,搜索團(tuán)隊(duì)負(fù)責(zé)人Aye Thu稱(chēng),在線零售商Zappos.com使用Lucene Solr驅(qū)動(dòng)其每個(gè)月的6300萬(wàn)用戶的查詢。但是,這家公司在內(nèi)部部署了Elasticsearch開(kāi)源軟件搜索引擎,用于非網(wǎng)站重要的系統(tǒng)或者非重要性能的服務(wù)。

  許多其它搜索應(yīng)用廠商最近已經(jīng)被軟件巨頭收購(gòu),產(chǎn)生了其未來(lái)方向的問(wèn)題。微軟在2008年收購(gòu)了搜索應(yīng)用Fast Search & Transfer并且通過(guò)SharePoint使用這個(gè)技術(shù)。在2011年8月,惠普收購(gòu)了英國(guó)的Autonomy。兩年之后,甲骨文宣布計(jì)劃收購(gòu)Endeca。Endeca提供非結(jié)構(gòu)化數(shù)據(jù)管理、網(wǎng)絡(luò)商務(wù)和商務(wù)智能解決方案。

  安德魯斯稱(chēng),雖然這些軟件巨頭都沒(méi)有宣布它們將停止支持新收購(gòu)的搜索引擎,但是,每一次你的技術(shù)提供商被收購(gòu),都會(huì)讓你感到緊張,特別擔(dān)心你是不是另一個(gè)技術(shù)提供商。

  現(xiàn)在,剩下了Lucene Solr作為主要的獨(dú)立的企業(yè)搜素平臺(tái)。Lucene報(bào)告稱(chēng),Lucene Solr軟件每個(gè)月的下載量達(dá)到20至30萬(wàn)份。

  EMC正在使用Lucene Solr為其關(guān)系數(shù)據(jù)庫(kù)服務(wù)建立一個(gè)文本分析插件。EMC負(fù)責(zé)研發(fā)的高級(jí)主管George Chitouras稱(chēng),如果你考察企業(yè)搜索行業(yè),大多數(shù)老牌廠商或者被收購(gòu),或者被擱在一邊。從我的觀點(diǎn)看,最有增長(zhǎng)勢(shì)頭的技術(shù)和成熟最快的技術(shù)是Lucene Solr技術(shù)。

  Chitouras稱(chēng),雖然EMC還沒(méi)有把開(kāi)源軟件搜索功能用于自己的企業(yè)內(nèi)部,但是,他看到幾乎任何行業(yè)都在使用這個(gè)技術(shù)。任何大公司都使用信息檢索,無(wú)論這個(gè)公司是做呼叫中心處理、客戶關(guān)系管理、還是技術(shù)創(chuàng)新管理。

開(kāi)源軟件的選擇

  在2011年年中,在開(kāi)源軟件搜索領(lǐng)域的專(zhuān)家的支持下,Lucid Imagination為該企業(yè)發(fā)布了基于訂閱的企業(yè)軟件包LucidWorks。 目前,有100家企業(yè)客戶使用這個(gè)產(chǎn)品。Lucid在2月份還發(fā)布了基于云的搜索即服務(wù)版的產(chǎn)品。

  Lucid***執(zhí)行官Paul Doscher認(rèn)為,有三種需求推動(dòng)機(jī)構(gòu)使用企業(yè)開(kāi)源軟件搜索。***,人們要使用有效的搜索驅(qū)動(dòng)其網(wǎng)站,但是,他們不想要搜索技術(shù)所需要的麻煩的基礎(chǔ)設(shè)施、管理和維護(hù)。他說(shuō),LucidWorks連接到他們的網(wǎng)站,提取數(shù)據(jù)并且在搜索框中創(chuàng)建回應(yīng),其能力超過(guò)了他們現(xiàn)有的搜索技術(shù)。

  第二,當(dāng)大型企業(yè)要有一個(gè)沙箱以開(kāi)發(fā)原型應(yīng)用程序而又沒(méi)有做這些事情的開(kāi)發(fā)人員技術(shù)專(zhuān)長(zhǎng)、基礎(chǔ)設(shè)施或者硬件的時(shí)候,大型企業(yè)會(huì)轉(zhuǎn)向開(kāi)源軟件搜索。

  第三,企業(yè)會(huì)支持開(kāi)源軟件的選擇,如果他們正在設(shè)法擴(kuò)展他們目前擁有的數(shù)據(jù)價(jià)值的話。Doscher稱(chēng),這種搜索即服務(wù)應(yīng)用對(duì)于這些用戶可能會(huì)有吸引力。同Salesforce.com提供的功能類(lèi)似,Lucid的云應(yīng)用允許用戶獲取在其SaaS應(yīng)用中的信息,然后更有效地搜索這種信息或者把這個(gè)信息與企業(yè)中的其它信息或者網(wǎng)絡(luò)上的其它信息結(jié)合在一起。你可以使用它作為一個(gè)應(yīng)用開(kāi)發(fā)平臺(tái)去開(kāi)發(fā)更豐富的和更有效的信息應(yīng)用。

  Lucid***科學(xué)家Grant Ingersoll還看到一些混合應(yīng)用開(kāi)源軟件搜索的情況。他說(shuō),你在自己的數(shù)據(jù)中心內(nèi)部配置你自己的應(yīng)用,然后你把過(guò)剩的容量用于云支持的版本。

  Doscher稱(chēng),為了保持領(lǐng)先于競(jìng)爭(zhēng)對(duì)手的地位,Lucid Imagination計(jì)劃進(jìn)入商務(wù)智能和數(shù)據(jù)倉(cāng)庫(kù)領(lǐng)域并且與大數(shù)據(jù)技術(shù)結(jié)合在一起。向這些領(lǐng)域使用開(kāi)源軟件搜索技術(shù)將緩解從太多的數(shù)據(jù)、不充分的索引和搜索能力中建立搜索的壓力。

  Doscher表示,企業(yè)未來(lái)存儲(chǔ)的信息量將是驚人的。開(kāi)源軟件搜索技術(shù)將解決這個(gè)數(shù)據(jù)泛濫的問(wèn)題。

  Doscher稱(chēng):“我認(rèn)為谷歌已經(jīng)為互聯(lián)網(wǎng)做了這個(gè)事情。像我們這樣的技術(shù)將通過(guò)幫助客戶化企業(yè)內(nèi)部信息為企業(yè)做這個(gè)事情。最終,你將能夠在企業(yè)內(nèi)部有自然語(yǔ)言的查詢,接觸到企業(yè)運(yùn)行的所有不同的數(shù)據(jù)庫(kù)、應(yīng)用程序和ERP應(yīng)用。這將允許人們得到與他們感興趣的話題有關(guān)的即時(shí)的、實(shí)時(shí)信息。

責(zé)任編輯:黃丹 來(lái)源: LUPA開(kāi)源社區(qū)
相關(guān)推薦

2012-05-09 10:16:33

開(kāi)源搜索平臺(tái)lucene

2016-08-08 17:37:23

大數(shù)據(jù)搜索

2018-07-05 22:38:23

大數(shù)據(jù)搜索引擎SEO

2012-02-27 09:39:11

數(shù)據(jù)中心大數(shù)據(jù)

2016-10-08 22:02:01

大數(shù)據(jù)時(shí)代大數(shù)據(jù)

2016-10-13 09:52:53

大數(shù)據(jù)搜索技術(shù)

2012-10-08 10:47:41

谷歌虛擬大腦

2014-06-23 15:12:29

大數(shù)據(jù)

2012-08-06 09:52:03

Android搜索功能

2013-03-20 10:40:19

大數(shù)據(jù)大數(shù)據(jù)應(yīng)用

2015-08-24 09:18:58

大數(shù)據(jù)

2013-12-31 10:38:22

大數(shù)據(jù)

2012-03-07 23:13:50

應(yīng)用

2013-12-08 21:33:31

谷歌移動(dòng)搜索應(yīng)用內(nèi)搜索

2013-04-16 11:20:42

商務(wù)智能CRMHadoop

2025-01-06 09:03:41

2024-08-07 10:39:47

ChatGPT自然語(yǔ)言企業(yè)數(shù)據(jù)

2011-06-02 11:37:34

Android 檢索

2013-02-28 10:04:27

英特爾Hadoop大數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)