如何通過搜索引擎充分利用企業(yè)資產(chǎn)?
數(shù)據(jù)和知識是所有企業(yè)的核心資產(chǎn)?,F(xiàn)代搜索引擎可以利用這些知識,這樣員工就可以找到它的源頭和內(nèi)容。企業(yè)可以構(gòu)建一個(gè)強(qiáng)大的搜索引擎,并且專注于企業(yè)的應(yīng)用領(lǐng)域、用戶角色和業(yè)務(wù)目標(biāo)。
2016年初宣布了谷歌搜索的消亡,這標(biāo)志著錯(cuò)誤的企業(yè)統(tǒng)一搜索解決方案的夢想終結(jié)。取而代之的是愈加智能化的搜索引擎,這些應(yīng)用程序可以搜索、分析和評估企業(yè)信息。這不僅與傳統(tǒng)文檔中的搜索有關(guān),還涉及數(shù)據(jù)庫中的數(shù)據(jù)和語義圖中的實(shí)體和聯(lián)系。收集所有來自于企業(yè)內(nèi)部的信息,再加上來自外部環(huán)境的其他數(shù)據(jù),匯集后在搜索、分析和評估的應(yīng)用程序上進(jìn)行分層計(jì)算,即形成了企業(yè)級搜索應(yīng)用的新世界。
隨著應(yīng)用系統(tǒng)越來越復(fù)雜,信息量越來越大,傳統(tǒng)的關(guān)鍵字搜索技術(shù)已無法滿足企業(yè)對海量數(shù)據(jù)和各種文件類型的定位查找。為解決這一難題,本文詳細(xì)講解了啟動(dòng)企業(yè)搜索項(xiàng)目需注意的10個(gè)要點(diǎn)。
要點(diǎn)一:要有雄心 可以比谷歌做得更好
許多搜索研發(fā)團(tuán)隊(duì)對谷歌在網(wǎng)絡(luò)搜索方面的成就感到畏懼。但只要有雄心,同樣可以做得更好!谷歌擁有優(yōu)秀的技術(shù)、硬件和一支高精尖人才大軍,每天都要提供數(shù)以十億計(jì)的搜索服務(wù)。但是企業(yè)擁有所有信息:各類文檔、產(chǎn)品、內(nèi)部網(wǎng)站和客戶數(shù)據(jù)。且企業(yè)對于自身發(fā)展領(lǐng)域、用戶角色和業(yè)務(wù)目標(biāo)都有更為深度的理解,亦或親自同用戶進(jìn)行交流。雖然谷歌可以在網(wǎng)絡(luò)上大行其道,但搜索研發(fā)團(tuán)隊(duì)卻可以深化應(yīng)用到企業(yè)中去。
要點(diǎn)二:處理搜索
當(dāng)用戶在文本框中輸入幾個(gè)單詞時(shí),這對應(yīng)用程序來說是一個(gè)挑戰(zhàn),它要找出用戶真正想要的信息。使用搜索技術(shù),例如詞干、同義詞、范圍不同的關(guān)鍵詞,以確保找到所有正確的信息。然后應(yīng)用語義圖關(guān)聯(lián)現(xiàn)實(shí)世界的語境,就像要求一位知識淵博的圖書管理員尋找一本書一樣。幫助企業(yè)了解用戶想要的拼寫檢查以及自動(dòng)完成的檢索推薦等。搜索引擎在實(shí)際使用上為用戶提供一目了然的結(jié)果摘要,并在適用范圍內(nèi)指導(dǎo)用戶以高效的方法搜索。
要點(diǎn)三:處理數(shù)據(jù)
注釋數(shù)據(jù),以便快捷地找到它。添加元數(shù)據(jù):發(fā)布日期、作者、關(guān)鍵詞和出處;查找并注釋實(shí)體和屬性:人員、地點(diǎn)、公司名稱、信用卡號碼等。隨后,將每個(gè)文檔添加標(biāo)記并劃分不同的權(quán)限,使搜索進(jìn)程快速得到響應(yīng)。
要點(diǎn)四:獲得更優(yōu)的搜索結(jié)果
搜索結(jié)果頁面不必僅是鏈接列表。要使每個(gè)搜索結(jié)果盡可能包含豐富的信息:鏈接、與搜索關(guān)鍵字匹配該網(wǎng)頁的文字摘要和一些元數(shù)據(jù)(較晚抓取頁面的時(shí)間、網(wǎng)頁文件概況、相關(guān)關(guān)鍵詞的其他網(wǎng)站鏈接和其他相關(guān)信息)。為了獲得更優(yōu)的搜索結(jié)果,需考慮使用包含圖片信息的卡片。當(dāng)這些卡片式信息具有自然屬性的分組時(shí),最終搜索結(jié)果可通過不同頁面跳轉(zhuǎn)相連接。添加關(guān)于整個(gè)結(jié)果集的信息:一個(gè)信息面板,描述搜索中的主要術(shù)語、方面和一些圖表。
要點(diǎn)五:切忌重復(fù)同樣的搜索
針對每位用戶最喜歡的搜索集,在他頭一次登錄時(shí)的搜索框上顯示結(jié)果摘要。如果用戶需要知道一些新的信息,比如:每當(dāng)有關(guān)于止痛藥對網(wǎng)球肘影響的新研究,一旦發(fā)現(xiàn)與搜索結(jié)果相匹配的信息,即刻返回系統(tǒng)一封電子郵件或一條短信。
要點(diǎn)六:跟蹤一切相關(guān)信息
跟蹤所有搜索,并跟蹤這些搜索的結(jié)果。搜索“成功”意味著對用戶快速返回結(jié)果,點(diǎn)擊最上面的結(jié)果,閱讀并繼續(xù)前進(jìn)。如果搜索失敗,調(diào)整應(yīng)用程序、搜索處理和結(jié)果數(shù)據(jù)。通過以上方法調(diào)整搜索進(jìn)程,可以考慮創(chuàng)建一個(gè)特殊信息面板或登錄界面,并重新引導(dǎo)用戶搜索。每日列出明細(xì)表,之后仔細(xì)排出優(yōu)先次序。
要點(diǎn)七:不斷改進(jìn) 適應(yīng)變化
用戶的搜索量每天都在變化。數(shù)據(jù)也是如此,為搜索提供的一些背景環(huán)境也發(fā)生著變化。每天改進(jìn)搜索,并不斷尋找提高用戶體驗(yàn)度的方法:為其提供更加個(gè)性化、智能化和數(shù)據(jù)可視化的建議。
要點(diǎn)八:不要忘記安全
一旦企業(yè)級搜索超越了內(nèi)網(wǎng)各個(gè)部分的基礎(chǔ)知識范疇,它就必須遵守公司的隱私和安全標(biāo)準(zhǔn)。理想情況下,搜索應(yīng)用程序?qū)⒅萌氲浆F(xiàn)有的安全基礎(chǔ)設(shè)施之中。
要點(diǎn)九:聽起來很難 但谷歌并不會這么做
谷歌網(wǎng)絡(luò)搜索不需要處理安全問題,但企業(yè)級搜索需要考慮安全。相關(guān)其他的提示有:谷歌擴(kuò)大搜索范圍;繪制一個(gè)豐富的搜索結(jié)果頁面,其中包含了每個(gè)結(jié)果和整體結(jié)果集的信息;跟蹤每一條搜索和結(jié)果數(shù)據(jù),以便更好地進(jìn)行搜索與反饋。谷歌沒有做的一件事就是注釋數(shù)據(jù);相反,它記錄了網(wǎng)站開發(fā)者應(yīng)該如何注釋數(shù)據(jù)便于谷歌定位它。
要點(diǎn)十:最終如何完成搜索引擎的架構(gòu)?
找到支持搜索應(yīng)用的程序,而不僅僅是搜索引擎。該平臺必須支持上文中討論過的所有技術(shù),并且必須能夠匯集各種信息——傳統(tǒng)文檔、數(shù)據(jù)以及語義圖(實(shí)體和聯(lián)系),這樣機(jī)構(gòu)就可以構(gòu)建一個(gè)使用企業(yè)中所有信息的搜索應(yīng)用程序。
【本文是51CTO專欄作者“李少鵬”的原創(chuàng)文章,轉(zhuǎn)載請通過安全牛(微信公眾號id:gooann-sectv)獲取授權(quán)】