自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一款面向程序員的搜索引擎,收錄信息超2900萬頁!

開發(fā) 新聞
想讓檢索代碼不再「大海撈針」?就用「Feep! search」。

一款專門面向程序員的搜索引擎,2021年9月才開工,卻收錄了超過2900萬頁信息。這樣的「編程神器」,你愿意嘗試嗎?

這兩天,草根開發(fā)者浮士德發(fā)布了一款名為「Feep! search」的搜索引擎。只要在檢索框中輸入你想找的程序名稱,分分鐘便能檢索出成百上千條成熟代碼。

雖然這款「編程神器」還存在著不少問題,卻已經令不少苦兮兮的程序猿、程序媛們心馳神往,堪稱今年「1024」最好的禮物。

Feep! search

「Feep! search」是一款程序員專用的網絡搜索引擎,主要用于編程資源的查找。

雖然名稱采用了與雅虎(Yahoo!)相似的結構,但與美國門戶網站的明貶實褒(Yahoo原意為鄉(xiāng)巴佬)不同,「Feep」特指「終端發(fā)出的柔和電子鈴聲」,尾部的「!」則代表了想要為用戶提供令人難忘的服務。

圖片

目前,「Feep! search」能夠檢索的信息源,包括DevDocs、Hacker News、Kiwix、Stack Exchange等,甚至還包括一些已索引但未爬網的鏈接,信息總量超過2900萬頁——這甚至比谷歌1998年推出的第一款搜索引擎還要多(2600萬頁)。

據(jù)網站作者浮士德介紹,「Feep! search」在檢索時會查找它所存儲的所有信息,對一些數(shù)據(jù)進行少量排序,并填充到搜索網站的結果頁中。

數(shù)據(jù)混洗位主要用Node.js編寫,許多shell腳本將所有內容粘在一起,排名和全文搜索則由ElasticSearch提供支持。這一切都在他家客廳的HP微型服務器里運行。

圖片

位于浮士德客廳的「Feep! search」服務器

以程序員們最經典的上手程序「hello word」為例,僅用時27毫秒,「Feep! search」那簡潔而不簡單的界面便檢索出超1萬條結果。你可以從中輕松找出許多能夠實際運行的成熟代碼。

圖片

而且,搜索結果的信息來源,也是相當豐富的。

圖片

在浮士德的帖子下,不少網友表示「Feep! search」真乃程序員的福音:

「很棒的作品。(我)在同一主題不同變體的三次搜索中得到了一些好的答案和有用的鏈接。」

圖片

也有部分網友在體驗后發(fā)現(xiàn)了問題:

「好主意,但現(xiàn)在的搜索很糟糕。對『django signals』進行檢索,第一頁得到了非官方的結果,第二頁(1)上的所有鏈接都斷了。搜索『go cobra』則根本沒有官方文檔?!惯€在最后提出了一些改進建議。

圖片

美中不足

就連作者自己也承認,因為尚未設置任何搜索運算符或高級搜索語法,導致引擎的搜索結果相當多變,搜索結果的排名不能很好地獲得展示。

不過,對于一些檢索時的常見問題,作者也在「Query help」頁面進行了備注:

  • 單詞被詞干化(例如「walking」、「walk」等都將被轉換為「walk-」),并逐個搜索。目前還沒有任何方法可以關閉這個功能,或者搜索完整的短語;?
  • 非字母數(shù)字字符將被忽略(這意味著你不能搜索符號運算符之類的東西。這對于一個專門為程序員設計的搜索引擎來說非常尷尬。這也是我要著重解決的問題之一);
  • 語句的理解非常膚淺:它不尋找同義詞,也不理解同一個詞在不同的上下文中可能有不同的含義(這與谷歌截然相反,即使你有非常具體的想法,谷歌也會盡力猜測你的其他意思。哪種方法最有用取決于你尋找的方式)。改變查詢的措辭可能會得到一組完全不同的結果;
  • 如果沒有搜索到你要找的內容,請嘗試添加或刪除單詞。有時看似微小的調整都會產生巨大的差異。您需要的結果可能就在某個地方,即使可能很難找到;
  • 有時候,好的結果有些被埋沒了。建議您多瀏覽幾頁,看看要找的內容是不是在后面。

圖片

值得一提的是,每頁檢索結果的末端還提供了Google、DuckDuckGo、Bing和Marginalia四種其他搜索引擎的鏈接,一鍵即可進入對應詞匯在各大引擎中的檢索結果。

作者特別向我們推薦了一款獨立的DIY搜索引擎Marginalia Search。與「Feep! search」類似,這是一款專注于推薦「你可能不知道網站」的搜索引擎。這個搜索引擎中的軟件都是定制而成,所有的爬網和索引都在內部完成的。

小人物的大夢想

「Feep! search」的作者沃爾夫岡·浮士德(Wolfgang Faust)是一名專業(yè)軟件開發(fā)商和業(yè)余愛好者。

通過浮士德的個人網站我們可以了解到,雖然曾發(fā)表過大大小小上百項程序,但他卻是一名不折不扣的草根開發(fā)者。

圖片

正如浮士德個人網站的Slogan「我做了很多不同的事情」所言,2011年至今,他在GitHub上共更新了111條作品,但賬號目前也只有25個粉絲。一款名為「yaml-multiline」的開源軟件,總計獲得過216顆星和16次引用——這已是浮士德開發(fā)生涯的扛鼎之作。

圖片

不過,他在兩大論壇Hacker News和Reddit上卻分別收獲了4,004和3,712次「功德」,具有極強的表達欲望,也可以說非常努力了。

不管怎么講,能制作出一款收錄接近3000萬頁信息的搜索引擎,都是一項十分了不起的成就。

畢竟當年Google剛推出時,也同樣問題重重。

責任編輯:張燕妮 來源: 新智元
相關推薦

2011-06-28 15:50:37

SEO收錄

2015-12-14 10:33:38

2011-05-17 17:19:14

2011-06-20 18:23:06

SEO

2012-08-15 10:02:50

搜索引擎

2022-01-13 20:14:46

Qury元宇宙搜索

2011-06-02 15:36:48

2009-02-19 09:41:36

搜索引擎搜狐百度

2009-09-22 16:23:52

搜索引擎

2017-08-07 08:15:31

搜索引擎倒排

2020-03-20 10:14:49

搜索引擎倒排索引

2010-06-13 16:27:28

搜索引擎

2016-12-26 13:41:19

大數(shù)據(jù)搜索引擎工作原理

2022-10-08 09:13:18

搜索引擎?站

2012-09-07 13:22:21

搜索搜狗

2013-08-09 10:14:57

開發(fā)者搜索引擎

2023-07-24 13:04:51

2013-09-12 16:19:08

開發(fā)者搜索引擎

2011-04-15 13:23:11

圖標搜索引擎web

2022-04-30 09:49:58

終端工具插件
點贊
收藏

51CTO技術棧公眾號