GitHub的星級被高估了
開源項(xiàng)目不只是其星級指標(biāo)
直覺上,我們都知道GitHub明星并不是一個開源項(xiàng)目的成敗之舉。 點(diǎn)擊"星標(biāo)"按鈕只是說:"我覺得很有趣。" 收集的信號不是一個壞信號,而是有關(guān)項(xiàng)目是否成功的最后決定。
盡管如此,星星還是誘人的。 它們簡單,可數(shù)且發(fā)出積極的反饋。 作為用戶,較高的星級數(shù)使您有理由在一個項(xiàng)目上簽出另一個項(xiàng)目。 作為維護(hù)者,恒星的每一次顛簸都會使您多巴胺有所提高-我是根據(jù)這里的經(jīng)驗(yàn)講的。
我從事的是開放源代碼機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施Cortex的工作,盡管了解得更多,但是星空激增仍然讓我非理性地興奮。
顯然,我并不孤單。 有圍繞星構(gòu)建的整個生態(tài)系統(tǒng)。 開源營銷已成為自己的利基市場。
開源團(tuán)隊(duì)致力于通過公告來實(shí)現(xiàn)里程碑。 已經(jīng)出現(xiàn)了一整套用于跟蹤和分析恒星生長的工具(請參見上圖)。
沿途的某個地方,明星從"支持項(xiàng)目的公共方式"變成了"開源軟件的流行",因此有必要重新評估明星的真正價值。
為什么星級不像您想的那么重要
明星確實(shí)具有價值-稍后會更詳細(xì)-但今天對它們的強(qiáng)調(diào)卻不成比例。 總的來說,由于某些原因,恒星并不像我們傾向于對待它們那樣有價值。
1.星級不等于用戶
您可以在不使用項(xiàng)目的情況下為項(xiàng)目加注星標(biāo)。 您可以在不加注星標(biāo)的情況下使用項(xiàng)目。 這聽起來似乎很明顯,但是必須強(qiáng)調(diào)一下,明星和用戶之間沒有必然的因果關(guān)系(當(dāng)然,一個可以導(dǎo)致另一個)。
例如,在Cortex,尚未有大量用戶加入該回購協(xié)議。
我們評估Cortex是否健康的星是使用它在生產(chǎn)中部署模型的人數(shù)。 我們通過與實(shí)際用戶互動來進(jìn)行衡量。 如果這個數(shù)字上升,我們知道我們做對了。 如果數(shù)量減少,即使星級增加了,我們也要解決一些問題。
2.明星高度依賴環(huán)境
星號并非始終如一的價值單位,并且比較項(xiàng)目之間的星數(shù)并非十分簡單。
項(xiàng)目社區(qū)的規(guī)模和活動,潛在用戶的數(shù)量以及維護(hù)人員的營銷工作對項(xiàng)目的星級影響很大。
例如,如果您是前端Javascript框架,并且有Facebook的營銷預(yù)算,那么與DevOps工程師使用的工具相比,您將擁有更多的明星。 換句話說,React擁有148,000顆星,而Elasticsearch的49,000顆星這一事實(shí)并不能說明Elasticsearch是否成功(蘋果和橘子)。
3.從根本上說,星級仍然是社交媒體的參與
GitHub顯然不是Twitter,但明星仍然是社交媒體的參與對象,所有通常的警告都適用。
首先,一些GitHub用戶在社交方面比其他用戶更活躍。 一些用戶為2,000個項(xiàng)目加注星標(biāo),而其他用戶幾乎沒有注視。
同樣,許多GitHub用戶使用星號表示對項(xiàng)目的總體支持,即使他們從未打算使用它。 例如,當(dāng)我們首次啟動Cortex時,我們獲得了Go社區(qū)的好評,甚至來自對機(jī)器學(xué)習(xí)不感興趣的人。 這沒什么不對,我們非常感謝您的支持,它只是在加強(qiáng)星星與使用的聯(lián)系。
星級不是萬能的,但它們?nèi)匀缓苡袃r值
盡管有上述警告,但獲得一顆星仍然是一件好事(實(shí)際上,如果您想給Cortex一顆星,請不要讓我阻止您)。
星號表示人們通常對某個項(xiàng)目感興趣,并且同樣可以在相似的項(xiàng)目之間提供有用的基準(zhǔn)。 比較React和Elasticsearch可能沒有任何意義,但是React具有超過Angular兩倍星的事實(shí)可能是有意義的。
明星們還會就誰覺得項(xiàng)目有趣提供一些反饋。 有了Cortex,我們驚訝地看到該項(xiàng)目在開發(fā)人員中的受歡迎程度,而不僅僅是數(shù)據(jù)科學(xué)家。 這影響了我們?nèi)绾伍_發(fā)該項(xiàng)目的許多決定。
最后,星星使項(xiàng)目更容易被發(fā)現(xiàn)。 除了明顯的高星數(shù)有助于項(xiàng)目脫穎而出這一明顯事實(shí)外,它們還影響GitHub的建議。 由于我曾出演過類似的項(xiàng)目,因此我通常會查找新的ML項(xiàng)目:
由于所有這些原因,星級很有價值-它們并不是評估開源項(xiàng)目的完整指標(biāo)。