Github上十個數(shù)據(jù)科學和機器學習知識庫
在本文中將介紹一些對數(shù)據(jù)科學和機器學習愛好者最有用的 Github 代碼庫。(排名順序不分先后)
1、The Algorithm
數(shù)據(jù)結構是計算機科學中最流行的詞,可能緊隨其后的是數(shù)據(jù)科學。 但是每個計算機科學專業(yè)的學生都必須了解數(shù)據(jù)結構,如果你打算在該領域從事長期職業(yè),那么它是最重要的學習之一。 無論您是 ML 工程師、Web 開發(fā)人員、移動開發(fā)人員還是本科生,這都是應該在書簽收藏中擁有的一個repo。 他們還有一個網(wǎng)站,用于查看和運行 10 多種流行語言的代碼。
2、100-Days-Of-ML-Code
這個 repo 的名稱是不言自明,它包含一個 100 天的學習 ML 計劃。 它來自一群開源愛好者的一些非常有價值的貢獻,并且在 repo 中包含了數(shù)據(jù)集。 該repo 的另一個顯著特點是每天的圖形海報,就像每日學習計劃的摘要,如果打印的海報能激勵你保持正軌,這將非常有用。
3、 data-science
這個repo為那些想要免費完成數(shù)據(jù)科學本科課程的人提供了一個機會,這些課程來自世界上一些最好的大學。 在他們的課程中,更偏愛 MOOC(大規(guī)模開放在線課程)風格的課程,因為這些課程更適合自定進度的學習。
學生可以通過不同的社區(qū)渠道、GitHub 問題、repo 的 Discord 服務器等進行互動。它確實帶來了集體學習的感覺,在當今開放世界的免費教育計劃中應該是這樣的路要走 而不是昂貴的課程。
4、public-apis
它是可供各種開發(fā)人員使用的最佳公共 API 集合之一,它有一個以非常全面的方式分類的 API 列表,并提供了每個 API 的基本概念,關于每個 API 的 Auth、HTTP 和 CORS 狀態(tài),而無需閱讀它們各自的文檔。 當計劃為項目創(chuàng)建示例數(shù)據(jù)集時它會非常方便。
5、awesome-machine-learning
就像名字一樣,這個repo包含一個精選的機器學習框架、庫和軟件列表。 它具有用于各種語言和機器學習工具的框架和庫的分類列表。
6、project-based-learning
但是聽幾個小時的教程會讓個人感到厭煩,從項目中學習的潛力要高得多。 你需要面對實時問題并解決將來可能遇到的問題,所以必須嘗試使用正在學習的語言或技能在至少一個好的項目中實施它們。
無論是 Web/移動開發(fā)、機器學習還是數(shù)據(jù)科學,這個repo都有很好的項目集合,可以參考這些項目以供學習和將來使用。 該列表按語言分類,在每種語言下,可以找到來自不同主題的大量項目。
7、Complete-Python-3-Bootcamp
Python 是一種如此流行的語言,以至于人們在聽到這個詞時不再想到爬行動物。 它已成為數(shù)據(jù)科學、機器學習、人工智能甚至網(wǎng)絡開發(fā)的首選語言。 這個repo包含 Udemy 上最受歡迎、評價最高且完整的 Python 3 訓練營課程之一的文件。
8、awesome-python
如上所述,Python 在 2022 年的流行是毫無疑問的。這種流行的主要原因之一是數(shù)量龐大。這個repo有一個專門針對 python 的庫、框架和資源的精選列表。 無論是關于構建管理儀表板還是使用 Web 套接字,幾乎涵蓋了所有內(nèi)容。
9、DeepLearning-500-questions
顧名思義,這是關于深度學習和人工智能的綜合知識體系。 它包含一系列關于深度學習和人工智能的數(shù)學和技術方面的文章,這些文章將幫助您在各自領域建立堅實的知識基礎。
10、metrics
Metrics 可用于生成關于你的信息圖表,因此你可以將它們嵌入到 GitHub 個人資料中,讓其他用戶更多地了解。 顯示你的 git 統(tǒng)計數(shù)據(jù)以及日歷、收藏的音樂、網(wǎng)站、最后的推文、項目、語言等。這可能看起來有點花里胡哨,但如果使用得當,它確實可以幫助你的個人資料脫穎而出。