沒有數(shù)學和編程基礎(chǔ),這幾個數(shù)據(jù)科學項目了解一下
大數(shù)據(jù)文摘出品
編譯:蔣寶尚
今天,文摘菌給大家介紹幾個比較有特色的數(shù)據(jù)科學模塊,這些模塊原本是一些教師用來進行教學使用,幫助學生有機會使用與其課程相關(guān)的數(shù)據(jù)集,并指導(dǎo)學生進行數(shù)據(jù)分析以及幫助理解統(tǒng)計和計算機原理。
一起來看~
模塊合集鏈接:https://ds-modules.github.io/DS-Modules/
Introduction to Phonetics and Phonolog
這個模塊由兩個實驗組成,實驗所用到的數(shù)據(jù)都是學生自己收集的,并且在這個模塊中,學生獨立分析數(shù)據(jù)并編碼。在***個實驗室里,學生們研究聲音開始以及結(jié)束的時間,以及母語口語和身高之間的相關(guān)性。在第二個實驗中,學生分析元音發(fā)音,并將研究個體相互比較,從而揭示單個元數(shù)據(jù)對特征預(yù)測能力的影響。該模塊適用于沒有編碼或統(tǒng)計經(jīng)驗的學生。
Neighborhood Mapping
本模塊讓學生分析并可視化整個東灣人口普查區(qū)的社會經(jīng)濟和人口變化情況。學生們到社區(qū)進行定性觀察,然后與人口普查數(shù)據(jù)進行比較。把一些的觀察結(jié)果組合成一幅地圖。該模塊適用于沒有編碼或統(tǒng)計經(jīng)驗的學生。
Macroeconomics
這個模塊包含一些宏觀經(jīng)濟學問題集。 ***個notebook幫助學生使用Latex公式以及教他們?nèi)绾尾鍒D。 ***個notebook的建模部分可視化了索洛增長模型。該模塊還使用自動評分功能可以及時反饋學生提交的作業(yè)。同樣,該模塊也適用于沒有編碼或統(tǒng)計經(jīng)驗的學生
Chinatown and Culture of Exclusion
使用20世紀-21世紀的人口統(tǒng)計數(shù)據(jù),讓學生分析一個特定的唐人街隨著時間的推移是如何變化的。在實驗過程中,學生可以使用一些簡單的文本分析方法做相關(guān)研究。
Implicit Bias and Social Outcomes
本模塊向?qū)W生介紹相關(guān)和回歸分析。學生從一個關(guān)于健康結(jié)果的數(shù)據(jù)集和一組關(guān)于內(nèi)隱偏見的數(shù)據(jù)集中挑選出整個美國的縣級數(shù)據(jù)集。然后,他們將這兩個數(shù)據(jù)集合并,并計算相關(guān)性和進行回歸預(yù)測,從而確定偏見與健康結(jié)果之間是否存在相關(guān)性。
Moral Foundations Theory
這些模塊將政治演講中的詞匯使用與道德基礎(chǔ)理論聯(lián)系起來。這些數(shù)據(jù)的統(tǒng)計推斷和可視化幫助學生尋找保守派和自由派總統(tǒng)候選人之間的修辭差異。然后,學生們將數(shù)據(jù)驅(qū)動的方法作為修辭工具進行研究和批判。
Sumerian Text Analysis
本模塊使用一個有趣的數(shù)據(jù)集,即蘇美爾文學電子文本語料庫(ETCSL)。這些文本是從六千年前的資料中翻譯出來的。在本模塊中使用的技術(shù)在文本分析中不太常見,如k均值、分層聚類和多維縮放。
Data, Prediction, and Law
利用2016年美國總統(tǒng)競選演講的數(shù)據(jù),學生從語音文本中挖掘特征,可視化這些特征,并用主成分分析提取特征。該模塊***給出了一個三維特征圖的例子,此模塊需要學生有一些統(tǒng)計學知識。
***,在次給出項目合集:https://ds-modules.github.io/DS-Modules/
【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)文章,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】