自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

人工智能 機(jī)器學(xué)習(xí)
從駕駛汽車到識(shí)別語音+翻譯,機(jī)器學(xué)習(xí)通過軟件預(yù)測變幻莫測的現(xiàn)實(shí)世界,正在人工智能領(lǐng)域掀起一場風(fēng)暴。

 本文轉(zhuǎn)載自公眾號(hào)“讀芯術(shù)”(ID:AI_Discovery)

從駕駛汽車到識(shí)別語音+翻譯,機(jī)器學(xué)習(xí)通過軟件預(yù)測變幻莫測的現(xiàn)實(shí)世界,正在人工智能領(lǐng)域掀起一場風(fēng)暴。

[[352721]]

所以,什么是機(jī)器學(xué)習(xí)?

機(jī)器學(xué)習(xí)是教計(jì)算機(jī)系統(tǒng)使用反饋的舊數(shù)據(jù)進(jìn)行預(yù)測的過程,基本上是訓(xùn)練計(jì)算機(jī)根據(jù)過去的數(shù)據(jù)預(yù)測未來的數(shù)據(jù)。這些預(yù)測可以很簡單,例如鑒定照片中的動(dòng)物是貓還是狗,難度也可以遞進(jìn)至對語音準(zhǔn)確識(shí)別來生成網(wǎng)站字幕或運(yùn)行視頻或音樂之類的事情。

機(jī)器學(xué)習(xí)種類

機(jī)器學(xué)習(xí)大致分為兩大類:監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)。

監(jiān)督學(xué)習(xí)是用示例教學(xué)機(jī)器的方法。這些機(jī)器接受了大量數(shù)據(jù)的訓(xùn)練,從而學(xué)會(huì)識(shí)別圖案,并可以根據(jù)訓(xùn)練數(shù)據(jù)來識(shí)別和區(qū)分?jǐn)?shù)據(jù)。

而無監(jiān)督學(xué)習(xí)是使用算法來識(shí)別數(shù)據(jù)集的模式,其中的數(shù)據(jù)點(diǎn)既未分類也未標(biāo)記。算法從數(shù)據(jù)集中提取有用的信息或特征來分析其底層結(jié)構(gòu),并依此對數(shù)據(jù)進(jìn)行分類。

來看看怎樣使用監(jiān)督學(xué)習(xí)來構(gòu)建機(jī)器學(xué)習(xí)模型。

第一步:熟悉數(shù)據(jù)

任何機(jī)器學(xué)習(xí)項(xiàng)目的第一步都是熟悉數(shù)據(jù)。對此可以使用Pandas庫。Pandas是數(shù)據(jù)科學(xué)家探索和處理數(shù)據(jù)的主要工具。

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

Pandas庫中最重要的是DataFrame。DataFrame相當(dāng)于保存數(shù)據(jù)的表,類似SQL數(shù)據(jù)庫中的表。Pandas有處理DataFrame中數(shù)據(jù)的強(qiáng)大方法。拿加利福尼亞房價(jià)數(shù)據(jù)舉例。(文件路徑:../input/california-housing-prices/housing.csv)使用以下命令加載和瀏覽數(shù)據(jù):

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

第二步:選擇建模數(shù)據(jù)

研究DataFrame的數(shù)據(jù)后會(huì)發(fā)現(xiàn)它有10列,其中有9列是數(shù)字?jǐn)?shù)據(jù),“Ocean proximity”一列有字符串類型數(shù)據(jù)。我們只用數(shù)字?jǐn)?shù)據(jù)就可以構(gòu)建任何模型,因此可以直接刪掉“Ocean proximity”列。

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

然后刪掉空值的列,如下:

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

第三步:選擇預(yù)測目標(biāo)(Y)和特征(X)

下一步是選擇預(yù)測目標(biāo)(Y),也就是“median_house_value”列。所以分配Y為“ median_house_value”。其余特征為X。從數(shù)據(jù)集中移除“ median_house_value”列,然后將余下的分配為X,如下所示:

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

第四步:構(gòu)建模型

使用scikit-learn庫創(chuàng)建模型。該庫在代碼中以sklearn形式編寫。當(dāng)用存儲(chǔ)在DataFrames中的數(shù)據(jù)類型進(jìn)行建模時(shí),最受歡迎的庫就是Scikit-learn。建立和使用模型的步驟是:

  • 定義:模型類型是什么?是線性回歸還是其他類型?
  • 擬合:從現(xiàn)有數(shù)據(jù)中獲取模式(建模的核心)。
  • 預(yù)測:預(yù)測目標(biāo)
  • 評(píng)估:確定模型預(yù)測的準(zhǔn)確度。

現(xiàn)在,使用scikit-learn(sklearn)來定義線性回歸模型,并將其與特征和目標(biāo)變量進(jìn)行擬合,并獲得“ median_house_value”的預(yù)測值。導(dǎo)入以下庫使用scikit-learn(sklearn)。

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

為線性回歸模型創(chuàng)建一個(gè)變量。并且還使用train_test_split函數(shù)將數(shù)據(jù)分為訓(xùn)練和測試數(shù)據(jù)。在這里,我使用了25%的數(shù)據(jù)進(jìn)行測試,而剩余的75%則用于訓(xùn)練模型。

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

第五步:擬合模型

用訓(xùn)練數(shù)據(jù)擬合線性回歸模型。

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

完成后,預(yù)測功能通過使用X的測試值來預(yù)測房價(jià)。然后使用得分功能通過模型獲得預(yù)測值的準(zhǔn)確度,如下所示:

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

可以看到,模型預(yù)測正確率在66%左右。

第六步:畫圖

現(xiàn)在用X測試值和預(yù)測值(輸出)畫圖,如下:

 

機(jī)器學(xué)習(xí)新風(fēng)暴:如何用ML模型預(yù)測房價(jià)?

 

一個(gè)擬合的模型完成啦,我們可以用它預(yù)測。實(shí)際使用時(shí),我們可以對即將上市的新房子做預(yù)測。

本例是關(guān)于如何在數(shù)據(jù)集上擬合線性回歸模型并用來預(yù)測房價(jià)。我們還可以將相同的數(shù)據(jù)擬合到?jīng)Q策樹上或用來支持向量機(jī),并比較哪種模型預(yù)測得更好。

希望本文能幫到那些正在嘗試建立第一個(gè)機(jī)器學(xué)習(xí)線性回歸模型的人。

 

責(zé)任編輯:華軒 來源: 讀芯術(shù)
相關(guān)推薦

2019-11-28 09:23:17

Python機(jī)器學(xué)習(xí)數(shù)據(jù)庫

2011-10-28 18:54:29

2015-03-30 11:02:43

CloudRadio云廣播

2010-05-24 12:23:11

世博會(huì)3D

2010-05-12 17:45:21

統(tǒng)一通信產(chǎn)品

2009-04-21 10:08:13

2021-01-06 10:50:39

ITOT領(lǐng)導(dǎo)者

2020-07-14 08:34:07

AI機(jī)器學(xué)習(xí)預(yù)測股價(jià)

2022-08-09 13:44:37

機(jī)器學(xué)習(xí)PySpark M數(shù)據(jù)分析

2020-05-26 18:50:49

機(jī)器學(xué)習(xí)數(shù)據(jù)預(yù)測標(biāo)簽

2017-03-24 08:58:23

機(jī)器學(xué)習(xí)算法預(yù)測

2018-03-20 15:33:05

深度學(xué)習(xí)加密貨幣

2017-08-29 16:57:54

互聯(lián)網(wǎng)

2017-08-25 15:12:41

互聯(lián)網(wǎng)

2019-01-23 11:12:42

機(jī)器學(xué)習(xí)機(jī)器模型預(yù)測工資

2020-08-28 07:00:00

機(jī)器學(xué)習(xí)預(yù)測股市人工智能

2012-05-15 14:58:57

IT運(yùn)維

2019-03-08 09:28:42

Google 開源技術(shù)

2022-02-08 09:55:19

機(jī)器學(xué)習(xí)數(shù)據(jù)模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)