自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

開發(fā) 后端 大數(shù)據(jù)
本節(jié)選用的是Python的第三方庫seaborn自帶的數(shù)據(jù)集,該小費(fèi)數(shù)據(jù)集為餐飲行業(yè)收集的數(shù)據(jù),其中total_bill為消費(fèi)總金額、tip為小費(fèi)金額、sex為顧客性別、smoker為顧客是否吸煙、day為消費(fèi)的星期、time為聚餐的時(shí)間段、size為聚餐人數(shù)。

一、數(shù)據(jù)來源

本節(jié)選用的是Python的第三方庫seaborn自帶的數(shù)據(jù)集,該小費(fèi)數(shù)據(jù)集為餐飲行業(yè)收集的數(shù)據(jù),其中total_bill為消費(fèi)總金額、tip為小費(fèi)金額、sex為顧客性別、smoker為顧客是否吸煙、day為消費(fèi)的星期、time為聚餐的時(shí)間段、size為聚餐人數(shù)。

  1. import numpy as np 
  2. from pandas import Series,DataFrame 
  3. import pandas as pd 
  4. import seaborn as sns    #導(dǎo)入seaborn庫 
  5. tips=sns.load_dataset('tips')  #seaborn庫自帶的數(shù)據(jù)集 
  6. tips.head() 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

二、問題探索

  • 小費(fèi)金額與消費(fèi)總金額是否存在相關(guān)性?
  • 性別、是否吸煙、星期幾、聚餐人數(shù)和小費(fèi)金額是否有一定的關(guān)聯(lián)?
  • 小費(fèi)金額占小費(fèi)總金額的百分比是否服從正態(tài)分布?

三、數(shù)據(jù)清洗

  1. tips.shape #數(shù)據(jù)集的維度 

(244,7)

共有244條數(shù)據(jù),7列。

  1. tips.describe() #描述統(tǒng)計(jì) 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

描述統(tǒng)計(jì)結(jié)果如上所示。

  1. tips.info() #查看缺失值信息 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

此例無缺失值。

四、數(shù)據(jù)探索

  1. tips.plot(kind='scatter',x='total_bill',y='tip') #繪制散點(diǎn)圖 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

由圖可看出,小費(fèi)金額與消費(fèi)總金額存在正相關(guān)性。

  1. import numpy as np 
  2. from pandas import Series,DataFrame 
  3. import pandas as pd 
  4. import seaborn as sns   #導(dǎo)入seaborn庫 
  5. tips=sns.load_dataset('tips')#seaborn庫自帶的數(shù)據(jù)集 
  6. tips.head() 

3.0896178343949052

  1. female_tip = tips[tips['sex'] == 'Female']['tip'].mean() #女性平均消費(fèi)金額female_tip 

2.833448275862069

  1. s = Series([male_tip,female_tip],index=['male','female']) 

male 3.089618

female 2.833448

dtype: float64

  1. s.plot(kind='bar') #男女平均小費(fèi)柱狀圖 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

由圖可看出,女性小費(fèi)金額小于男性小費(fèi)金額。

 

  1. sun_tip = tips[tips['day'] == 'Sun']['tip'].mean() 
  2. sat_tip = tips[tips['day'] == 'Sat']['tip'].mean() 
  3. thur_tip = tips[tips['day'] == 'Thur']['tip'].mean() 
  4. fri_tip = tips[tips['day'] == 'Fri']['tip'].mean()#各個(gè)日期的平均小費(fèi)值 
  5. s = Series([thur_tip,fri_tip,sat_tip,sun_tip],index=['Thur','Fri','Sat','Sun']) 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

 

  1. s.plot(kind='bar') #日期平均小費(fèi)柱狀圖 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

由圖可看出,周六、周日的小費(fèi)比周四、周五的小費(fèi)高。

  1. tips['percent_tip'] = tips['tip']/(tips['total_bill']+tips['tip']) 
  2. tips.head(10) #小費(fèi)所占百分比 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

 

  1. tips['percent_tip'].hist(bins=50)#小費(fèi)百分比直方圖 

 

Python數(shù)據(jù)分析實(shí)戰(zhàn),小費(fèi)數(shù)據(jù)集應(yīng)用

由圖可看出,小費(fèi)金額占小費(fèi)總金額的百分比基本服從正態(tài)分布。

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2020-02-20 10:45:51

Python數(shù)據(jù)疾病

2023-11-24 14:02:00

Python數(shù)據(jù)分析

2024-07-01 13:51:14

2017-09-18 17:59:23

Hadoop數(shù)據(jù)分析

2020-05-14 10:19:23

Python可視化分析

2019-08-01 13:09:57

大數(shù)據(jù)分析建模信息化

2023-05-15 12:41:26

2024-06-06 09:08:14

NumPyPython數(shù)據(jù)分析

2015-08-14 10:28:09

大數(shù)據(jù)

2022-02-06 11:35:53

SQL數(shù)據(jù)函數(shù)

2022-11-11 11:35:14

2020-05-13 11:32:28

數(shù)據(jù)分析數(shù)值分析

2017-02-16 10:00:26

python數(shù)據(jù)加載

2021-03-15 10:43:20

大數(shù)據(jù)數(shù)據(jù)分析工具

2019-04-15 13:40:47

大數(shù)據(jù)分析建模數(shù)據(jù)數(shù)據(jù)分析

2023-11-24 08:47:36

ScipyPython

2020-02-25 16:54:21

數(shù)據(jù)分析Python疫情

2019-05-15 15:57:15

Python數(shù)據(jù)分析爬蟲

2020-07-14 16:08:33

數(shù)據(jù)分析Python筆試

2022-11-14 10:36:55

數(shù)據(jù)科學(xué)數(shù)據(jù)分析
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)