自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

爬取上市公司數(shù)據(jù)、分析數(shù)據(jù),并用可視化現(xiàn)實(shí)全國(guó)各地區(qū)公司數(shù)量

大數(shù)據(jù) 數(shù)據(jù)分析
在很多網(wǎng)站上,都會(huì)以表格的形式展示數(shù)據(jù),而我們獲取這種數(shù)據(jù)只需通過(guò)十幾行爬蟲(chóng)代碼就可以搞定,輕松搞定網(wǎng)頁(yè)爬蟲(chóng),實(shí)現(xiàn)高效辦公。

前言

在很多網(wǎng)站上,都會(huì)以表格的形式展示數(shù)據(jù),而我們獲取這種數(shù)據(jù)只需通過(guò)十幾行爬蟲(chóng)代碼就可以搞定,輕松搞定網(wǎng)頁(yè)爬蟲(chóng),實(shí)現(xiàn)高效辦公

 

[[338382]]

知識(shí)點(diǎn):

  • 爬蟲(chóng)基本原理
  • requests的簡(jiǎn)單使用
  • pandas庫(kù)
  • pyecharts可視化工具

第三方庫(kù):

  • requests
  • pandas

開(kāi)發(fā)環(huán)境:

  • Python 3.6
  • Pycharm

這里就只展示部分代碼了

爬蟲(chóng)代碼

1.導(dǎo)入工具

  1. from urllib.parse import urlencode 
  2. import requests 
  3. import csv 
  4. from bs4 import BeautifulSoup 
  5. import pandas as pd 

2.網(wǎng)頁(yè)提取函數(shù)

  1. def get_one_page(i): 
  2.     paras = { 
  3.         'reportTime''2019-12-31'
  4.         # 可以改報(bào)告日期,比如2018-6-30獲得的就是該季度的信息 
  5.         'pageNum': i  # 頁(yè)碼 
  6.     } 
  7.     url = 'http://s.askci.com/stock/a/?' + urlencode(paras) 
  8.     response = requests.get(url, headers=headers) 
  9.     if response.status_code == 200: 
  10.         return response.text 

3.提取表格數(shù)據(jù)

  1. def parse_one_page(html): 
  2.     tb = pd.read_html(html)[3] 
  3.     return tb 

4.保存數(shù)據(jù)

  1. def save_csv(): 
  2.     pass 
  3.  
  4. if __name__ == '__main__'
  5.     html = get_one_page(1) 
  6.     parse_one_page(html) 

運(yùn)行代碼,效果如下圖

 

爬取上市公司數(shù)據(jù)、分析數(shù)據(jù),并用可視化現(xiàn)實(shí)全國(guó)各地區(qū)公司數(shù)量

數(shù)據(jù)可視化代碼

  1. ffrom pyecharts import options as opts 
  2. from pyecharts.charts import Map 
  3. from pyecharts.faker import Faker 
  4. df = pd.read_csv('1.csv'
  5.  
  6.  
  7. data = [['北京',331], ['西藏',18], ['湖北',103], ['上海',298], ['天津',50], ['陜西',51], ['安徽',106], ['河北',58], ['貴州',29], ['河南',79], ['山東',206], ['廣東',603], ['江西',41], ['江蘇',420], ['浙江',443], ['湖南',105], ['黑龍江',37], ['遼寧',78], ['福建',134], ['四川',125], ['重慶',50], ['廣西',38], ['新疆',54], ['云南',37], ['山西',38], ['寧夏',14], ['海南',30], ['甘肅',33], ['吉林',42], ['內(nèi)蒙古',25], ['青海',12]] 
  8. c = ( 
  9.     Map() 
  10.     .add("上市公司數(shù)量 ", data, "china"
  11.     .set_global_opts( 
  12.         title_opts=opts.TitleOpts(title="上市公司數(shù)量分布"), 
  13.         visualmap_opts=opts.VisualMapOpts(max_=700), 
  14.     ) 
  15.  
  16. c.render_notebook() 

最后運(yùn)行代碼,效果如下圖

 

爬取上市公司數(shù)據(jù)、分析數(shù)據(jù),并用可視化現(xiàn)實(shí)全國(guó)各地區(qū)公司數(shù)量

 

 

責(zé)任編輯:未麗燕 來(lái)源: 今日頭條
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)