用Python爬了iPhone全部游戲免費榜的實時排名,我發(fā)現(xiàn)~
本文轉載自微信公眾號「志斌的python筆記」,作者志斌。轉載本文請聯(lián)系志斌的python筆記公眾號。
大家好,我是志斌~
今天我們就來分析一下iPhone全部游戲免費榜的排名情況,看看哪類iPhone用戶都喜歡哪款游戲~
一、數(shù)據(jù)采集
首先我們打開我們的目標網(wǎng)頁,對其進行簡單分析。
如上圖,我們發(fā)現(xiàn)數(shù)據(jù)是以Ajax形式加載到網(wǎng)頁中的,存儲格式是JSON格式,我們在之前的文章中詳細的介紹過這種網(wǎng)站的原理和爬取方式,有興趣的讀者可以看看這篇文章一文教會你,Ajax數(shù)據(jù)爬取。
這里我們就不過多介紹了,直接展示核心代碼:
- import requests
- params = (
- ('analysis', 'dg51Ti93fkVqXnpcYjNbTwVzDxRqYQ0NcBMfSgVZU0tdWAVVSHATAQEBAV0AClAFB1YEcBMB'),
- ('brand', 'free'),
- ('device', 'iphone'),
- ('country', 'cn'),
- ('genre', '6014'),
- )
- response = requests.get('https://api.qimai.cn/rank/index', headers=headers, params=params)
- for i in response.json()['rankInfo']:
- xuhao = i['index']
- Id = i['appInfo']['appId']
- play_name = i['appInfo']['appName']
- pinglun_num = i['comment']['num']
- try:
- if '萬' in pinglun_num:
- pinglun_num = float(pinglun_num[:-1])*10000
- except:
- if pinglun_num == '1,294萬':
- pinglun_num = 12940000
- pingfen = i['comment']['rating']
- gongsi_name = i['company']['name']
- leibie = i['rank_c']['genre']
- leibiepaiming = i['rank_c']['ranking']
- try:
- with open('1.csv', 'a', encoding='gbk',newline='') as f:
- writer = csv.writer(f)
- writer.writerow([xuhao,Id,play_name,pinglun_num,pingfen,gongsi_name,leibie,leibiepaiming])
- except:
- pass
二、數(shù)據(jù)可視化
我們此次采集了游戲免費榜單前五十的數(shù)據(jù)來進行數(shù)據(jù)可視化分析,采用的工具是Excel。
1.游戲名稱詞云圖展示
從圖中我們發(fā)現(xiàn)用戶較喜歡的是麻將、王者、漫威、格斗、校園和MOBA風格的游戲。
2.游戲公司所在城市
從圖中我們發(fā)現(xiàn),游戲公司在深圳最多有14家,其次是杭州有8家,然后是5家在北京,2家在上海,1家在廣州。
想從事游戲行業(yè)的朋友,建議以后盡量去深圳和杭州看看,畢竟公司多,機會更多一點。
3.游戲評分倒數(shù)前五
從圖中我們可以看出,以下五款游戲的評分最低,看來這五家公司的開發(fā)要被老板給約談了~
4.評論數(shù)top20游戲
游戲的評論數(shù)處于遙遙領先的是保衛(wèi)蘿卜3,有1294w;其次是湯姆貓跑酷,有930w;櫻花校園模擬器和騰訊歡樂麻將合集也不少,分別是256w和150w。
5.游戲類別分布
動作類游戲較受大眾歡迎,其次是策略和休閑類游戲,看來開發(fā)些這方面的游戲,會更容易占據(jù)市場。
三、小結
1. 本文觀點僅是作者個人觀點,如有不當之處,請聯(lián)系作者指正!
2. 本文僅供學習參考,不做它用。