9塊9就能找個(gè)女朋友,你還在等什么?
備受關(guān)注的第七次人口普查數(shù)據(jù)近日公布。數(shù)據(jù)顯示,我國(guó)男性比女性人口多出3000余萬(wàn),從性別構(gòu)成年齡段來(lái)看,從20歲到40歲這一主要婚育年齡段來(lái)看,男性比女性多出1700多萬(wàn)人。聽(tīng)到這個(gè)數(shù)據(jù),不知道大家慌不慌,反正我是不慌,畢竟現(xiàn)在的年輕人都追求自由,要什么對(duì)象(假裝不稀罕)。不得不說(shuō),近年來(lái),中國(guó)人結(jié)婚少了、結(jié)婚晚了、離婚多了,社會(huì)、經(jīng)濟(jì)、環(huán)境壓的我們喘不過(guò)氣,而高婚育成本更像一座大山,我們?cè)谏角芭腔?,躊躇等待。
不管怎么說(shuō),社會(huì)是大家的,生活(對(duì)象)是自己的,沒(méi)對(duì)象的爭(zhēng)取不做那1/17000000,有對(duì)象的且過(guò)切珍惜。520來(lái)了,你是哪種過(guò)節(jié)姿勢(shì)呢?
沒(méi)對(duì)象的請(qǐng)查收這份孤單指南
1、做個(gè)wifi宅,只要還能連上網(wǎng),你就不是孤獨(dú)的,也別問(wèn)宅著是不是孤單,你都問(wèn)了,我能說(shuō)什么。
2、做個(gè)剁手族,與其說(shuō)愛(ài)上了網(wǎng)購(gòu),不如說(shuō)愛(ài)上了孤單。單身狗都是獨(dú)自快樂(lè)的,畢竟掙的錢都能自己花,嘻嘻。
3、做個(gè)高端玩家,一群?jiǎn)沃娜?,卻想讓大家都不孤單。你可以選擇在朋友圈接受狗糧投喂,也可以組一個(gè)單身局互訴衷腸,畢竟,嘲笑也要一群人更刺激。
4、做個(gè)關(guān)燈人,為了不孤單,就要承受更多的孤單。做最后一個(gè)離開(kāi)自習(xí)室的人,做最后一個(gè)下班的人,做最后一個(gè)散場(chǎng)的人。
有對(duì)象的請(qǐng)查收這份送禮指南
想知道大家都是怎么送禮的么?云朵君特意施展了python大法,在淘寶上爬取了最受歡迎的情人節(jié)禮物,看下大家都是怎么選禮物的。
數(shù)據(jù)爬取
本次數(shù)據(jù)爬取是采用使用selenium實(shí)現(xiàn)動(dòng)態(tài)渲染頁(yè)面的爬取。selenium是瀏覽器自動(dòng)測(cè)試框架,模擬瀏覽器,驅(qū)動(dòng)瀏覽器執(zhí)行特定的動(dòng)作,并可獲取瀏覽器當(dāng)前呈現(xiàn)的頁(yè)面的源代碼,可見(jiàn)即可爬。
爬蟲(chóng)中主要是獲取商品數(shù)據(jù),其主要代碼如下:
- def get_products():
- '''
- 提取商品數(shù)據(jù)
- :return:
- '''
- # page_source獲取網(wǎng)頁(yè)源代碼
- html = browser.page_source
- doc = pq(html)
- items = doc('#mainsrp-itemlist .items .item').items()
- for item in items:
- # 數(shù)據(jù)存入字典
- product = {
- 'image': item.find('.pic .img').attr('data-src'),
- 'price': item.find('.price').text(),
- 'deal': item.find('.deal-cnt').text(),
- 'title': item.find('.title').text(),
- 'shop': item.find('.shop').text(),
- 'location': item.find('.location').text(),
- }
- with open(f'./{text}.txt', 'a',encoding='utf-8') as fin:
- fin.write(f"{json.dumps(product, ensure_ascii=False)}\n")
- print(product)
獲取到的原始數(shù)據(jù)是這樣的
數(shù)據(jù)清洗
定義清洗函數(shù)
- def deal_deal(x):
- s = x.split('人付款')[0]
- if not s:
- return 0
- elif s.endswith('萬(wàn)+'):
- return int(float(x.split('萬(wàn)+人付款')[0])*10000)
- elif s.endswith('+'):
- return int(x.split('+人付款')[0])
- else:
- return int(s)
逐個(gè)處理每個(gè)列
- raw_data = pd.DataFrame(data_list)
- data = raw_data.iloc[:,1:]
- # 單位處理
- data['price'] = data['price'].map(lambda x: float(x.split('¥')[1]))
- data['deal'] = data['deal'].map(lambda x:deal_deal(x))
- data['province'] = data['location'].map(lambda x: x.split()[0])
- # 發(fā)貨地拆分
- data['city'] = data['location'].map(lambda x: x.split()[1] if len(x.split()) ==2 else x.split()[0])
- # 刪除無(wú)用的列
- data.drop(columns=['location'],inplace=True)
- # 重命名
- data.columns = ['價(jià)格','銷量','商品名稱','店鋪名稱','省份','城市']
數(shù)據(jù)清洗完如下:
數(shù)據(jù)分析
數(shù)據(jù)整體分布狀態(tài)
銷量和價(jià)格都呈現(xiàn)出很明顯的右偏分布,價(jià)格越低,銷量越高。看來(lái)情人節(jié)禮物普遍比較便宜嘛,這樣低成本,高回報(bào)的事情,你還在等什么呢?
送禮你選幾塊錢的?
從各價(jià)格區(qū)間禮物銷量可以看到,100塊以內(nèi)的禮物占比47.42%,100-200塊的禮物占比24.66%,200-500塊的禮物占比13.16%,說(shuō)明還是有很多物廉價(jià)美的禮物。
按照價(jià)格篩選0-100元,并按照銷量從高到低,看看大家都喜歡買些什么?
除了一些創(chuàng)意的定制禮物,更搶眼的是銷量3萬(wàn)+的玫瑰花,只要九塊九,你就能獲得芳心!
當(dāng)然送禮最重要的還是心意,心意與價(jià)格不是正相關(guān)的,禮輕情意重。
送鮮花,選云南
情人節(jié)禮物賣的最好的當(dāng)屬云南!而云南賣的最好的當(dāng)屬鮮花!眾所周知,昆明斗南的鮮花占據(jù)國(guó)內(nèi)70%的市場(chǎng)份額,是中國(guó)乃至亞洲最大的鮮切花交易市場(chǎng),出口46個(gè)國(guó)家和地區(qū),平均每十枝鮮花里面就有7枝產(chǎn)自斗南,是著名的“花都”和花卉價(jià)格的“晴雨表”。
云南才是名副其實(shí)的花海,不僅鮮花種類繁多,而且物美價(jià)廉啊!兄弟們,不用吝嗇啊,趕緊行動(dòng)起來(lái)!9.9能換個(gè)媳婦啊!
看看云南的店在賣什么?
除了玫瑰花,還有網(wǎng)紅花束滿天星,前兩天母親節(jié)的康乃馨,還有勿忘我、向日葵等等!
大家都在買什么?
從詞云圖中看到,除了玫瑰花等鮮花外,戒指、手鏈、項(xiàng)鏈等也是很多男性朋友的選擇。挑一件禮物不容易,挑一件她喜歡的禮物更不容易。大家加油!