自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

大數(shù)據(jù) 數(shù)據(jù)分析
隨著互聯(lián)網(wǎng)行業(yè)的日益興盛,吸引力越來越多的牛人加入其中,也有許多小伙伴躍躍欲試,想要在互聯(lián)網(wǎng)的浪潮中大展身手。今天我們通過看準(zhǔn)網(wǎng)的數(shù)據(jù),幫助大家對(duì)各大互聯(lián)網(wǎng)公司有一個(gè)比較概括的了解。

前言:

隨著互聯(lián)網(wǎng)行業(yè)的日益興盛,吸引力越來越多的牛人加入其中,也有許多小伙伴躍躍欲試,想要在互聯(lián)網(wǎng)的浪潮中大展身手。今天我們通過看準(zhǔn)網(wǎng)的數(shù)據(jù),幫助大家對(duì)各大互聯(lián)網(wǎng)公司有一個(gè)比較概括的了解。

01數(shù)據(jù)來源

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

看準(zhǔn)網(wǎng)提供了許多員工對(duì)于公司的評(píng)價(jià),我們從中提取需要的數(shù)據(jù),包括整體評(píng)分、面試難度、推薦率、前景看好情況、CEO支持率,代碼如下:

  1. ## 獲得信息  
  2. def get_company_info(num,headers): 
  3.    ## 獲得評(píng)價(jià)數(shù)據(jù) 
  4.    url = 'https://www.kanzhun.com/gsr'+str(num)+'.html?ka=com-blocker1-review' 
  5.    js='window.open("'+url+'")' 
  6.    driver.execute_script(js) 
  7.    time.sleep(5) 
  8.    driver.close()  
  9.    driver.switch_to_window(driver.window_handles[0]) 
  10.    bsObj=BeautifulSoup(driver.page_source,"html.parser"
  11.    tag=bsObj.find('div',attrs={'class':'all_item'}).text.replace('\t','').replace('\n','').replace('(',' ').replace(')',' ').split(' '
  12.    tag=tag[0:len(tag)-1] 
  13.    this_tag = {tag[i*2]:tag[i*2+1] for i in np.arange(int(len(tag)/2-1))} 
  14.    this_name = bsObj.find('div',attrs={'class':'co_name t_center'}).text 
  15.    this_overal = float(bsObj.find('div',attrs={'class':'res_box_star f_right'}).find('em').text) 
  16.    points = bsObj.find('ul',attrs={'class':'score_rate clearfix'}).text.replace('\n',' ').split() 
  17.    this_recommend = float(points[0][0:2])/100*5 
  18.    this_future = float(points[2][0:2])/100*5 
  19.    this_ceo = float(points[4][0:2])/100*5 
  20.    ## 獲得CEO頭像和公司logo 
  21.    ceo_pic = bsObj.find('div',attrs={'class':'ceo_info'}).find('div').find('img').attrs['src'
  22.    ceo_name = bsObj.find('div',attrs={'class':'ceo_info'}).find('p').text 
  23.    head_logo = bsObj.find('div',attrs={'class':'com_logo f_left'}).find('img').attrs['src'
  24.    head_loc = 'D:/爬蟲/看準(zhǔn)/公司logo/'+this_name+'.jpg' 
  25.    ceo_loc = 'D:/爬蟲/看準(zhǔn)/CEOlogo/'+this_name+'.jpg' 
  26.    request.urlretrieve(head_logo,head_loc) 
  27.    request.urlretrieve(ceo_pic,ceo_loc) 
  28.    ## 獲得面試難度 
  29.    url = 'https://www.kanzhun.com/gsm'+str(num)+'.html?ka=com-floater-interview' 
  30.    js='window.open("'+url+'")' 
  31.    driver.execute_script(js) 
  32.    time.sleep(5) 
  33.    driver.close()  
  34.    driver.switch_to_window(driver.window_handles[0]) 
  35.    bsObj=BeautifulSoup(driver.page_source,"html.parser"
  36.    req=request.Request(url,headers=headers)   
  37.    html=urlopen(req)   
  38.    bsObj=BeautifulSoup(html.read(),"html.parser")     
  39.    this_difficulty = float(bsObj.find('section',attrs={'class':'interview_feel'}).find('em').text) 
  40.    this_feeling = bsObj.find('ul',attrs={'class':'score_list'}).find_all('span',attrs={'class':'percent'}) 
  41.    this_feeling = [float(k.text.replace('%','')) for k in this_feeling] 
  42.    this_feeling = (this_feeling[0]*5+this_feeling[1]*3+this_feeling[2]*1)/100 
  43.    ## 整合數(shù)據(jù)成為字典 
  44.    this_company ={'name':this_name,'overal':this_overal,'comments':tag[1],'recommend':this_recommend, 
  45.                   'future':this_future,'ceo':this_ceo,'difficulty':this_difficulty,'feeling':this_feeling}     
  46.    return this_company,this_tag,this_name 

02整體對(duì)比

我們最終選取了50家互聯(lián)網(wǎng)公司作為樣本進(jìn)行對(duì)比,選取來源主要是結(jié)合2018年互聯(lián)網(wǎng)公司百強(qiáng)榜單和看準(zhǔn)網(wǎng)上的實(shí)際評(píng)價(jià)數(shù)量,選取的公司logo拼圖如下,我們會(huì)在第4部分講解如何將圖片進(jìn)行拼接:

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

首先對(duì)比各項(xiàng)評(píng)價(jià)指標(biāo)的TOP15:

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

可以看到,榜單中BAT在各項(xiàng)排名中都處于十分靠前的位置,網(wǎng)易也占據(jù)了多個(gè)榜單的靠前位置,騰訊霸占了所有排名的TOP1。下面我們?cè)賮砜匆幌旅嬖囯y度,我們選取了面試難度評(píng)分的TOP15和BOTTOM15,該數(shù)據(jù)僅供參考,根據(jù)小編的經(jīng)驗(yàn),同一個(gè)公司的不同部門不同崗位之間的難度差異也非常大。

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

在面試難度偏低的一些公司中,有許多非常不錯(cuò)的公司,該數(shù)據(jù)僅僅是一個(gè)參考,真正的面試還是要取決于求職者的實(shí)際能力,所謂會(huì)者不難,難者不會(huì)。真正的大牛無論是面對(duì)多么困難的面試,依然可以slay全場。

  1. ## 整體評(píng)分top15柱形圖 
  2. company=pd.read_excel('company_info.xlsx'
  3. company_overal = company.sort_values('overal',ascending=False)[0:15] 
  4. attr = company_overal['name'
  5. v1=round(company_overal['overal'],2) 
  6. bar = Bar("整體評(píng)分TOP15",title_pos='center'
  7. bar.use_theme('essos'
  8. bar.add("", attr, v1, is_stack=False,xaxis_rotate=30,yaxis_min=3.7,is_label_show=True
  9.         xaxis_interval =0,is_splitline_show=False
  10. bar.render('整體評(píng)分TOP15.html'

03雷達(dá)圖

前面我們看的都是各個(gè)公司之間的對(duì)比,下面我們看一下同一個(gè)公司不同維度的情況,我們選取了BAT和TMD作為數(shù)據(jù),其他的公司也可以按照同樣的方式進(jìn)行對(duì)比,首先看一下BAT:

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

BAT真的是名副其實(shí)的業(yè)界標(biāo)桿,各項(xiàng)指標(biāo)都slay整個(gè)行業(yè),下面我們看一下此前發(fā)展勢頭迅猛的TMD三家公司:

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

TMD三家公司和行業(yè)整體水平相比,也是出于領(lǐng)先地位,可見其還不錯(cuò)的發(fā)展勢頭,最后放上和小編息息相關(guān)的三家公司,具體是哪三家,相信了解小編的朋友一定是可以猜出來的:

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

  1. value_avg = [list(company.iloc[:,[1,3,4,5,6]].mean())] 
  2. value_company0 = [list(company.iloc[0,[1,3,4,5,6]])] 
  3. value_company1 = [list(company.iloc[1,[1,3,4,5,6]])] 
  4. value_company2 = [list(company.iloc[2,[1,3,4,5,6]])] 
  5. c_schema= [{"name""總體評(píng)價(jià)""max": 4.4, "min": 3.2}, 
  6.           {"name""推薦度""max": 4.75, "min": 2.4}, 
  7.           {"name""前景看好""max": 4.25, "min": 1}, 
  8.           {"name""CEO/董事長認(rèn)可度""max": 4.8,"min":3}, 
  9.           {"name""面試難度""max": 3.4,"min":2.3}] 
  10. radar = Radar() 
  11. radar.use_theme('essos'
  12. radar.config(c_schema=c_schema, shape='circle'
  13. radar.add(company['name'][0], value_company0, item_color="blue", symbol=None,linewidht=5) 
  14. radar.add(company['name'][1], value_company1, item_color="orange", symbol=None,linewidht=5) 
  15. radar.add(company['name'][2], value_company2, item_color="red", symbol=None,linewidht=5) 
  16. radar.add("整體水平", value_avg, item_color="purple", symbol=None,linewidth=5, 
  17.          legend_selectedmode='multiple'
  18. radar.render('bat.html'

04圖片拼接

看準(zhǔn)網(wǎng)提供了各個(gè)公司的logo和各位公司大佬的頭像,我們冒昧地利用這些數(shù)據(jù)進(jìn)行簡單的圖片拼接,制作成一副大的合成圖。主要原理是利用numpy中的多維數(shù)組進(jìn)行拼接,由于圖像本身就可以看做是一個(gè)三維數(shù)組(彩色)或者一位數(shù)組(黑白),所以我們只需利用數(shù)組的拼接方法,就可以達(dá)到我們的目的。

代碼如下:

  1. ## 拼接公司logo成為5*10的拼圖 
  2. i = 0  
  3. for filename in os.listdir("./公司logo"): 
  4.    file_loc = "D:/爬蟲/看準(zhǔn)/公司logo/"+filename 
  5.    img = mpimg.imread(file_loc)[:,:,0:3] 
  6.    img = cv2.resize(img, (180,180),interpolation=cv2.INTER_AREA) 
  7.    if i % 10 == 0: 
  8.        row_img=img 
  9.    elif i == 9: 
  10.        row_img=np.hstack((row_img,img)) 
  11.        all_img = row_img 
  12.    elif i % 10 == 9: 
  13.        row_img=np.hstack((row_img,img)) 
  14.        all_img = np.vstack((all_img,row_img)) 
  15.    else
  16.        row_img=np.hstack((row_img,img)) 
  17.    i = i+1 
  18. plt.imshow(all_img)     
  19. plt.axis('off')      
  20.  
  21. ## 拼接大佬頭像成為7*7的拼圖 
  22. i = 0  
  23. for filename in os.listdir("./CEOlogo"): 
  24.    file_loc = "D:/爬蟲/看準(zhǔn)/CEOlogo/"+filename 
  25.    img = mpimg.imread(file_loc)[:,:,0:3] 
  26.    img = cv2.resize(img, (500,500),interpolation=cv2.INTER_CUBIC) 
  27.    if i % 7 == 0: 
  28.        row_img=img 
  29.    elif i == 6: 
  30.        row_img=np.hstack((row_img,img)) 
  31.        all_img = row_img 
  32.    elif i % 7 == 6: 
  33.        row_img=np.hstack((row_img,img)) 
  34.        all_img = np.vstack((all_img,row_img)) 
  35.    else
  36.        row_img=np.hstack((row_img,img)) 
  37.    i = i+1 
  38. plt.imshow(all_img)     
  39. plt.axis('off'

下面就是我們的效果圖,不知道大家是否能一眼就把所有的logo都認(rèn)全

 

 

揭開互聯(lián)網(wǎng)公司的神秘面紗,數(shù)據(jù)解讀那些slay整個(gè)行業(yè)的互聯(lián)網(wǎng)公司

 

 

最后是各位大佬的拼圖,不知道大家第一眼看到的是哪位大佬,第一眼看到的大佬,或許就是你未來的老板

[[245115]]

作者介紹:徐麟,目前就職于上海唯品會(huì)產(chǎn)品技術(shù)中心,哥大統(tǒng)計(jì)數(shù)據(jù)狗,從事數(shù)據(jù)挖掘&分析工作,喜歡用R&Python玩一些不一樣的數(shù)據(jù)

責(zé)任編輯:未麗燕 來源: 數(shù)據(jù)森麟
相關(guān)推薦

2013-12-18 16:21:32

未來互聯(lián)網(wǎng)移動(dòng)互聯(lián)網(wǎng)

2010-08-31 10:49:33

2013-01-25 10:31:02

互聯(lián)網(wǎng)公司移動(dòng)互聯(lián)網(wǎng)船票

2014-11-03 11:02:27

軟件工程程序員

2015-08-06 13:57:58

初創(chuàng)謊言ceo

2021-01-11 09:50:30

互聯(lián)網(wǎng)公司面試

2018-05-23 15:44:49

2015-09-09 14:24:14

2015-06-24 15:35:54

2015-05-28 16:11:07

互聯(lián)網(wǎng)+

2015-11-16 09:50:11

2015-11-17 09:09:56

2018-12-17 08:59:38

2019-06-17 11:17:20

互聯(lián)網(wǎng)中年人工作

2020-04-24 15:47:31

互聯(lián)網(wǎng)公司裁員

2016-08-12 00:30:45

互聯(lián)網(wǎng)數(shù)據(jù)埋點(diǎn)

2015-10-19 10:28:14

2019-03-15 19:41:39

MySQL面試數(shù)據(jù)庫

2018-08-15 09:02:59

產(chǎn)業(yè)互聯(lián)網(wǎng)工業(yè)互聯(lián)網(wǎng)物聯(lián)網(wǎng)

2019-11-18 17:01:13

程序員技術(shù)跳槽那些事兒
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)