自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

領(lǐng)導(dǎo)給了一堆無(wú)序雜亂的數(shù)據(jù),我寫(xiě)了個(gè)Python自動(dòng)化腳本

開(kāi)發(fā) 后端 自動(dòng)化
這個(gè)問(wèn)題算是群友答疑。如果說(shuō)同事或者老板給你一堆這樣的數(shù)據(jù),你估計(jì)會(huì)抓狂,該怎么處理呢?仔細(xì)觀察上面數(shù)據(jù)可以發(fā)現(xiàn),該數(shù)據(jù)有如下2個(gè)主要特點(diǎn)。

這個(gè)問(wèn)題算是群友答疑。如果說(shuō)同事或者老板給你一堆這樣的數(shù)據(jù),你估計(jì)會(huì)抓狂,該怎么處理呢?

 

領(lǐng)導(dǎo)給了一堆無(wú)序雜亂的數(shù)據(jù),我寫(xiě)了個(gè)Python自動(dòng)化腳本

仔細(xì)觀察上面數(shù)據(jù)可以發(fā)現(xiàn),該數(shù)據(jù)有如下2個(gè)主要特點(diǎn):

  • 每一行的數(shù)據(jù)長(zhǎng)度不同。第一行和第三行有4個(gè)屬性,第二行有5個(gè)屬性。
  • 不同行的屬性值,并不是對(duì)應(yīng)排列。

解題思路剖析

你可能會(huì)想,直接用Excel分裂。其實(shí)并不可行,因?yàn)椴煌械膶傩灾?,并不是?duì)應(yīng)排列。Excel分列導(dǎo)致的結(jié)果就是:不同的屬性,存在于相同的行。

 

[[339071]]

放棄Excel那條路之后,我就只能尋求Python的幫助了。我們要根據(jù)數(shù)據(jù)的特點(diǎn),選擇合適的數(shù)據(jù)存儲(chǔ)方法。最終問(wèn)題就轉(zhuǎn)化為:構(gòu)造數(shù)據(jù)源,然后創(chuàng)建DataFrame即可。

然后根據(jù)我們這個(gè)數(shù)據(jù)的特點(diǎn),我選擇構(gòu)造字典組成的列表這樣一個(gè)數(shù)據(jù),并利用它來(lái)創(chuàng)建DataFrame。

 

領(lǐng)導(dǎo)給了一堆無(wú)序雜亂的數(shù)據(jù),我寫(xiě)了個(gè)Python自動(dòng)化腳本

觀察我提供的這個(gè)案例和待解決的問(wèn)題,簡(jiǎn)直異曲同工。我們同樣可以將上述數(shù)據(jù)的每一行,都變成一個(gè)個(gè)鍵值對(duì)組成的字典。然后最外層用一個(gè)大列表,將所有的字典包含起來(lái)。

完整代碼

1)首先需要構(gòu)造練習(xí)數(shù)據(jù)

  1. import pandas as pd 
  2. x = {"信息":["年齡:12;性別:女;身高:22;愛(ài)好:打球"
  3.              "年齡:12;說(shuō)明:歷史數(shù)據(jù);性別:女;身高:22;愛(ài)好:打球"
  4.              "生日:2月3日;年齡:12;性別:女;愛(ài)好:打球"
  5.     } 
  6. df = pd.DataFrame(x) 
  7. df 

結(jié)果如下:

 

領(lǐng)導(dǎo)給了一堆無(wú)序雜亂的數(shù)據(jù),我寫(xiě)了個(gè)Python自動(dòng)化腳本

2)構(gòu)造字典組成的列表

  1. tmps_list = [] 
  2. for data in df["信息"].values
  3.     tmp_dict = {} 
  4.     for kv in data.split(";"): 
  5.         k, v = kv.split(":"
  6.         tmp_dict[k] = v 
  7.     tmps_list.append(tmp_dict) 
  8. tmps 

結(jié)果如下:

 

領(lǐng)導(dǎo)給了一堆無(wú)序雜亂的數(shù)據(jù),我寫(xiě)了個(gè)Python自動(dòng)化腳本

3)創(chuàng)建DataFrame

  1. df = pd.DataFrame(tmps) 
  2. df 

結(jié)果如下:

 

領(lǐng)導(dǎo)給了一堆無(wú)序雜亂的數(shù)據(jù),我寫(xiě)了個(gè)Python自動(dòng)化腳本

 

 

責(zé)任編輯:未麗燕 來(lái)源: 今日頭條
相關(guān)推薦

2024-05-13 16:29:56

Python自動(dòng)化

2022-02-17 13:03:28

Python腳本代碼

2024-08-16 21:51:42

2024-06-21 10:46:44

2024-11-13 13:14:38

2022-08-05 09:06:07

Python腳本代碼

2025-02-07 12:58:33

python自動(dòng)化腳本

2024-11-11 16:55:54

2021-09-13 10:11:08

Python冰冰自動(dòng)提醒

2024-08-14 14:42:00

2025-03-20 08:30:00

Python編程文件管理

2011-11-23 10:01:43

虛擬化軟件許可IIS

2019-08-14 10:49:20

Python編程語(yǔ)言代碼

2024-10-28 19:36:05

2022-03-10 10:12:04

自動(dòng)化腳本Bash

2022-03-09 09:29:13

人工智能機(jī)器學(xué)習(xí)萬(wàn)引定律

2016-09-22 16:09:36

大數(shù)據(jù)PB級(jí)NoSQL

2025-03-17 09:32:19

PythonExcel腳本

2025-04-02 08:20:00

Python自動(dòng)化文件管理腳本模板

2024-10-29 10:02:12

圖片自動(dòng)化腳本
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)