自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Python中實(shí)現(xiàn)“一行拆多行“和“多行并一行“,你會嗎?

開發(fā) 后端
今天粉絲提了下面這樣一個問題,其中一個是"一行拆多行",另外一個是"多行并一行",貌似群友用power query已經(jīng)解決了。但是基于Python怎么做呢?接著往下看。

[[339021]]

 粉絲提問

今天粉絲提了下面這樣一個問題,其中一個是"一行拆多行",另外一個是"多行并一行",貌似群友用power query已經(jīng)解決了。但是基于Python怎么做呢?接著往下看。

 

一行拆多行

上面這個問題我會提供兩個思路,供大家選擇,當(dāng)然肯定是越簡單得越好。每種方法中都有一些好用的技巧,希望大家能夠好好學(xué)習(xí)。

1)方法一

下方代碼中有很多重要的知識點(diǎn),需要我們下去好好學(xué)習(xí)一下,我只提供解題思路,關(guān)于每個知識點(diǎn)怎么用,希望大家下去自行研究學(xué)習(xí)。

  • Pandas.melt()函數(shù)的用法;
  • Series.str.split("/",expand=True)中,expand=True參數(shù)的用法;
  • Series.sort_values()對文本進(jìn)行排序;
  • Python中enumerate()函數(shù)的用法;

 

  1. import pandas as pd 
  2. # 讀取數(shù)據(jù) 
  3. df = pd.read_excel("test1.xlsx",sheet_name="Sheet1"
  4. # 將一列炸裂成多列 
  5. df[["類型1","類型2","類型3"]] = df["電影類型"].str.split("/",expand=True
  6. # 選取想要的列 
  7. df_final = df[["電影名","類型1","類型2","類型3"]] 
  8. # 將行轉(zhuǎn)列 
  9. df_final = df_final.melt(id_vars=["電影名"],value_name="類型"
  10. # 對“電影名”字段進(jìn)行排序 
  11. df_final = df_final[["電影名","類型"]] 
  12. df_final.sort_values(by="電影名",inplace=True
  13. # 刪除“類型==None”的行 
  14. for index,value in enumerate(df_final["類型"]): 
  15.     if value == None: 
  16.         df_final.drop(df_final.index[index],inplace=True
  17. df_final 

結(jié)果如下:

 

2)方法二

上述方法確實(shí)復(fù)雜,由于我的Pandas版本是0.23.4,因此無法使用explode()方法,進(jìn)行炸裂操作。在pandas0.25版本的時候,DataFrame中才新增了一個explode()方法,專門用來將一行變多行。

  • Pandas.explode()函數(shù)的用法;

 

  1. import pandas as pd 
  2. # 讀取數(shù)據(jù) 
  3. df = pd.read_excel("test1.xlsx",sheet_name="Sheet1"
  4. # 將一行拆分成列表形式,注意:這里不需要使用expand=True參數(shù) 
  5. df["type"] = df["電影類型"].str.split("/"
  6. # 直接炸裂指定列 
  7. df.explode("type"

結(jié)果如下:

 

 

 

 

多行并一行這里沒有使用什么特別的知識,好好的理解Pandas中分組聚合應(yīng)用某個函數(shù),即可輕松解決這個問題。

 

  1. import pandas as pd 
  2. # 讀取數(shù)據(jù) 
  3. df = pd.read_excel("test1.xlsx",sheet_name="Sheet2"
  4. # 分組聚合,應(yīng)用某個函數(shù) 
  5. def func(df): 
  6.     return ','.join(df.values
  7. df = df.groupby(by='電影名').agg(func).reset_index() 
  8. df 

結(jié)果如下:

 

 

責(zé)任編輯:華軒 來源: 數(shù)據(jù)分析與統(tǒng)計學(xué)之美
相關(guān)推薦

2016-12-02 08:53:18

Python一行代碼

2022-04-09 09:11:33

Python

2015-07-20 17:17:41

SQL Server

2020-08-19 10:30:25

代碼Python多線程

2011-08-25 09:17:31

Java調(diào)用存儲過程返回一行或多行結(jié)果集

2022-02-23 14:37:48

代碼Pythonbug

2021-11-02 16:25:41

Python代碼技巧

2024-08-08 09:15:08

SQL代碼復(fù)制表

2017-04-13 19:20:18

Python代碼并行任務(wù)

2021-05-28 07:39:17

SQL代碼操作

2024-11-08 17:22:22

2014-02-12 13:43:50

代碼并行任務(wù)

2017-04-05 11:10:23

Javascript代碼前端

2022-05-13 09:36:06

Python水印命令

2020-09-28 12:34:38

Python代碼開發(fā)

2024-08-01 09:57:17

DELETE死鎖工具

2024-07-04 00:30:17

2020-08-12 14:54:00

Python代碼開發(fā)

2021-04-22 11:27:24

Python命令水印

2017-10-26 13:40:11

Python一行代碼
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號