自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Pandas實(shí)用技巧:SAC機(jī)制!

大數(shù)據(jù) 數(shù)據(jù)分析
我們將數(shù)據(jù)進(jìn)行g(shù)roup分組操作,切分成3種顏色,3種顏色代表3個(gè)不同的組別;對(duì)3個(gè)不同的組別使用函數(shù)foo(),函數(shù)可以內(nèi)置或者自定義。

本文轉(zhuǎn)載自微信公眾號(hào)「尤而小屋」,作者Peter  。轉(zhuǎn)載本文請(qǐng)聯(lián)系Peter的公眾號(hào)。

大家好,我是Peter~

本文給大家介紹的是Pandas中非常實(shí)用的SAC過(guò)程。首先我們需要明白什么是SAC機(jī)制

圖片

SAC

SAC指的是分組操作中的 Split-Apply-Combine 3個(gè)過(guò)程,分別代表的數(shù)據(jù)的切割、應(yīng)用和組合。

1、Split:切割的過(guò)程,就是通過(guò)某個(gè)指定的信息進(jìn)行分組,生成不同的組別

2、Apply:應(yīng)用的過(guò)程,對(duì)不同的組別使用不同的功能函數(shù),比如求和、求均值、最值等;函數(shù)可以python、pandas等內(nèi)置函數(shù),也可以是自定義的函數(shù)來(lái)實(shí)現(xiàn)各種功能等

3、Combine:組合的過(guò)程,將Apply應(yīng)用之后的結(jié)果再次組合在一起,得到最終的結(jié)果

通常情況下,SAC過(guò)程都是需要和groupby函數(shù)聯(lián)合使用。

圖解SAC

下面有兩張圖能夠解釋SAC的過(guò)程。

圖片

圖1

圖1中,我們將數(shù)據(jù)進(jìn)行g(shù)roup分組操作,切分成3種顏色,3種顏色代表3個(gè)不同的組別;對(duì)3個(gè)不同的組別使用函數(shù)foo(),函數(shù)可以內(nèi)置或者自定義。

最終將3個(gè)組別應(yīng)用了foo函數(shù)之后的結(jié)果進(jìn)行組合。下面給了一個(gè)例子:

圖片

圖2

  • key是待切分的字段,data是待應(yīng)用的數(shù)據(jù)
  • Split過(guò)程:通過(guò)ABC分成3個(gè)組別
  • Apply過(guò)程:3個(gè)組別應(yīng)用某個(gè)函數(shù)規(guī)則
  • Combine過(guò)程:將求和(sum就是指定規(guī)則)的結(jié)果組合在一起

Pandas應(yīng)用SAC

在這里我們使用鳶尾花iris數(shù)據(jù)集來(lái)解釋?zhuān)?/p>

import pandas as pd
import numpy as np
import seaborn as sns

iris = sns.load_dataset("iris")
iris.head() # 前5條

圖片

iris.shape

# (150,5

這個(gè)數(shù)據(jù)集總共是150條,我們隨機(jī)取出10條

圖片

下面是SAC過(guò)程:

圖片

df1中我們使用的求和,df2中使用的是求均值。

在后面的文章會(huì)介紹:

  • groupby對(duì)象的內(nèi)部機(jī)制
  • 如何通過(guò)agg函數(shù)來(lái)實(shí)現(xiàn)對(duì)不同的字段指定不同的函數(shù)
  • 如何對(duì)分組數(shù)據(jù)實(shí)現(xiàn)過(guò)濾filter?
責(zé)任編輯:武曉燕 來(lái)源: 尤而小屋
相關(guān)推薦

2009-09-04 10:27:28

Linux實(shí)用技巧linux操作系統(tǒng)linux

2022-03-23 09:18:10

Git技巧Linux

2009-12-21 15:50:39

2009-01-03 09:34:30

ASP.NET.NET性能優(yōu)化

2011-04-08 15:40:01

Oracle認(rèn)證

2022-10-11 08:00:47

多線程開(kāi)發(fā)技巧

2024-05-17 08:52:43

SQL實(shí)用技巧行列轉(zhuǎn)換

2010-09-14 10:41:24

DIV+CSS排版

2009-12-09 11:21:30

Linux實(shí)用技巧

2019-12-22 23:10:19

LinuxSSH加密

2010-10-08 15:44:17

vim

2019-11-25 10:12:59

Python技巧工具

2009-12-23 17:32:35

Linux構(gòu)建軟路由

2019-10-10 16:31:51

PyCharmPythonWindows

2010-11-02 15:36:30

jQuery

2019-10-12 15:42:36

CSS代碼前端

2022-05-30 09:01:13

CSS技巧前端

2022-09-15 07:05:09

Windows電腦技巧

2012-08-28 08:54:16

Windows Ser

2024-03-28 08:15:09

Spring技巧配置
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)