自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<big id="x6za1"><fieldset id="x6za1"></fieldset></big>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

Pandas Query 方法深度總結(jié)，你學(xué)會了嗎？

作者：周蘿卜 2022-07-26 00:25:57

數(shù)據(jù)庫其他數(shù)據(jù)庫

事實(shí)證明實(shí)際上可以使用 query()? 方法做到這一點(diǎn)。因此，在今天的文章中，我們將展示如何使用 query() 方法對數(shù)據(jù)框執(zhí)行查詢。

大多數(shù) Pandas 用戶都熟悉 iloc[]? 和 loc[] 索引器方法，用于從 Pandas DataFrame 中檢索行和列。但是隨著檢索數(shù)據(jù)的規(guī)則變得越來越復(fù)雜，這些方法也隨之變得更加復(fù)雜而臃腫。

同時(shí) SQL 也是我們經(jīng)常接觸且較為熟悉的語言，那么為什么不使用類似于 SQL 的東西來查詢我們的數(shù)據(jù)呢？

事實(shí)證明實(shí)際上可以使用 query()? 方法做到這一點(diǎn)。因此，在今天的文章中，我們將展示如何使用 query() 方法對數(shù)據(jù)框執(zhí)行查詢。

獲取數(shù)據(jù)

我們使用 kaggle 上的 Titanic 數(shù)據(jù)集作為本文章的測試數(shù)據(jù)集，下載地址如下：

https://www.kaggle.com/datasets/tedllh/titanic-train

當(dāng)然也可以在文末獲取到蘿卜哥下載好的數(shù)據(jù)集

載入數(shù)據(jù)

下面文末就可以使用 read_csv 來載入數(shù)據(jù)了

import pandas as pd
df = pd.read_csv('titanic_train.csv')
df

數(shù)據(jù)集有 891 行和 12 列：

使用 query() 方法

讓我們找出從南安普敦 (‘S’) 出發(fā)的所有乘客，可以使用方括號索引，代碼如下所示：

df[df['Embarked'] == 'S']

如果使用 query() 方法，那么看起來更整潔：

df.query('Embarked == "S"')

與 SQL 比較，則 query() 方法中的表達(dá)式類似于 SQL 中的 WHERE 語句。

結(jié)果是一個(gè) DataFrame，其中包含所有從南安普敦出發(fā)的乘客：

query() 方法接受字符串作為查詢條件串，因此，如果要查詢字符串列，則需要確保字符串被正確括起來：

很多時(shí)候，我們可能希望將變量值傳遞到查詢字符串中，可以使用 @ 字符執(zhí)行此操作：

embarked = 'S'
df.query('Embarked == @embarked')

或者也可以使用 f 字符串，如下所示：

df.query(f'Embarked == "{embarked}"')

就個(gè)人而言，我認(rèn)為與 f-string 方式相比，使用 @ 字符更簡單、更優(yōu)雅，你認(rèn)為呢

如果列名中有空格，可以使用反引號 (``) 將列名括起來：

df.query('`Embarked On` == @embarked')

以 In-place 的方式執(zhí)行 query 方法

當(dāng)使用 query() 方法執(zhí)行查詢時(shí)，該方法將結(jié)果作為 DataFrame 返回，原始 DataFrame 保持不變。如果要更新原始 DataFrame，需要使用 inplace 參數(shù)，如下所示：

df.query('Embarked == "S"', inplace=True)

當(dāng) inplace 設(shè)置為 True 時(shí)，query() 方法將不會返回任何值，原始 DataFrame 被修改。

指定多個(gè)條件查詢

我們可以在查詢中指定多個(gè)條件，例如假設(shè)我想獲取所有從南安普敦 (‘S’) 或瑟堡 (‘C’) 出發(fā)的乘客。如果使用方括號索引，這種語法很快變得非常笨拙：

df[(df['Embarked'] == 'S') | (df['Embarked'] == 'C')]

我們注意到，在這里我們需要在查詢的條件下引用 DataFrame 兩次，而使用 query() 方法，就簡潔多了：

df.query('Embarked in ("S","C")')

查詢結(jié)果如下：

如果要查找所有不是從南安普敦（‘S’）或瑟堡（‘C’）出發(fā)的乘客，可以在 Pandas 中使用否定運(yùn)算符 (~)：

df[~((df['Embarked'] == 'S') | (df['Embarked'] == 'C'))]

使用 query() 方法，只需要使用 not 運(yùn)算符：

df.query('Embarked not in ("S","C")')

以下輸出顯示了從皇后鎮(zhèn) (‘Q’) 出發(fā)的乘客以及缺失值的乘客：

說到缺失值，該怎么查詢?nèi)笔е的兀?dāng)應(yīng)用于列名時(shí)，我們可以使用 isnull() 方法查找缺失值：

df.query('Embarked.isnull()')

現(xiàn)在將顯示 Embarked 列中缺少值的行：

其實(shí)可以直接在列名上調(diào)用各種 Series 方法：

df.query('Name.str.len() < 20')  # find passengers whose name is 
                                 # less than 20 characters
df.query(f'Ticket.str.startswith("A")') # find all passengers whose 
                                        # ticket starts with A

比較數(shù)值列

我們還可以輕松比較數(shù)字列：

df.query('Fare > 50')

以下輸出顯示了票價(jià)大于 50 的所有行：

比較多個(gè)列

還可以使用 and、or 和 not 運(yùn)算符比較多個(gè)列，以下語句檢索 Fare 大于 50 和 Age 大于 30 的所有行：

df.query('Fare > 50 and Age > 30')

下面是查詢結(jié)果：

查詢索引

通常當(dāng)我們想根據(jù)索引值檢索行時(shí)，可以使用 loc[] 索引器，如下所示：

df.loc[[1],:]  # get the row whose index is 1; return as a dataframe

但是使用 query() 方法，使得事情變得更加直觀：

df.query('index==1')

結(jié)果如下：

如果要檢索索引值小于 5 的所有行：

df.query('index<5')

結(jié)果如下：

我們還可以指定索引值的范圍：

df.query('6 <= index < 20')

結(jié)果如下：

比較多列

我們還可以比較列之間的值，例如以下語句檢索 Parch 值大于 SibSp 值的所有行：

df.query('Parch > SibSp')

結(jié)果如下：

總結(jié)

從上面的示例可以看出，query() 方法使搜索行的語法更加自然簡潔，希望感興趣的小伙伴多加練習(xí)，真正的達(dá)到融會貫通的地步哦！

責(zé)任編輯：武曉燕來源：蘿卜大雜燴

Pandas Query 索引器

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<legend id="lra1a"><track id="lra1a"><dfn id="lra1a"></dfn></track></legend>