自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="p0kqh"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

數(shù)據(jù)科學(xué)家在使用Python時常犯的九個錯誤

作者：Abdelilah MOULIDA 2022-10-13 15:31:32

開發(fā) 前端

通過應(yīng)用軟件工程最佳實踐，可以交付質(zhì)量更好數(shù)據(jù)科學(xué)的項目。更好的質(zhì)量可能是更少的錯誤、可靠的結(jié)果和更高的編碼效率。

最佳實踐都是從錯誤中總結(jié)出來的，所以這里我們總結(jié)了一些遇到的最常見的錯誤，并提供了如何最好地解決這些錯誤的方法、想法和資源。

1、不使用虛擬環(huán)境

這本身不是編碼問題，但我仍然認為每種類型的項目進行環(huán)境的隔離是一個非常好的實踐。

為什么要為每個項目使用專用環(huán)境呢？

第一個原因是Python本身包管理的問題，我們想盡量減少包和版本之間的沖突。

另外一個原因是我們代碼和依賴可以方便的部署到任意的位置

使用虛擬環(huán)境可以從Anaconda 或 Pipenv 開始。如果想更深入那么 Docker 是首選。

2、過度使用Jupyter Notebooks

Notebooks 非常適合用于教育目的和做一些快速而復(fù)雜的分析工作，但它不能作為一個好的 IDE。

一個好的 IDE 是應(yīng)對數(shù)據(jù)科學(xué)任務(wù)時的真正武器，可以極大地提高您的工作效率。

Notebooks 很適合做實驗，而且可以輕松地將結(jié)果展示給其他人。但是它很容易出錯，當(dāng)涉及到執(zhí)行長期、協(xié)作和可部署的項目時，最好還是使用IDE，例如 VScode、Pycharm、Spyder 等。

3、使用絕對而不是相對路徑

絕對路徑的最大問題是無法進行方便部署，解決這個問題的主要方法是將工作目錄設(shè)置為項目根目錄，并且不要再項目中包含項目目錄外的文件，并且在代碼中的所有路徑均使用相對路徑。

import pandas as pd
 import numpy as np
 import os
 #### 錯誤的方式 #####
 excel_path1 = "C:\\Users\\abdelilah\\Desktop\\mysheet1.xlsx"
 excel_path2 = "C:\\Users\\abdelilah\\Desktop\\mysheet2.xlsx"
 mydf1 = pd.read_excel(excel_path1)
 mydf2 = pd.read_excel(excel_path2)
 
 #### 正確的方式 ####
 DATA_DIR = "data"
 #將要讀取的文件復(fù)制到data目錄
 crime06_filename = "CrimeOneYearofData_2006.xlsx"
 crime07_filename = "CrimeOneYearofData_2007.xlsx"
 crime06_df = pd.read_excel(os.path.join(DATA_DIR, crime06_filename))
 crime07_df = pd.read_excel(os.path.join(DATA_DIR, crime07_filename))

4、不處理警告

當(dāng)我們的代碼能夠運行但產(chǎn)生奇怪的警告消息，我們很高興終于讓代碼運行并收到了有意義的輸出。但是我們需要處理這些警告嗎？

首先，警告本身并不是錯誤，但它們是會引起我們對潛在錯誤或問題的提示。當(dāng)你的代碼中能夠運行成功但可能不是它的預(yù)期方式時，警告就會出現(xiàn)。

我遇到的最常見的警告是 Pandas 的“SettingwithCopyWarning”和“DeprecationWarning”。

SettingwithCopyWarning最大的原因是 Pandas 檢測到鏈式賦值（Chained Assignment）時發(fā)生的警告，我們應(yīng)該避免對鏈式索引的結(jié)果賦值,因為這個操作有可能會報warning也有可能不會報。

DeprecationWarning 通常指出 Pandas 棄用了某些功能，并且您的代碼在使用更高版本時會中斷。

這里的建議并不是要處理所有的警告，但是一定要對所有警告產(chǎn)生的原因有所了解，要知道在特定項目中那些警告式可以忽略的，那些警告的出現(xiàn)對結(jié)果會有影響，應(yīng)當(dāng)避免。

5、沒有使用（很少使用）列表推導(dǎo)式

列表推導(dǎo)式是 python 的一個非常強大的特性。許多 for 循環(huán)可以用更易讀、更 Python 且速度更快的列表推導(dǎo)來代替。

可以在下面看到一個示例代碼，該代碼旨在讀取目錄中的 CSV 文件?？梢钥吹?，在使用列表推導(dǎo)時添很容易維護。

import pandas as pd
 import os
 
 DATA_PATH = "data"
 filename_list = os.listdir(DATA_PATH)
 
 #### 不好的方法 #####
 csv_list = []
 for fileaname in filename_list:
  csv_list.append(pd.read_csv(os.path.join(DATA_PATH, filename)))
   
 #### 建議 ####
 csv_list = [pd.read_csv(os.path.join(DATA_PATH, filename)) for filename in filename_list]
 list comprehensions
 csv_list = [pd.read_csv(os.path.join(DATA_PATH,
        filename)) for filename in filename_list if    
        filename.endswith(".csv")]

6、不使用類型注釋

類型注釋(或類型提示)是為變量分配類型的方法。在IDE進行智能感知的提示時可以為我們提供指示變量/參數(shù)的類型。這不僅可以提高我們開發(fā)的速度，也可以對我們閱讀代碼有很大的幫助

def mystery_combine(a, b, times):
    return (a + b) * times

如果這么寫，我們根本不知道a，b和times的類型

def mystery_combine(a: str, b: str, times: int) -> str:
    return (a + b) * times

但是加上了類型注釋，我們就知道a和b是字符串times是整數(shù)

需要說明的是：python在3.5版本的時候引入了類型注釋，python并不會在執(zhí)行時檢查類型注釋，他只是為IDE提供了一個方便靜態(tài)類型檢查工具，對動態(tài)語言做靜態(tài)類型檢查，來避免一些潛在的錯誤。

7、pandas代碼不規(guī)范

方法鏈是 pandas 的一個很棒的特性，但是如果在一行中包含了很多的操作，代碼可能會變得不可讀。

有一個技巧可以讓這種方式邊的簡單，將表達式放入括號中，則可以對表達式的每個組件使用一行。

var_list = ["clicks", "time_spent"]
 var_list_Q = [varname + "_Q" for varname in var_list]
 
 #不可讀的方法
 df_Q = df.groupby("id").rolling(window=3, min_periods=1, on="yearmonth[var_list].mean().reset_index().rename(columns=dict(zip(var_list, var_list_Q)))
 
 #可讀性強的方法
 df_Q = (
    df
    .groupby("id")
    .rolling(window=3, min_periods=1, on="yearmonth")[var_list]
    .mean()
    .reset_index()
    .rename(columns=dict(zip(var_list, var_list_Q))))

8、不遵守 PEP 約定

剛開始使用 Python 進行編程時，代碼可能是簡陋并且不可讀的，這是因為我們并沒有自己的設(shè)計規(guī)則來讓我的代碼看起來更好。如果我們自己來設(shè)計這種規(guī)則是費事費力的并且這種規(guī)則需要很多的實踐，好在Python官方有已經(jīng)指定好的規(guī)則：PEP，它是 Python 的官方樣式指南。

雖然PEP的規(guī)則很多并且很繁瑣，我們可以忽略了一些 PEP 規(guī)則，但可以在 90% 的代碼中使用了它們。

9、你不使用編碼輔助工具

您想在編碼方面大幅提高生產(chǎn)力嗎？請開始使用編碼輔助工具，它通過巧妙的自動完成、打開文檔和提供改進代碼的建議來提供幫助。

pylance， Kite ，tabnine，copilot都是非常好的選擇。

責(zé)任編輯：華軒來源： DeepHub IMBA

Python 軟件工程編碼

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="42vwu"></style>