自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<wbr id="uci6c"></wbr>

<sub id="uci6c"></sub>

^{<thead id="uci6c"></thead>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

告別無聊循環(huán)！Python幫你自動化處理文件

作者：讀芯術(shù) 2020-11-23 16:18:21

開發(fā) 后端自動化

當(dāng)代碼投入生產(chǎn)時，你需要去組織代碼的文件。讀寫、創(chuàng)建和運(yùn)行許多代碼文件是件非常耗時的事。本文將展示如何自動化這些繁瑣的操作：

本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID：AI_Discovery)

當(dāng)代碼投入生產(chǎn)時，你需要去組織代碼的文件。讀寫、創(chuàng)建和運(yùn)行許多代碼文件是件非常耗時的事。本文將展示如何自動化這些繁瑣的操作：

遍歷一個目錄中的文件
創(chuàng)建尚未建立的嵌套文件
使用bash for循環(huán)來運(yùn)行一個有多個輸入端的文件

在處理數(shù)據(jù)科學(xué)項(xiàng)目時，這些技巧為筆者節(jié)省了大量的時間。希望對你也有用!

遍歷一個目錄中的文件

如果有如下多個數(shù)據(jù)需要讀取和處理：

├── data 
│   ├── data1.csv 
│   ├── data2.csv 
│   └── data3.csv 
└── main.py

可以手動地一次讀取一個文件：

import pandas as pd def process_data(df): 
   passdf = pd.read_csv(data1.csv) 
process_data(df)df2 = pd.read_csv(data2.csv) 
process_data(df2)df3 = pd.read_csv(data3.csv) 
process_data(df3)

這是可行的，但是當(dāng)有超過三個數(shù)據(jù)時，效率就會變得很低。如果上述腳本中唯一改變的是數(shù)據(jù)，為什么不用for循環(huán)來訪問每個數(shù)據(jù)呢?

下面的腳本允許我們遍歷指定目錄中的文件：

import os 
      import pandas as pd 
      defloop_directory(directory:str): 
         '''Loop files in thedirectory''' 
                 for filename in os.listdir(directory): 
             if filename.endswith(".csv"): 
                  file_directory = os.path.join(directory,filename) 
                  print(file_directory) 
                  pd.read_csv(file_directory) 
                               if __name__=='__main__': 
         loop_directory('data/') 
  
data/data3.csv 
data/data2.csv 
data/data1.csv

對上面腳本的解釋如下：

for filename in os.listdir(directory) : 在一個指定的目錄中遍歷文件。
if filename.endswith(".csv") :運(yùn)行(訪問?)以‘.csv’ 結(jié)尾的文件。
file_directory = os.path.join(directory, filename) : 連接父目錄(' data ')和該目錄中的文件。

現(xiàn)在就可以在‘data’目錄中訪問所有的文件啦!

如果不存在，就創(chuàng)建嵌套文件

有時你可能想要通過創(chuàng)建嵌套文件來管理代碼或模型，在之后更容易地尋找。比如，可以運(yùn)用‘model 1’來明確規(guī)定一個有著具體特征的程序。當(dāng)使用model 1時，你可能想要嘗試運(yùn)用不同種類的機(jī)器學(xué)習(xí)模型來訓(xùn)練數(shù)據(jù)(‘model1/XGBoost’)。

在使用各個機(jī)器學(xué)習(xí)模型時，我們甚至想要去保存不同樣式的模型，因?yàn)樗鼈兯\(yùn)用的超參數(shù)存在不同。因此，模型目錄就像下面的示例一樣復(fù)雜：

model 
├── model1 
│   ├── NaiveBayes 
│   └── XGBoost 
│       ├── version_1 
│       └── version_2 
└── model2 
    ├── NaiveBayes 
    └── XGBoost 
        ├── version_1 
        └── version_2

對每個所創(chuàng)的模型手動地建立嵌套文件可能需要花費(fèi)很長的時間。有沒有能夠自動化這個進(jìn)程的方法?有，通過使用 os.makedirs(datapath)。

defcreate_path_if_not_exists(datapath): 
                                     '''Create the new file if not exists andsave the data''' 
                 ifnot os.path.exists(datapath): 
                                         os.makedirs(datapath) 
                                         
                                 if __name__=='__main__': 
                          create_path_if_not_exists('model/model1/XGBoost/version_1')

運(yùn)行上面的文件，可以看到嵌套文件‘model/model2/XGBoost/version_2’自動建成了。現(xiàn)在便可以將模型或者數(shù)據(jù)儲存到新的目錄里了!

import joblib 
      import os 
             defcreate_path_if_not_exists(datapath): 
          '''Create thenew file if not exists and save the data''' 
                 ifnot os.path.exists(datapath): 
             os.makedirs(datapath) 
             if __name__=='__main__': 
               # Create directory 
       model_path ='model/model2/XGBoost/version_2' 
        create_path_if_not_exists(model_path) 
          # Save file 
       joblib.dump(model, model_path)

Bash for循環(huán)：用不同參數(shù)運(yùn)行一個文件

如果要運(yùn)行一個具有不同參數(shù)的文件怎么辦呢?比如，可能要用同一個腳本去預(yù)測使用不同模型的數(shù)據(jù)。

import joblib 
             # df = ... 
             model_path ='model/model1/XGBoost/version_1' 
      model = joblib.load(model_path) 
      model.predict(df)

如果一個腳本需要長時間來運(yùn)行且有著多個要運(yùn)行的模型，用腳本一個一個地運(yùn)行會是非常耗時。有什么辦法能讓電腦獨(dú)立自動地用一條命令行運(yùn)行第1，2，3...，10個模型嗎?

有的，可以使用bash for循環(huán)。首先，使用sys.argv來解析命令行參數(shù)。如果想要在命令行上重寫配置文件可以使用類如hydra的工具。

import sys 
      import joblib 
             # df = ... 
    
             model_type = sys.argv[1] 
      model_version = sys.argv[2] 
      model_path =f'''model/model1/{model_type}/version_{model_version}''' 
      print('Loading modelfrom', model_path, 'for training') 
             model = joblib.load(model_path) 
      mode.predict(df) 
>>> python train.py XGBoost 1 
Loading model from model/model1/XGBoost/version_1 for training

腳本已經(jīng)被指令為使用模具第一版的XGBoost來預(yù)測命令行上的數(shù)據(jù)。現(xiàn)在便能在不同版本的模具中使用bash for循環(huán)。如果能用Python使用for循環(huán)，也可以在如下的終端上達(dá)成上述的目標(biāo)。

$ for version in 2 3 4 
> do 
> python train.py XGBoost $version 
> done

敲擊Enter來分隔各行，輸出：

Loading model from model/model1/XGBoost/version_1 for training 
Loading model from model/model1/XGBoost/version_2 for training 
Loading model from model/model1/XGBoost/version_3 for training 
Loading model from model/model1/XGBoost/version_4 for training

現(xiàn)在便可以讓腳本使用不同的模具來運(yùn)行啦!

恭喜!現(xiàn)在你已經(jīng)學(xué)會如何一次自動地讀取和創(chuàng)造多個文件，如何用不同的參數(shù)運(yùn)行一個文檔，過去丟在瑣碎工作中的時間可以利用起來做更重要的任務(wù)啦。

責(zé)任編輯：華軒來源：讀芯術(shù)

Python 開發(fā)工具

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<u id="40g3e"><center id="40g3e"></center></u>