2小時完成的第一個副業(yè)單子:Python修正Excel表格數(shù)據(jù)
一、前言
大家好,今天我來介紹一下我接的第一個Python單子。我完成這個單子前后不到2小時。
首先我接到這個單子的想法是處理Excel表,在兩個表之間建立聯(lián)系,并通過項目需求,修改excel表中的數(shù)據(jù)。我是運用面向過程寫的,將每一步都放在了不同的函數(shù)中,下面讓我來介紹一下我是怎么通過自己的思路一步一步完成的。
先上客戶的需求:
二、代碼實現(xiàn)及講解
1. 模塊的導(dǎo)入
主要用到的模塊為openpyxl、random:
import openpyxl
import random
from openpyxl.utils.cell import get_column_letter,column_index_from_string
除了運用到openpyxl和random還用到了openpyxl中的utils包下cell模塊的兩個方法,第一個方法get_column_letter的作用是將整型轉(zhuǎn)換為對應(yīng)excel中列屬性的字符串,例如:12轉(zhuǎn)換為L,50轉(zhuǎn)換為AX
第二個方法是將字符串轉(zhuǎn)換為整型,其本質(zhì)類似于10進制和27進制之間的轉(zhuǎn)換,當(dāng)然你也可以自己寫,下面附上自己寫的行(整型)轉(zhuǎn)換為列(字符串)的代碼:
def num_to_string(n):
column = n - 1
real_colum = ''
while column >= 26:
value = column // 26
column = column % 26
real_colum += chr(value + 64)
real_colum += chr(column + 65)
return real_colum
2. 獲取“數(shù)據(jù)原表”中數(shù)據(jù)
#創(chuàng)建一個全局變量MATERIAL_MESSAGE
MATERIAL_MESSAGE = []
#獲取小宛中數(shù)據(jù)
def get_construct_message():
#讀取數(shù)據(jù)原表.xlsx表
wb = openpyxl.load_workbook('數(shù)據(jù)原表.xlsx')
#獲取獲取當(dāng)前活動工作表,默認為第一個表
ws = wb.active
#獲取在生產(chǎn)記錄更新.xlsx中的可以用到的數(shù)據(jù)存入MATERIAL_MESSAGE中
for row in range(1,ws.max_row + 1):
if ws[f'A{row}'].value == '日期':
for i in range(ord('B'),ord('I')):
material = []
#將日期轉(zhuǎn)換為與生產(chǎn)記錄更新中相對應(yīng)寫法的形式
date = ws[f'B{row}'].value.translate(str.maketrans('年月','--'))
date = date.replace('號','')
material.append(date)
i = chr(i)
material.append(ws[f'{i}{row + 1}'].value)
material.append(ws[f'{i}{row + 3}'].value)
MATERIAL_MESSAGE.append(material)
print(MATERIAL_MESSAGE)
3. 獲取生產(chǎn)記錄更新表中的日期和材料
# 將客戶要求的對應(yīng)數(shù)據(jù)存入字典中
TABLES = {"水泥":"水泥1","粉煤灰":"煤灰","河沙":"沙1","粗骨料1":"石1","粗骨料2":"石2","減水劑":"外加劑","水":"水"}
#存入生產(chǎn)記錄更新表的日期和其所在的行數(shù)
DATE = []
#存入生產(chǎn)記錄更新表的材料和其所在的列數(shù)
MATERIAL = []
wb = openpyxl.load_workbook('生產(chǎn)記錄更新.xlsx')
ws = wb.active
#獲取日期
def get_date():
for row in range(3,ws.max_row + 1):
#將日期進行分割合并轉(zhuǎn)換成與MATERIAL_MESSAGE中對應(yīng)日期的格式
date = str(ws[f'B{row}'].value).split()[0]
date_list = date.split('-')
if '0' in date_list[1]:
date_list[1] = date_list[1].replace('0','')
if '0' in date_list[2]:
date_list[2] = date_list[2].replace('0','')
date = '-'.join(date_list)
DATE.append([date,row])
pprint.pprint(DATE)
#獲取材料
def get_material():
n = 0
for column in ws[1]:
n += 1
#判斷該單元格的內(nèi)容是否在TABLES中
if column.value in TABLES.values():
#運用行列轉(zhuǎn)換的方法進行轉(zhuǎn)換
MATERIAL.append([column.value,get_column_letter(n - 1)])
pprint.pprint(MATERIAL)
DATE表部分數(shù)據(jù):
MATERIAL表數(shù)據(jù):
4. 對生產(chǎn)數(shù)據(jù)更新表中數(shù)據(jù)的修改
#兩個參數(shù)分別為材料的類型和所在的列數(shù)
def update_default(matrial,letter):
for row in range(3,ws.max_row + 1):
#判斷單元格是否為空
if ws[f'{letter}{row}'].value != None:
for i in range(len(MATERIAL_MESSAGE)):
#需求條件,要將連個表中的日期和材料類型進行一一對應(yīng)
if DATE[row-3][0] == MATERIAL_MESSAGE[i][0] and matrial == TABLES[MATERIAL_MESSAGE[i][1]]:
#修改形參letter對應(yīng)列的每個符號要求的單元格對應(yīng)的設(shè)定值
ws[f'{letter}{DATE[row - 3][1]}'].value = MATERIAL_MESSAGE[i][2]
#分別獲取該列列號的下兩列對應(yīng)的列號
letter_random = get_column_letter(column_index_from_string(letter) + 2)
letter_real = get_column_letter(column_index_from_string(letter) + 1)
#判斷該列是否在這三列中,若在其中則得到-2到2之間的隨機數(shù),否則-1到1之間的隨機數(shù),并更新誤差值
if letter in ('AV','BB','BE'):
ws[f'{letter_random}{DATE[row - 3][1]}'].value = round(random.uniform(-2, 2), 1)
else:
ws[f'{letter_random}{DATE[row - 3][1]}'].value = round(random.uniform(-1, 1), 1)
#運用設(shè)定值和誤差值更新中間的實際值
ws[f'{letter_real}{DATE[row - 3][1]}'].value = round(ws[f'{letter}{DATE[row - 3][1]}'].value * (1 + ws[f'{letter_random}{DATE[row - 3][1]}'].value * 0.01),2)
5. 最后,調(diào)用函數(shù)并保存數(shù)據(jù)
def main():
get_construct_message()
get_date()
get_material()
for i in MATERIAL:
update_default(i[0],i[1])
wb.save('生產(chǎn)記錄更新.xlsx')
if __name__ == "__main__":
main()
三、效果展示
修改前部分數(shù)據(jù):
修改后部分數(shù)據(jù):
四、結(jié)尾
通過自己的的兩個小時的努力奮戰(zhàn)完成了這個單子,總的來說,難度不在于怎么修改數(shù)據(jù),而是在于怎么把兩個表相互關(guān)聯(lián),通過這次接單讓我對excel表能夠更加熟練地進行操作,接單既能提升自己的能力,又能賺點外快,何樂而不為呢?