自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

一款懶人必備的Python爬蟲神器

開發(fā) 后端
大廠出品果然不同,使用它在不考慮運行效率(有異步但是我懶得看了)的情況下可以輕松實現(xiàn)復雜操作,懶人最愛!

前言

今天把最近的一個應用做好了,測試了一下運行沒有問題,剩下的就是檢驗一下結(jié)果如何.從光譜到Lab值通常使用matlab中的roo2lab(),不過經(jīng)過我最近的測試發(fā)現(xiàn)轉(zhuǎn)換的結(jié)果并不理想,而且這個轉(zhuǎn)化的代碼也不是我寫的所以另尋他法,找到了下面這個網(wǎng)頁。

動手

有了這個網(wǎng)頁,很簡單就想到去解析.然后很快找到了這個api,可以看到用post提交表單請求就可以返回結(jié)果。


于是一番操作,修改form表單,構(gòu)造傳入的spectrum,但是最終請求得到的卻是一個頁面,并不是想要的json.然后許久沒寫爬蟲的我直接惱火,想到自動化工具模擬操作.可是selenium很難用而且還得去找瀏覽器新版本的驅(qū)動,隨后直接搜索一番,發(fā)現(xiàn)了這個神器—playwright。

首先老規(guī)矩去它的首頁看看教程

接著安裝一下playwright以及瀏覽器的驅(qū)動。

pip install pytest-playwright
playwright install

第二步的時候很慢,所以我只等他下載好了chrome和ffmpeg直接就ctrl+c停止了,畢竟我也用不著其他的瀏覽器驅(qū)動。

然后稍微瀏覽一下這個文檔功能非常豐富,不過我用到的功能也不多,接下來的使用才是真正適合我們懶人的。

記住一行代碼

python -m playwright codegen xxx.com

其中xxx.com就是我們的目標網(wǎng)址,運行后會創(chuàng)建一個熟悉的自動化頁面,然后我們就進行一些我們想要的操作,比如設(shè)置開始的最小波長為400nm,然后觀察以及光源改為D65/10.一系列操作后會看到對應的代碼已經(jīng)生成好了。

至今為止我還沒有寫一行代碼,不過構(gòu)造輸入的光譜還是得自己來的。

把這一段代碼復制下來,然后自己寫構(gòu)造輸入的函數(shù)(就幾行),然后通過選擇器(直接左鍵元素復制xpath)得到lab值,這樣目標就搞定了。

整體代碼如下:

import time
from playwright.sync_api import Playwright, sync_playwright, expect
import numpy as np
data_test=np.loadtxt('./dist/1_res.csv',delimiter=',')
def get_str(arr):
arr_str=""
for i in arr:
arr_str+=str(format(i,".2f"))+"\r\n"
return arr_str
labs=[]
def run(playwright: Playwright) -> None:
browser = playwright.chromium.launch(headless=False)
context = browser.new_context()
# Open new page
page = context.new_page()
# Go to https://www.qtccolor.com/secaiku/tool/spectrum
page.goto("https://www.qtccolor.com/secaiku/tool/spectrum")
# Click div[role="tab"]:has-text("光譜數(shù)據(jù)")
page.locator("div[role=\"tab\"]:has-text(\"光譜數(shù)據(jù)\")").click(
# Click text=最小波長:nm
page.locator("text=最小波長:nm").click()
# Fill [placeholder="\33 80"]
page.locator("[placeholder=\"\\33 80\"]").fill("400")
# Select 1964
page.locator("select[name=\"obs\"]").select_option("1964")
# Select D65
page.locator("select[name=\"ill\"]").select_option("D65")
# Fill textarea[name="spectrum"]
for i in range(len(data_test)):
inputs=get_str(data_test[i,:])
# Click textarea[name="spectrum"]
page.locator("textarea[name=\"spectrum\"]").click()
page.locator("textarea[name=\"spectrum\"]").press("Control+a")
page.locator("textarea[name=\"spectrum\"]").fill(inputs)
# Click button:has-text("轉(zhuǎn)換顏色")
page.locator("button:has-text(\"轉(zhuǎn)換顏色\")").click()
time.sleep(1)
# Click text=Lab0.000.000.00 >> td >> nth=1
L=float(page.locator('xpath=//*[@id="scroll_container"]/div[1]/div/div[2]/table/tbody/tr[2]/td[2]').inner_text())
# Click text=Lab0.000.000.00 >> td >> nth=2
a=float(page.locator('xpath=//*[@id="scroll_container"]/div[1]/div/div[2]/table/tbody/tr[2]/td[3]').inner_text())
# Click text=Lab0.000.000.00 >> td >> nth=3
b=float(page.locator('xpath=//*[@id="scroll_container"]/div[1]/div/div[2]/table/tbody/tr[2]/td[4]').inner_text())
print(L,a,b)
labs.append([L,a,b])
# ---------------------
context.close()
browser.close()
with sync_playwright() as playwright:
run(playwright)
np.savetxt('./1_lab_res.csv',labs,delimiter=",")

可以說從安裝到實現(xiàn)就幾分鐘,而且特別容易上手,我第一次用也一下就能實現(xiàn)效果。

剩下的就是簡單的寫個函數(shù)計算色差啥的就沒難度了。

最后

大廠出品果然不同,使用它在不考慮運行效率(有異步但是我懶得看了)的情況下可以輕松實現(xiàn)復雜操作,懶人最愛!

責任編輯:龐桂玉 來源: Python專欄
相關(guān)推薦

2020-08-28 10:40:13

PythonFaker數(shù)據(jù)

2021-04-27 09:00:59

PythonAidLearning編程神器

2019-02-25 10:18:43

工具代碼測試

2015-06-08 22:39:37

云鴿

2022-01-11 09:05:07

工具Python 命令行

2014-01-13 15:00:51

InxiLinux硬件

2022-04-20 09:26:08

Mock前端開發(fā)工具

2023-09-06 08:19:53

2020-04-27 09:25:16

Python爬蟲庫數(shù)據(jù)科學

2021-05-18 13:25:28

feapder爬蟲Python

2018-01-17 15:05:22

框架設(shè)計爬蟲Scrapy

2024-12-27 12:10:58

2023-06-08 08:46:37

Motrix下載工具

2025-03-17 09:19:45

2022-06-28 22:13:33

Polars數(shù)據(jù)處理與分析

2021-03-11 11:15:59

工具軟件命令

2022-07-12 09:35:59

JSON可視化工具

2021-01-13 22:52:37

Windows 10電腦軟件

2020-05-26 14:15:09

開源網(wǎng)盤 免費

2020-08-17 10:10:34

DockerWatchtowerLinux
點贊
收藏

51CTO技術(shù)棧公眾號