VS Code 14 個神級擴展,提高生產(chǎn)力!
作為面向數(shù)據(jù)的工作者,你的工具箱就是一切。合適的工具集可以節(jié)省你的時間、減少挫折感并使你的工作流程更加高效。我們擁有的最強大的工具之一是Visual Studio Code (VS Code)。憑借其可擴展性和龐大的生態(tài)系統(tǒng),VS Code 可以通過合適的擴展集轉(zhuǎn)變?yōu)榻K極數(shù)據(jù)工程工作站。
如果你尚未使用這些 VS Code 擴展,那么你將錯過一些重大的生產(chǎn)力提升。從調(diào)試復雜的數(shù)據(jù)管道到簡化代碼生成,這些工具都是改變游戲規(guī)則的工具。讓我們深入了解每個數(shù)據(jù)工程師都應該信賴的14 個頂級 VS Code 擴展,以將他們的生產(chǎn)力提升到一個新的水平。
1. Jupyter(下載量超過 8500 萬次)
用于交互式筆記本和數(shù)據(jù)探索
如果你使用 Python 和數(shù)據(jù)科學,你很可能使用過 Jupyter 筆記本。這個擴展將Jupyter功能直接引入 VS Code。無論你是探索數(shù)據(jù)集、運行 Python 腳本還是測試 ETL 管道,此擴展都允許你在交互式筆記本式環(huán)境中工作,而無需離開代碼編輯器。它非常適合臨時分析、嘗試新想法以及在開發(fā)設置中可視化數(shù)據(jù)。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-toolsai.jupyter
2. Docker(下載量超過 3900 萬次)
用于容器化和環(huán)境管理
作為數(shù)據(jù)工程師,跨不同平臺和機器管理環(huán)境是一項持續(xù)的挑戰(zhàn)。進入Docker。此擴展通過讓你直接在 VS Code 內(nèi)與 Docker 容器交互來簡化容器管理。無論你是為數(shù)據(jù)管道構建本地環(huán)境還是將其部署到云基礎架構,Docker 都可以無縫管理和運行容器化應用程序。它對于環(huán)境的一致性至關重要,尤其是在使用微服務和分布式系統(tǒng)時。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-azuretools.vscode-docker
3. Parquet Viewer(下載量超過 181K)
用于無縫查看 Parquet 文件
Parquet 是大數(shù)據(jù)工作流中最廣泛使用的列式數(shù)據(jù)格式之一,尤其是在Apache Spark或Hadoop等系統(tǒng)中。Parquet Viewer擴展可讓你直接在 VS Code 中輕松查看和檢查 Parquet 文件。無論你是在調(diào)查數(shù)據(jù)集還是驗證架構更改,此擴展都無需使用外部工具來打開和瀏覽 Parquet 文件。
圖片
https://marketplace.visualstudio.com/items?itemName=dvirtz.parquet-viewer
4.Rainbow CSV(下載量超過 1000 萬次)
為了獲得更干凈、更易讀的 CSV/TSV 文件
數(shù)據(jù)清理是數(shù)據(jù)工程師生活中的一大部分,處理CSV或TSV文件往往是不可避免的。Rainbow CSV可以解決這個問題,它為 CSV/TSV 文件添加了顏色突出顯示,使文件更易于閱讀和解釋。它以視覺上可區(qū)分的方式格式化列,并幫助你一眼就發(fā)現(xiàn)諸如值放錯位置或分隔符不正確等問題。
圖片
https://marketplace.visualstudio.com/items?itemName=mechatroner.rainbow-csv
5. YAML(下載量超過 1900 萬次)
用于管理配置文件
數(shù)據(jù)工程的很大一部分涉及設置、管理和排除Kubernetes、Airflow或dbt等工具的配置故障。YAML文件通常用于配置,但如果格式不正確,它們很快就會失控。此擴展提供語法突出顯示、驗證和錯誤檢測,確保你的配置保持干凈且無錯誤。
圖片
https://marketplace.visualstudio.com/items?itemName=redhat.vscode-yaml
6.Data Wrangler(下載量超過 58.7 萬次)
用于數(shù)據(jù)清理和轉(zhuǎn)換
無論你的自動化程度如何,數(shù)據(jù)清理都是每個數(shù)據(jù)工程項目的一部分。Data Wrangler提供了豐富的用戶界面,可直接在 VS Code 中分析、清理和轉(zhuǎn)換數(shù)據(jù)。它提供有見地的統(tǒng)計數(shù)據(jù)、可視化效果,甚至在你清理時自動生成 Pandas 代碼。非常適合快速探索數(shù)據(jù)集并在將其傳遞到管道之前對其進行轉(zhuǎn)換。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-toolsai.datawrangler
7. Copilot(下載量超過 2200 萬次)
人工智能代碼輔助
需要編寫 SQL 查詢或操作數(shù)據(jù)集,但又覺得重復的任務讓人不知所措?GitHub Copilot就是你的新朋友。Copilot 由OpenAI 的 GPT提供支持,可幫助生成代碼片段、解決復雜邏輯,甚至提出優(yōu)化建議。它是加速代碼編寫的強大工具,讓你可以更專注于解決問題,而不是編寫樣板代碼。
圖片
https://marketplace.visualstudio.com/items?itemName=GitHub.copilot
8. Pylance(下載量超過 1.18 億次)
對于 Python IntelliSense 和類型檢查
Python 是數(shù)據(jù)工程的通用語言,而Pylance 則通過高級 IntelliSense 功能增強了你的編碼體驗。它提供類型檢查、更好的自動完成功能和更準確的建議,所有這些都可以幫助你編寫更簡潔、更高效的 Python 代碼。作為一名數(shù)據(jù)工程師,你可能會同時使用多個庫,因此擁有強大的類型信息可以防止出現(xiàn)錯誤并提高你的工作效率。
圖片
https://marketplace.visualstudio.com/items?itemName=ms-python.vscode-pylance
9. SQLTools(下載量超過 460 萬次)
用于數(shù)據(jù)庫探索和 SQL 查詢
作為數(shù)據(jù)工程師,使用數(shù)據(jù)庫是他們的第二天性。SQLTools簡化了 VS Code 中的數(shù)據(jù)庫管理,讓你可以輕松連接和查詢PostgreSQL、MySQL 和其他關系數(shù)據(jù)庫。借助內(nèi)置的查詢運行器、架構探索器和自動完成功能,SQLTools 非常適合快速探索數(shù)據(jù)庫和優(yōu)化查詢。
https://marketplace.visualstudio.com/items?itemName=mtxr.sqltools
10. Cloud Code(下載量超過 150 萬次)
對于 GCP 云開發(fā)和 Gemini AI
Cloud Code擴展程序利用 Google Cloud 和 Gemini 的強大功能,幫助你比以往更快、更輕松地構建應用程序。它就像 VS Code 中云原生開發(fā)的個人助理。它可幫助你無縫地與 Kubernetes、Cloud Run 和 Google Cloud API 協(xié)作。
無論你部署應用程序、編寫 YAML 配置還是在云中進行調(diào)試,它都能為你提供智能工具和流暢的工作流程。它非常適合管理基于云的管道和服務的數(shù)據(jù)工程師 - 不再為云設置而煩惱!
圖片
https://marketplace.visualstudio.com/items?itemName=GoogleCloudTools.cloudcode
11. Indent-Rainbow(下載量超過 910 萬次)
為了更清潔、更易于導航的代碼
使用 Python 或 YAML 的挑戰(zhàn)之一是復雜文件可能難以導航。Indent -Rainbow為縮進級別添加了顏色編碼,這使得理解深度嵌套文件的結(jié)構變得更加容易。非常適合調(diào)試或重構復雜的數(shù)據(jù)轉(zhuǎn)換腳本。
圖片
https://marketplace.visualstudio.com/items?itemName=oderwat.indent-rainbow
12. SQLite Viewer(下載量超過 150 萬次)
用于快速數(shù)據(jù)庫探索
有時,你只需要快速查看 SQLite 文件。無論你是在設計原型還是調(diào)試應用程序,SQLite Viewer都允許你直接在 VS Code 中打開和查詢 SQLite 數(shù)據(jù)庫。當你想在小型數(shù)據(jù)集進入主管道之前檢查它們或測試數(shù)據(jù)提取工作流時,這尤其有用。
圖片
https://marketplace.visualstudio.com/items?itemName=qwtel.sqlite-viewer
13. Postman(下載量超過 120 萬次)
用于 API 測試和監(jiān)控
當你的數(shù)據(jù)提取涉及 API 時(無論是從外部源提取數(shù)據(jù)還是將其發(fā)送到下游系統(tǒng)),Postman都是無價之寶。此擴展將 API 測試直接集成到 VS Code 中,允許你發(fā)送請求、監(jiān)控響應和實時調(diào)試 API 調(diào)用。對于構建復雜 ETL 管道的數(shù)據(jù)工程師來說,這是一個必備工具,可確保你的 API 集成按預期運行。
圖片
https://marketplace.visualstudio.com/items?itemName=Postman.postman-for-vscode
14.GitLens(下載量超過 3600 萬次)
用于 Git 集成和版本控制
在構建復雜的數(shù)據(jù)管道時,版本控制至關重要,而GitLens將 Git 在 VS Code 中提升到了一個新的水平。它提供了詳細的責任注釋。
圖片
https://marketplace.visualstudio.com/items?itemName=eamodio.gitlens