神技能!一招教你免費(fèi)搞定PDF轉(zhuǎn)word
你是否因?yàn)橄胍獙DF 轉(zhuǎn)成 Word 文檔而為此專門充會(huì)員?別著急,今天我將為大家分享幾種不需要充會(huì)員的方法,讓你輕松實(shí)現(xiàn)PDF到Word的轉(zhuǎn)換。廢話不多說,讓我們直接上干貨吧!
1、Linux命令行
Linux命令行基本上是萬能的,你要你愿意,什么都可以做,介紹幾種在linux命令行下pdf轉(zhuǎn)word的方法,并且還可以批量轉(zhuǎn)換哦。
友情提示:這幾個(gè)命令功能不只支持pdf轉(zhuǎn)word,各種格式都可以轉(zhuǎn)
- Pdftotext命令
我們可以借助 pdftotext工具進(jìn)行簡(jiǎn)單的 PDF 轉(zhuǎn)文本,然后再將文本內(nèi)容粘貼到 Word 中。
安裝 pdftotext 工具
sudo apt-get install -y poppler-utils #ubuntu系統(tǒng)
sudo yum install -y poppler-utils #Centos系統(tǒng)
使用方法
pdftotext file.pdf output.txt
接下來,打開 Word,將生成的 output.txt 文本內(nèi)容復(fù)制粘貼到 Word 文檔中,然后進(jìn)行格式調(diào)整。
使用腳本批量轉(zhuǎn)換,將pdf文件都上傳到/data/files目錄下,然后執(zhí)行如下腳本
for file in /data/files/*.pdf; do pdftotext "$file"; done
- pandoc命令
Pandoc是一個(gè)強(qiáng)大的文檔轉(zhuǎn)換工具,它支持多種格式之間的轉(zhuǎn)換,包括 PDF轉(zhuǎn)Word
使用方法:https://pandoc.org/demos.html
首先,確保你已經(jīng)安裝了 Pandoc
sudo yum -y install pandoc
然后,使用以下命令將PDF轉(zhuǎn)為Word
pandoc -s your_file.pdf -o output.docx
這里的 -s 表示輸入文件為標(biāo)準(zhǔn)文檔格式(例如 PDF),-o 表示輸出文件為指定格式(例如 Word 文檔)。
- unoconv命令
unoconv 是一個(gè)與 LibreOffice 相關(guān)的工具,可以用于文檔格式之間的轉(zhuǎn)換。確保你已經(jīng)安裝了 unoconv
sudo apt-get install unoconv
然后,使用以下命令將 PDF 轉(zhuǎn)為 Word
unoconv -f docx -i FilterName=writer_pdf_import your_file.pdf
這里的 -f docx 表示輸出文件格式為 Word 文檔,-i FilterName=writer_pdf_import 表示使用 PDF 導(dǎo)入過濾器。
- libreoffice命令
sudo yum install libreoffice
是的,LibreOffice 也提供了命令行工具來進(jìn)行文檔轉(zhuǎn)換。你可以使用 soffice 命令來實(shí)現(xiàn) PDF 到 Word 的轉(zhuǎn)換。
以下是使用 soffice 進(jìn)行轉(zhuǎn)換的示例命令:
soffice --headless --convert-to docx your_file.pdf
這里的 --headless 表示無頭模式,即在沒有用戶界面的情況下運(yùn)行,convert-to docx 表示將文件轉(zhuǎn)換為 Word 文檔格式(docx)
除了pdf轉(zhuǎn)word之外,上面命令還支持word,pdf,txt,html等格式的互相轉(zhuǎn)換,有興趣的可以通過--help查看使用幫助。
2、python腳本
Python 是我們的得力助手,我們可以使用 PyMuPDF
庫(kù)來處理 PDF 文件,并將其內(nèi)容寫入 Word 文檔
pip install PyPDF2 python-docx
import fitz # PyMuPDF
from docx import Document
def pdf_to_word(pdf_path, word_path):
doc = Document()
# 讀取 PDF 文件
pdf_document = fitz.open(pdf_path)
for page_num in range(pdf_document.page_count):
page = pdf_document[page_num]
# 將 PDF 頁(yè)面的文本寫入 Word 文檔
text = page.get_text()
doc.add_paragraph(text)
# 保存 Word 文檔
doc.save(word_path)
if __name__ == "__main__":
pdf_to_word("知識(shí)點(diǎn).pdf", "知識(shí)點(diǎn).docx")
- pdf2docx模塊
安裝pdf2docx模塊
pip install pdf2docx #安裝pdf模塊
pip install -i https://mirrors.aliyun.com/pypi/simple/ pdf2docx #慢的話嘗試國(guó)內(nèi)源
# 導(dǎo)入pdf2docx模塊
from pdf2docx import parse
pdf_file = '知識(shí)點(diǎn).pdf'
docx_file = '知識(shí)庫(kù).docx'
# convert pdf to docx
parse(pdf_file, docx_file)
執(zhí)行腳本
從執(zhí)行上來看pdf2word是按頁(yè)轉(zhuǎn)換的,34頁(yè)文檔5s轉(zhuǎn)換完成,效果也蠻不錯(cuò)的
學(xué)會(huì)上面2種方法,你將輕松玩轉(zhuǎn)各種格式的文檔轉(zhuǎn)換問題,再也不用為開會(huì)員而煩惱了。想象一下,當(dāng)你的女神有了類似的需求,你掌握了上面這些技巧,是不是秀了一把,那可是獲得了優(yōu)先擇偶權(quán),想想就很激動(dòng)。