34個(gè)Python自動(dòng)化辦公庫!
來源:
奇酷教育 發(fā)表于:
2022-10-14 18:13:26
34個(gè)Python自動(dòng)化辦公庫!
超實(shí)用!整理了34個(gè)Python自動(dòng)化辦公庫!
Python
Excel自動(dòng)化庫
// 1.xlwings 庫
官網(wǎng):
https://www.xlwings.org/
特點(diǎn):xlwings 是開源且免費(fèi)的,預(yù)裝了 Anaconda 和 WinPython,可在 Windows 和 macOS 上運(yùn)行。通過 Python 腳本或 Jupyter notebook 自動(dòng)化 Excel,通過宏從 Excel 調(diào)用 Python,并編寫用戶定義的函數(shù)(UDF 僅適用于 Windows)
// 2.openpyxl 庫
官網(wǎng):
https://openpyxl.readthedocs.io
特點(diǎn):openpyxl 是一個(gè)用于讀取 / 編寫 Excel 2010 xlsx/xlsm/xltx/xltm 文件的 Python 庫。它是由于缺乏從 Python 中讀取 / 編寫 Office Open XML 格式的現(xiàn)有庫而誕生的。
// 3.xlrd 庫
官網(wǎng):
https://pypi.python.org/pypi/xlrd
特點(diǎn):在 python 中,xlrd 庫是一個(gè)很常用的讀取 excel 文件的庫,其對 excel 文件的讀取可以實(shí)現(xiàn)比較精細(xì)的控制。
// 4.xlwt 庫
官網(wǎng):
https://pypi.org/project/xlwt/
特點(diǎn):類比于 xlrd 的 reader,那么 xlwt 就相對于 writer,而且很純正的一點(diǎn)就是它只能對 Excel 進(jìn)行寫操作。xlwt 和 xlrd 不光名字像,連很多函數(shù)和操作格式也是完全相同。
// 5.xlutils 庫
官網(wǎng):
https://pypi.org/project/xlutils/
特點(diǎn):xlutils(excel utilities)是一個(gè)提供了許多操作修改 excel 文件方法的庫。xlutils 庫也僅僅是通過復(fù)制一個(gè)副本進(jìn)行操作后保存一個(gè)新文件,xlutils 庫就像是 xlrd 庫和 xlwt 庫之間的一座橋梁,因此,xlutils 庫是依賴于 xlrd 和 xlwt 兩個(gè)庫的。
// 6.xlsxwriter 庫
官網(wǎng):
https://xlsxwriter.readthedocs.io/
特點(diǎn):xlsxwriter 是用于創(chuàng)建 Excel XLSX 文件的 Python 模塊,可用于將文本、數(shù)字、公式和超鏈接寫入 Excel2007 + XLSX 文件中的多個(gè)工作表。它支持格式化等功能??梢哉f除了 Excel 本身,就屬這個(gè)功能最齊全了。
// 7.pandas 庫
官網(wǎng):
https://www.pypandas.cn/docs/
特點(diǎn):pandas 是基于 NumPy 的一種工具,該工具是為了解決數(shù)據(jù)分析任務(wù)而創(chuàng)建的。Pandas 納入了大量庫和一些標(biāo)準(zhǔn)的數(shù)據(jù)模型,提供了高效地操作大型數(shù)據(jù)集所需的工具。
// 8.Marmir 庫
官網(wǎng):
https://github.com/brianray/mm
特點(diǎn):Marmir 采用 Python 數(shù)據(jù)結(jié)構(gòu)并將其轉(zhuǎn)換為電子表格。它是類固醇上的 xlwt 和 google 電子表格。目標(biāo)是使用最少的配置輕松生成多種類型的有用表文件。
Python
Word自動(dòng)化庫
// 9.python-docx 庫
官網(wǎng):
https://python-docx.readthedocs.io/en/latest/
特點(diǎn):python-docx 是一個(gè)用于創(chuàng)建和更新 Microsoft Word (.docx) 文件的 Python 庫??焖匍_始、處理文檔、處理文本、使用截面、使用頁眉和頁腳、API基礎(chǔ)理、解樣式、使用樣式理解圖片和其他形狀。只對 windows 平臺有效。
// 10.textract 庫
官網(wǎng):
https://gitee.com/mirrors/textract
特點(diǎn):它同時(shí)兼顧 “doc” 和 “docx”,但安裝過程需要一些依賴。你可以批量的用 python 生成 word 文件,推薦使用 docx,不需要會太多。
Python
PPT自動(dòng)化庫
// 11.python-pptx 庫
官網(wǎng):
https://python-pptx.readthedocs.io
特點(diǎn):python-pptx 是一個(gè)用于創(chuàng)建和更新 PowerPoint (.pptx) 文件的 Python 庫。典型用途是從數(shù)據(jù)庫內(nèi)容生成自定義 PowerPoint 演示文稿,可通過單擊 Web 應(yīng)用程序中的鏈接下載。
Python
ODF自動(dòng)化庫
// 12.Relatorio 庫
官網(wǎng):
https://pypi.org/project/relatorio/
特點(diǎn):Relatorio 是一個(gè)模板庫,它提供了一種輕松輸出多種文件(odt、ods、png、svg 等)的方法。通過為它們創(chuàng)建插件可以輕松添加對更多文件類型的支持。Relatorio 還提供了一個(gè)報(bào)告存儲庫,允許您將 python 對象和報(bào)告鏈接在一起,按 mimetype/name/python 對象查找報(bào)告。ODF:開放文檔格式(外文名:OpenDocument Format,外語簡稱:ODF)是一種規(guī)范,基于 XML(標(biāo)準(zhǔn)通用標(biāo)記語言的子集)的文件格式,因應(yīng)試算表、圖表、演示稿和文字處理文件等電子文件而設(shè)置。
Python
PDF自動(dòng)化庫
// 13.PyPDF2 庫
官網(wǎng):
https://github.com/mstamy2/PyPDF2
特點(diǎn):PyPDF2 是一個(gè)純 Python PDF 庫,能夠拆分、合并、裁剪和轉(zhuǎn)換 PDF 文件的頁面。它還可以向 PDF 文件添加自定義數(shù)據(jù)、查看選項(xiàng)和密碼。它可以從 PDF 中檢索文本和元數(shù)據(jù),也可以將整個(gè)文件合并在一起。
// 14.ReportLab 庫
官網(wǎng):
https://www.reportlab.com/opensource/
特點(diǎn):ReportLab 是久經(jīng)考驗(yàn)、超強(qiáng)大的開源引擎,用于創(chuàng)建復(fù)雜的、數(shù)據(jù)驅(qū)動(dòng)的 PDF 文檔和自定義矢量圖形。它是免費(fèi)的、開源的,并且是用 Python 編寫的。
// 15.PDFminer 庫
官網(wǎng):
https://github.com/euske/pdfminer
特點(diǎn):PDFMiner 是一款用于 PDF 文檔的文本提取工具。
Python
郵件自動(dòng)化庫
// 16.Django Celery SES 庫
官網(wǎng):
https://github.com/StreetVoice/django-celery-ses
特點(diǎn):這個(gè)包提供了一個(gè) EmailBackend 來利用 django-celery 發(fā)送電子郵件。您可以將 EmailBackend 插入您的項(xiàng)目中,而無需對代碼進(jìn)行任何修改。
// 17.Envelopes 庫
官網(wǎng):
http://tomekwojcik.github.io/envelopes/
特點(diǎn):Envelopes 是 Python 的電子郵件和 smtplib 模塊的包裝器。它旨在使在 Python 中處理外發(fā)電子郵件變得簡單而有趣。
// 18.Flanker 庫
官網(wǎng):
https://github.com/mailgun/flanker
特點(diǎn):由 mailgun 開源的 Flanker - email address and MIME parsing for Python 是一個(gè)解析高效、容錯(cuò)率不錯(cuò)的 python 第三方擴(kuò)展庫。python 3 也可以正常使用,該庫包含了郵件地址解析和郵件 mime 格式解析。
// 19.imbox 庫
官網(wǎng):
https://github.com/martinrusev/imbox
特點(diǎn):用于讀取 IMAP 郵箱并將電子郵件內(nèi)容轉(zhuǎn)換為機(jī)器可讀數(shù)據(jù)的 Python 庫
// 20.inbox.py 庫
官網(wǎng):
https://github.com/billzhong/inbox.py
特點(diǎn):這是您見過的最簡單的 SMTP 服務(wù)器。它是異步的。一個(gè)實(shí)例每秒應(yīng)該處理一千多封電子郵件。
// 21.sync-engine 庫
官網(wǎng):
https://github.com/nylas/sync-engine
特點(diǎn):Nylas 同步引擎在強(qiáng)大的電子郵件同步平臺之上提供了一個(gè) RESTful API,可以輕松地在電子郵件之上構(gòu)建應(yīng)用程序。
// 22.Lamson 庫
官網(wǎng):
https://github.com/zedshaw/lamson
特點(diǎn):Lamson 是一個(gè)純 Python SMTP 服務(wù)器,旨在以現(xiàn)代 Web 框架(如 Django)的風(fēng)格創(chuàng)建強(qiáng)大而復(fù)雜的郵件應(yīng)用程序。
// 23.Marrow Mailer 庫
官網(wǎng):
https://github.com/marrow/mailer
特點(diǎn):Marrow Mailer 是一個(gè) Python 庫,可以輕松地從您的應(yīng)用程序發(fā)送電子郵件。通過使用 Marrow Mailer,您可以:輕松構(gòu)建純文本和 HTML 電子郵件;提高電子郵件傳遞的可測試性;使用不同的郵件投遞管理策略;例如立即,延遲,甚至多服務(wù)器等。
// 24.Modoboa 庫
官網(wǎng):
https://github.com/modoboa/modoboa
特點(diǎn):Modoboa 是一個(gè)郵件托管和管理平臺,包括一個(gè)現(xiàn)代和簡化的 Web 用戶界面。它提供了有用的組件,例如管理面板或網(wǎng)絡(luò)郵件。
// 25.smtplib 庫
官網(wǎng):
https://docs.python.org/zh-cn/3/library/smtplib.html
特點(diǎn):smtplib 模塊是 python 中 smtp (簡單郵件傳輸協(xié)議) 的客戶端實(shí)現(xiàn)。我們可以使用 smtplib 模塊,輕松的發(fā)送電子郵件。
Python
微信自動(dòng)化庫
// 26.Python wxpy 庫
官網(wǎng):
https://wxpy.readthedocs.io/zh/latest/
特點(diǎn):微信機(jī)器人/可能是最優(yōu)雅的微信個(gè)人號API,wxpy 在 itchat 的基礎(chǔ)上,通過大量接口優(yōu)化提升了模塊的易用性,并進(jìn)行豐富的功能擴(kuò)展。
Python
文件處理自動(dòng)化庫
// 27.os 庫
官網(wǎng):
https://docs.python.org/zh-cn/3/library/os.html?highlight=os#module-os
特點(diǎn):本模塊提供了一種使用與操作系統(tǒng)相關(guān)的功能的便捷式途徑。如果你只是想讀寫一個(gè)文件,請參閱 open(),如果你想操作文件路徑,請參閱 os.path 模塊,如果你想讀取通過命令行給出的所有文件中的所有行,請參閱 fileinput 模塊。為了創(chuàng)建臨時(shí)文件和目錄,請參閱 tempfile 模塊,對于高級文件和目錄處理,請參閱 shutil 模塊。
Python
綜合功能自動(dòng)化庫
// 28.win32com 庫
官網(wǎng):
https://pypi.org/project/pywin32/
特點(diǎn):win32com 模塊主要為 Python 提供調(diào)用 windows 底層組件對 word 、Excel、PPT 等進(jìn)行操作的功能,只能在 Windows 環(huán)境下使用,并且需要安裝 office 相關(guān)軟件才行(WPS 也行)。
// 29.unoconv 庫
官網(wǎng):
https://github.com/unoconv/unoconv
特點(diǎn):是一個(gè)命令行工具,可以將 LibreOffice 可以導(dǎo)入的任何文檔格式轉(zhuǎn)換為 LibreOffice 可以導(dǎo)出的任何文檔格式。它利用 LibreOffice 的 UNO 綁定進(jìn)行文檔的非交互式轉(zhuǎn)換,也支持 OpenOffice。
// 30.Tablib 庫
官網(wǎng):
https://www.osgeo.cn/tablib/
特點(diǎn):Python tablib 模塊是第三方模塊,主要作用是將數(shù)據(jù)導(dǎo)出為各種不同的格式,包括 excel,json,html,yaml,csv,tsv 等格式,怎么樣,有點(diǎn)心動(dòng)了吧,當(dāng)然這個(gè)模塊使用起來也是超級簡單的。
// 31.SnowNLP 庫
官網(wǎng):
https://github.com/isnowfy/snownlp
特點(diǎn):SnowNLP 是一個(gè) python 寫的類庫,可以方便的處理中文文本內(nèi)容,是受到了 TextBlob 的啟發(fā)而寫的,由于現(xiàn)在大部分的自然語言處理庫基本都是針對英文的,于是寫了一個(gè)方便處理中文的類庫,并且和 TextBlob 不同的是,這里沒有用 NLTK,所有的算法都是自己實(shí)現(xiàn)的,并且自帶了一些訓(xùn)練好的字典。注意本程序都是處理的 unicode 編碼,所以使用時(shí)請自行 decode 成 unicode。
// 32.TextBlob 庫
官網(wǎng):
https://textblob.readthedocs.io
特點(diǎn):TextBlob 是一個(gè)用于處理文本數(shù)據(jù)的 Python(2 和 3)庫。它提供了一個(gè)簡單的 API,用于深入研究常見的自然語言處理 (NLP) 任務(wù),例如詞性標(biāo)注、名詞短語提取、情感分析、分類、翻譯等。
// 33.TextGrocery 庫
官網(wǎng):
https://textgrocery.readthedocs.io
特點(diǎn):TextGrocery 是一個(gè)基于 LibLinear 和結(jié)巴分詞的短文本分類工具,特點(diǎn)是高效易用,同時(shí)支持中文和英文語料。
// 34.NumPy 庫
官網(wǎng):
https://www.numpy.org.cn/
特點(diǎn):NumPy 是 Python 中科學(xué)計(jì)算的基礎(chǔ)包。它是一個(gè) Python 庫,提供多維數(shù)組對象,各種派生對象(如掩碼數(shù)組和矩陣),以及用于數(shù)組快速操作的各種 API,有包括數(shù)學(xué)、邏輯、形狀操作、排序、選擇、輸入輸出、離散傅立葉變換、基本線性代數(shù),基本統(tǒng)計(jì)運(yùn)算和隨機(jī)模擬等等。