python で PDF 取り扱いライブラリのインストール
ReportLab・wkhtmltopdf / pdfkit・PyPDF2・pdfminer.six・tabula-py
を使えるようにする
python でPDF作成編集、テキスト、表の抽出をすることができるようになる
reportlab のインストールは
Pythonのreportlabの使い方まとめ
を参考に
pip install reportlab
を実行
WARNING: You are using pip version 21.2.4; however, version 21.3 is available. You should consider upgrading via the '/home/snowpool/anaconda3/bin/python -m pip install --upgrade pip' command.
という警告がでたら
pip のアップデートが必要なので
python -m pip install --upgrade pip
で pip をアップデートする
pdfkit は
HTMLをPDFに変換するライブラリ「pdfkit」をインストールする
を参考に
pip install pdfkit
でインストール
次に PyPDF2
【Python】「PyPDF2ライブラリ」によるPDFファイルの結合・分割と画像の抽出
を参考にインストール
pip だと画像の抽出に一部欠陥があるため
Github のインストーラーがおすすめらしい
https://github.com/mstamy2/PyPDF2
へアクセス
Code をクリックすると
Download ZIP がでるので
これでダウンロード
unzip PyPDF2-master.zip
で解凍して
cd PyPDF2-master/ python setup.py install
でインストール
pdfminer.six は
【Python】pdfminer.six:PDFからテキストを取得・抽出する
を参考に
pip install pdfminer.six
でインストール
を参考に
pip install tabula-py
次に
pyinstaller
pyinstallerインストール ( Python3, Ubuntu 20.04 )
を参考に
pip3 install pyinstaller
でインストール