2021年03月のPythonでもっと自由を新着記事

Pythonを中心に日々勉強したことをブログを通じて発信してきます。何かお役にたつ情報があれば幸いです。

あつし

フォロー

参加テーマ

Pythonの外部ライブラリ(PyPDF2)によるPDFファイルの操作

PyPDF2はPDFファイルを操作するライブラリとしてよく使われています。日本語のテキストに非対応という我々日本人にとっては残念な部分もありますが、画像を抽出する、PDFの結合や分割処理といったことを簡単なコードで実現することができます。
2021/03/31 21:43
Pythonの外部ライブラリ(PDFMiner)によるPDFから文章を抽出する方法

今回の記事ではこれらのライブラリのうち「PDFMiner」を使って、PDFファイルからテキスト(文章)コンテンツを抽出する方法を図解で分かりやすく解説していきたいと思います。PDFの利便性と汎用性、Pythonの拡張性、データ分析・処理などそれぞれがもつ特徴を掛け合わせることでさら活用の幅が広がることでしょう。
2021/03/23 22:45