xdoc2txt

ファイルからテキストを抽出するツール。pdfやoffice文書は勿論、それ以外にも大概の文書ファイルに対応している。


最近、テキストをコピーできないpdfファイルが増えてきた気がするのでこれがあると便利かも。
ただし、縦書きの文書(官報とか)だと結果がエラい事になる。(笑)


しかし、たぬきんさんが7/8に書いてるネタの元になった「引用のためにコピーすらできない、探す事すら面倒な作りの検索できないサイトからもってきた PDF」ってどれなんだろか。このツールを試してみようと思って、書かれた内容から検索してみたんだけど、どれもテキストはコピー可能なんだよなぁ。(^^; コレとかコレとか。ひょっとして、苦情が多くて変更された、とか。