ReNamePDF PDFの内容からお好みでファイル名を抽出し一括変更するアプリ
にさんにち前にPDFのテキストの内容から特定の文字列を抜き出しファイル名を一括変換するアプリを公開しました。
このあぷりは欠点があって、PDF自体のテキスト読み込みが苦手な部分があるようです。
ようするに、ファイルの内容によってはテキストを全く読み取れない!
これじゃあかんとですよ!
さがしました。PDFのテキストデータをきっちり抽出ためのライブラリー!
有料っぽいのですが、個人で使う分には問題ない?
販売を考えているので、どのような結果になるかわからないけど、テキストデータ抜き出す程度なら無料で利用できそうです!
今回のアプリ名はReNamePDFとしました。
ほぼ機能が出来上がっています。
文字列の抽出条件をきめ細かく設定できるようにしました。
特定の文字を下から検索するとか、検索した文字から上へ3行目を抽出するとか・・・
今回の利用するライブラリーはjpgに書き出すことができるので、OCR機能を付けてOCRのテキスト内容からファイル名を一括変換するっていう機能も付けたらいいなーと思っています。
現在の画面状況は次の通りです。
前回と同様ですが、一度設定ファイルを作成しておくと次回からはPDFをドロップすることでReName欄に瞬時で抽出したファイル名を確認できます。
ファイル名変換ボタンでこれまた瞬時にファイル名を変更して完了できます。
使い方は前回と同じですね、対象文字列を設定してファイルにこの文字列が無いと処理されません。
対象文字列が本文中にあれば次の段階で、検索文字列を本文中から探すのですが、最上段から最下段から2方向から検索するシステムにしました。(なんとなく(笑))
検索した行を抽出することができるほかに、この行から二つ上の行を抽出するとか、4つ下の行を抽出するとかできる設定を設けました。(これもなんとなく・・・)
あとは、文字の削除や文字の入れ替えができます。文字の置換1が「模擬」で空欄なら削除 「M-」なら置き換えができます。また、置き換え文字を「@@」に
設定すると文字の置換を含む文字列以降削除されます。
前回は「..」でしたね、小さくてわかりにくいので@にしました。
登録・変更・削除ボタンもわかりやすく自然な仕上がりで動作します(笑)
抽出文字列設定は順番を変更できるようにしました。▲▼が設定行をアップ・ダウンで移動でき抽出結果も変化します。
また、抽出文字は緑・修正結果が青・最終結果は赤と色分けしてみ安くなったかな~と思います。
現在作成中のReNamePDFはサブスクによる有料です。1500円/年くらいを考えています。
もちろん、無料で利用は可能です。変換できるファイル数は固定させていただきますが・・・すいません。m(_ _)m
支払はPayPalのみです!アプリ上で支払いが完了すればすぐに変更可能なファイル数の上限が解除されます。
利用するパソコン一台につき1500円/年となりますのでご了承ください。
今後は、スキャナーで読み取ったPDFもOCR機能を追加してファイル名の自動一括設定ができる様に尽力いたします。(できるのか不安だけど・・・・)
利用しているPDFライブラリの画像出力機能は1ページを出力するのに3秒くらい時間がかかるから実用性はどうかな~と思っています。
解像度を落とせばそれなりに早くなるけどOCRの精度は落ちるのかな?
明日にはPayPalの自動清算機能を盛り込めばインストラーを公開できると思います。
利用頻度は少ないのかな~(笑
英文にも対応するので外国の方もよろしくね!
ディスカッション
コメント一覧
こんにちは! ReNamePDFは良いソフトですね。電子帳簿保管などで法則に従ったファイル名にする際にとても便利です。
先ほど購入させていただきました。今後ともよろしくお願いいたします。
・・・ということで、待っていれば制限解除の何らかをお送りいただけるのですよね?
ご利用ありがとうございます。
本来、購入処理後にドキュメントホルダーへ購入履歴ファイルが保存される仕組みなのですが、
一部のPCではうまく動作しないようです。修正にしばらくかかりますがご了承ください。
また、今回購入分の制限解除用のファイルは12月26日23時ころにはメールにて送りますので、
ドキュメントフォルダーに「Documents\ReNamePDF」のなかに添付のファイルを入れてください。
もうしばらくお待ちください。
2度購入処理をしていただきましたが、1650円分を返金致しましたのでご確認ください