こんにちはゲストさん。会員登録(無料)して質問・回答してみよう!

締切り済みの質問

OCR機能付のPDF閲覧iPadアプリを探してます

iPad用のアプリについて質問させて下さい。

iBookやi文庫HDなどPDFを閲覧できるアプリは沢山ありますが、アプリで表示中のPDF内の画像に対してその場でテキスト認識>クリップボードにコピーできるものを探しています。

文章と写真の混在した専門誌をスキャニングしたJPGをPDF化していますが、それをアプリで閲覧しつつ、気になる文章をクリップボードにコピーしてメモ帳に貼り付けるなどしたい訳です。

最初からOCR処理を施したPDFにしていないのには、スキャン後に画質調整したり解像度を自由に変えたかったり、OCR機能のある高額なソフトでもOCR機能が完璧じゃなく専門書なので誤変換が怖いなどといった理由でJPGのままPDF化しています。

私が知りたいのは先に書いたように、閲覧中に気になったページ(の一部など)だけテキスト抽出できるようなアプリがあるのかどうかです。

もしそのようなアプリをご存知であれば教えて頂ければ大変ありがたいです。
よろしくお願いします。

投稿日時 - 2013-09-23 06:41:51

QNo.8275802

暇なときに回答ください

このQ&Aは役に立ちましたか?

3人が「このQ&Aが役に立った」と投票しています

回答(4)

ANo.4

テキスト化そのようなことができると本当に便利だとは思います。

しかしながら本全体を容易に文書化できることになるので、著作権法に抵触する可能性があります。

とはいえ技術的には簡単なことなのでどこかにあると思います。

英語のいくつかの言葉を入れて検索すれば 何日か辛抱強くやればでてくるでしょうが

日本の著作権法を調べてからのほうがいいと思います。

私は責任は持ちませんよ。私は技術者なので技術には関心はあります。それだけです。

投稿日時 - 2013-10-16 22:06:15

補足

ご回答ありがとうございます。

文章を読んで心に響いた部分をメモるという行為の時間を短縮するツールを望んでいるのであって(私的複製)、それを公衆送信したり複製したり販売したりは運用の問題です。

一部のメディアで私的にコピーすることそのものが禁止されるケースが増えてきてはいますが
この件に関しては現状問題ないと思われます。
著作権法に抵触するならOCR技術そのものが法に触れることになりますし、そもそも本を電子化する自炊行為そのものも法に触れることになります。
自炊に関しては現状、(業者などが)代行することが法に触れるかどうかが論点になっているようです。

>日本の著作権法を調べてからのほうがいいと思います。
>私は責任は持ちませんよ。

私は技術者ではないので作れませんし、誰かに依頼するつもりはありません。
そういうアプリが無いかが知りたいのです。

失礼に思われたら申し訳ありませんが
LHS07さんも著作権法を調べてから回答された方が良いのではと思いました。

投稿日時 - 2013-11-09 13:19:05

ANo.3

>>便利だと思うのですが。。

たぶん、便利さ、必要とするユーザの数と、そういうソフトを作成するかたの技術的な難易度、手間などを比較・検討して作成されないのではないでしょうか?
また、PDF関連のソフトは、PDFの基本的な機能を満たすだけでも、プログラマーにとっては、技術的に大変そうです。フリー、あるいは安いPDFソフトに対しての不具合機能に対する質問をここでもたまに見ることあるくらいですからね。

質問にも書かれていますが、「高額なソフトでもOCR機能が完璧でない」と認識されているわけですよね?ですので、プログラマにとっては、「便利かもしれないけど、実現するのは難しい機能である。」ってことで、なかなか実現されないのだと推察します。

投稿日時 - 2013-09-24 11:48:53

補足

OCR自体はオープンソースのものも色々と存在しているようですので
これらを単に機能として追加するだけであればかなり容易だと思います。
http://www.moongift.jp/tag/ocr

PDFアプリとしても、結合したり編集したりするものならともかく
単に閲覧するビューワとしてはそれほど難度は高くないのではないかと思います。
編集ソフトもVectorには沢山の数あります。

なので、組み合わせることを思いついていないか
思いついても便利とは感じていないか‥
例えば、ブラウザでウェブサーフィンしているとFLASHで作られたページだったり
画像だったりして、文字をコピーしたいのに拾えなくてがっかりすることが頻繁にあります。
今はまだブラウザにOCR機能をと考えたりアドオンを作成したりする人はいないかも知れませんが
あると非常に便利になることが容易に想像できるので、そのうち追加されないかな~と思ったりします。
もしもすでにあるならぜひ知りたい、という感じですね。
iPadアプリも同様です。

例えば下記のアプリはフォトギャラリーで画像を選ぶか直接カメラで撮影してそのままテキスト化できるようです。
「Image To Text - OCR」
http://app-liv.jp/431757093/

PDF閲覧アプリで表示したページをスクリンショット保存してから「Image To Text - OCR」を起動してテキスト化することならできそうですね。
ただこれだと手間ですし、海外版ということで日本語の認識には対応していないでしょうね。
※先の回答への補足で「海外のアプリなら‥」と書きましたが海外アプリではダメですね‥

投稿日時 - 2013-09-24 22:55:40

ANo.2

No.1さんの回答にあるように、現状のソフトにそういうOCR機能があったとしても、読み取れないか、読み取っても文字認識はミスだらけになってテキストは、あまり使い物にならない可能性が大だと思います。
もちろん、将来、認識能力の高いソフトが登場するかもしれませんが。

投稿日時 - 2013-09-23 20:04:43

補足

ご回答ありがとうございます。

現行のOCR機能のある高額なソフトでも文字認識は今一つな感じのようなので、そもそも正確性には期待していません。

ですが、iPadのキーボードでPDFビューワとメモ帳アプリと切り替えながら1文字ずつメモ帳に写し取るのと、ミスが目立っても指定範囲をテキスト化してコピペできるのとでは快適さが各段に違うと思います。
なのでそういった機能のあるアプリを探しています。

No.1さんの回答にも補足しましたが、名刺アプリやwindowsの名刺ツールではカメラで撮ってOCR機能でテキスト化するのがポピュラーです。
http://mediadrive.jp/products/index_smartphone.html
なので、そういう機能を持たせたPDFビューワを作る人がいてもおかしくないと思っています。

便利だと思うのですが。。

投稿日時 - 2013-09-23 23:13:47

ANo.1

画像としてjpgのままpdfにしたら、テキストかは無理じゃないでしょうか?

私は富士通の両面スキャナーを所持していますが、、読み取り、pdfにする時に、テキスト検索する、、、というスイッチがあります。

オンにしたことはないですけど、、、そのことでしょうか?。

単に書き込み編集したいだけなら、幾つかソフトはありますよ。

投稿日時 - 2013-09-23 10:13:22

補足

ご回答ありがとうございます。


>オンにしたことはないですけど、、、そのことでしょうか?。

そうです。
電子書籍化したいためにスキャンする場合はOCR機能でテキスト化してPDFにするのがポピュラーですね。。

>画像としてjpgのままpdfにしたら、テキストかは無理じゃないでしょうか?

いえ、OCRは画像情報から文字を認識してテキスト化する技術なので可能です。
http://pc.mogeringo.com/archives/25740
例えば直接画像からテキスト化するようなフリーソフトも存在します。

iアプリで言うと、名刺をiPhoneのカメラで撮影してそのままOCRでテキスト化するようなものがポピュラーなので、そういった機能をPDFビューワに付けたアプリが海外アプリも含めれば1つ2つはあるんじゃないかな?と思ってはいるのですが・・

投稿日時 - 2013-09-23 23:06:03

あなたにオススメの質問