多くの場合、テキストパラグラフだけのビットマップに出くわすので、使用されているフォント、パラグラフの配置、行間隔と色、太字、斜体を識別する方法を探していました。
OCRパッケージでそれを実行できますか?
そうでない場合、他にどのようなオプションがありますか?
フォントを識別するために使用できるオンラインユーティリティがいくつかあります。
これらのユーティリティを使用して、画像内のテキストのフォーマットを決定することはできません。ただし、 Tesseract (オープンソース)および Smart OCR (US $ 99.90から開始)などのOCRプログラムを使用して、段落の配置や行間隔などのフォーマットを次のように検出できます。太字や斜体などのフォントスタイル( このスタックオーバーフローの質問 を参照)。一部のOCRプログラムは、画像内のフォントも識別できることに注意してください。
別のデスクトップソリューションもあります: フォントを検索 (私はこのソリューションのデザイナーです)
30日間の試用版をダウンロードして確認できます。900のローカルフォントに制限されており、オンラインマッチングデータベースに完全にアクセスできます。
もちろん、「デスクトップ」の方法も2つあります。クライアントから不可能なアートワークが常に送られてきたり、「独自の」フォントで何かを追加したいというクライアントと同じ問題がありました。だから私は2つの方法を見つけました:
Fontexpert.deのFontExpert 3.0-しかし、彼らがこの製品をもう販売しているかどうかはわかりません。独自のデータベースが付属しており、独自のフォントのデータベースを作成することもできます。最初にすべてのフォントをインストールする必要があり、FontExpertが各フォントを調べて独自のデータベースを作成するので、これは退屈な作業です。完璧に動作し(読み取り-非常に迅速)、ほぼすべての文字(少なくとも英語のコードページ、大文字と小文字)と数字を選択でき、代替候補も検索できます。それは私がそれを買ったとき(2004年頃)にその199ユーロを完全に正当化しました。もちろん、私はまだそれを使用しており、フォントをコレクションに常に追加しています。私は70.000を超えるフォントを使用しており、FontExpertにはそのような「プライベート」フォントコレクションに対して10.000フォントの制限があるようです。新しいフォルダの完全なプログラムをコピーして貼り付け、新しいコレクションを作成します...試してみてください http://www.qbf.de/e/index.html Quick Brown Fox GmbHはFontExpertの作成者であり、まだ入手できるかどうかを確認してください。探しているフォントがすでにある場合はすぐに通知されるので、これは本当に命の恩人です。
Stretchedout.comのFontMatchも同様の機能を備えていますが、データベースは作成されないため、すべてのフォントが検索され、Webページで確認できる限り、プログラムはそのように機能します。メモリにフォントをロードし、比較します文字とフォントをアンロードします。これは私が私の膨大なコレクションではやらないことです...
これから何か便利なものを見つけられるといいのですが...