私は、デジタルコピーを取り戻すことができるように、データ入力を使用して情報のフィールドを追加できるように、紙のドキュメントをパーソナルコンピューターに保存できる何らかの種類(無料またはオープンソース)のドキュメント管理アプリケーションを探しています。
例えばドキュメントが素晴らしい場合、日付または罰金であるという事実、または検索に追加できる別のカスタムフィールドを思い出せば見つけることができます。
ocr全文検索はすばらしいプラスですが、必須ではありません。
みんなありがとう!
LogicalDOC Community はこの目的に使用できます。多くのファイルタイプをカタログ化してタグ付けすることができ、無料のOCRが組み込まれています。
このパッケージで私が本当に気に入っている機能の1つは、言語固有の検索をネイティブに実行できる全文検索エンジンです。
Ubuntuにインストールするための優れたドキュメントがあります。これには特別な問題はありません。
アーカイブのニーズに役立つオープンソースのドキュメント管理システムとスキャンソリューションがいくつかあります。ドキュメント管理には次のものがあります。
pip install mayan-edsm
)スキャンソフトウェアに関しては、いくつかのオープンソースオプションがありますが、パフォーマンスがあまり良くありません。アーカイブの対象(および今後アクセスする方法)に応じて、管理ソフトウェア内でドキュメントにタグを付けることができます。また...フリーウェアスキャンアプリケーションで固体OCRを見つける可能性は低いです。
オプションがある場合は、 ドキュメント変換プロジェクトのアウトソーシング を強くお勧めします。あなたはそれをより速く終わらせるだけでなく-あなたはあなたのファイルをOCRするオプションを持ち、あなたのプロジェクトの完成した品質がプロフェッショナルで読みやすいことを知っています。
Archivistaと呼ばれる、まさに必要なことを正確に実行するドキュメント管理システムがあります。博物館のアーカイブで評価しました。
ダウンロード済み はインストール可能なISOとして、またはスモールビジネスコンピューターにプリインストールして購入できます。しかし、Ubuntuの下にインストールする可能性については知りませんが、これはあなたにとって大きな問題になるかもしれません。ここでは、仮想マシンとして実行し、XフォワーディングとそのHTMLインターフェイスを介して対話します。
Archivistaは、ソフトウェアが長い(約20年)データ保持期間のために設計されていると主張しています。スキャナーを使用し、スキャンしたドキュメントの画像、PDFおよびOCRバージョンを保存できます。ドキュメントにはメタタグを割り当てることができ、OCRされたテキストは検索可能です。
情報階層は、オンラインまたはMicrosoft Officeツールでドキュメントを生成するために協力するのに役立ちます。 dataentry.ieを使用して、ドキュメントをすばやく整理、保存、検索できます。
文書カタログ管理ソフトウェアを探していると思います。 Calibreを使用して電子書籍を管理しています。 pdfの他に、MOBI、LIT、PRC、EPUB、ODT、HTML、CBR、CBZ、RTF、TXT、PDFおよびLRS形式もサポートしています。
Ms doc形式をサポートしているかどうかはわかりません。しかし、あなたはそれをチェックアウトすることができます。詳細については、 公式サイト をご覧ください
Calibreをインストールするには、次のコマンドを使用します。
Sudo apt-get install calibre