16.04にTesseractの新しい言語パックをインストールする方法

Question

Tesseractと同様にgscan2pdf v1.3.9をインストールしました。後者については、最初にインストール済みソフトウェアリストの一番下に表示されていましたが、現在は動作しているものの、消えているようです（私は思う）。

とにかく、スキャンしたドキュメントのpdfを編集可能なテキストに変換しようとしていますが、ドキュメントは英語ではないため、gscanはそれを混乱させます。

Tools > OCR > Language to recognizeにアクセスしたときに取得できるオプションは、English、equ、およびosdのみです。特定の言語パックをインストールする方法に関するアイデアはありますか？

私は経験豊富なLinuxユーザーではないので、段階的な指示は大歓迎です。

Abhijit Ghosh · Accepted Answer

これを使用して必要なocr言語をインストールするだけです。

Sudo apt-get install tesseract-ocr-[lang]

[lang]は

all

OR

afr amh ara asm aze aze-cyrl bel ben bod bos bul cat ceb ces chi-sim chi-tra chr cym dan dan-frak deu deu-frak dev dzo ell enm epo est eus fas fin fra frk frm gle gle-uncial glg grc guj hat heb hin hrv hun iku ind isl ita ita-old jav jpn kan kat kat-old kaz khm kir kor kur lao lat lav lit mal mar mkd mlt msa mya nep nld nor ori pan pol por pus ron rus san sin slk slk-frak slv spa spa-old sqi srp srp-latn swa swe syr tam tel tgk tgl tha tir tur uig ukr urd uzb uzb-cyrl vie yid