このドキュメント のこの長い語彙テーブル(ギリシャ語の1列、次に英語の1列)を、ギリシャ文字が保持されている1つのExcelスプレッドシートにどのように変換しますか?コピー&ペーストしようとすると、次のような結果が得られます。
ajgaqov "、ajgaqhv、ajgaqovn
これらの解決策の1つを試してください。 MS WordのGreekTranscoderがあなたを助けることができると思います(私はそれをテストするためにダウンロードしています):
私には、元のドキュメントがフォント置換と呼ばれる何かをしているように見えます。
これが80年代と90年代のセルビアです。私たちのユニークな文字を取得する簡単な方法は、私たち自身の文字があるキーボード位置にあるラテン文字のコードの記号を持ったフォントを使用することでした。たとえば、Word ужички
を考えてみましょう。このようなシステムでは、u\i;ki
と入力し、\の代わりにжを表示し、;の代わりにчを表示するフォントを使用します。これは、実際には別の文字セットを使用せず、正しく表示された場合に違いがないため、実装が非常に簡単です。残念ながら、これは国際化ではうまく機能せず、1台のコンピューターで複数の異なる文字セットが必要な場合に問題になります。
私の知る限り、これから生じた問題の唯一の解決策は、そのようなテキストを適切なUnicodeテキストに翻訳するプログラムを使用することです。ここでの問題は、ギリシャ語とラテン文字が混在しているため、プログラムが単に置換を馬鹿にすることはできないということです。私の知る限り、問題を解決する簡単な方法はありません。
ドキュメントを取得して、Unicodeで文字と出力を検出する適切なOCRプログラムで実行してみることができますが、私はかなり長い間OCRを使用していないため、役立つものをお勧めすることはできません。また、一部のOCRプログラムはスキャナーからの入力のみを受け入れるため、ドキュメント全体を印刷してスキャンする場合を除いて、OCRプログラムを選択する際には注意が必要です。
プレーンテキストの代わりにPaste Special
を使用して、Unicode
を選択してみてください。