Scannerを使用してJavaで.txtドキュメントをスキャンしています。しかし、.txtドキュメントをEclipseで開くと、認識されない文字があり、次のような文字に置き換えられています。
�
これらの文字はファイルをスキャンすることさえできません
while(scan.hasNext)
自動的にfalseを返します(これらの文字が存在しない場合は、ドキュメントをスキャンできます)。
では、Eclipseでこれらの文字を認識してスキャンできるようにするにはどうすればよいですか?ドキュメントが非常に大きいため、手動で削除することはできません。ありがとう。
読み取るファイルにはUTF-8またはその他のエンコード文字が含まれている必要があり、コンソールでそれらを印刷しようとすると、一部の文字が� 'として表示されます。これは、EclipseではデフォルトのコンソールエンコーディングがUTF-8ではないためです。実行構成->共通->エンコーディング->ドロップダウンからUTF-8を選択して設定する必要があります。以下のスクリーンショットを確認してください:
Eclipseワークスペース全体の文字エンコードを変更する必要がある場合は、[ウィンドウ]-> [設定]に移動します。次に、[一般]-> [ワークスペース]で、[テキストファイルエンコーディング]を適切な文字エンコーディング(この場合はUTF-8)に変更します。