web-dev-qa-db-ja.com

Craigslistの投稿が疑問符でいっぱいなのはなぜですか?

私の街にはクレイグリストの存在はありませんが、面白いか面白いので時々 "best of" を閲覧します。

一部の投稿が疑問符でいっぱいなのはなぜですか?カンマとピリオドを除くすべての句読点が�記号に置き換えられているようです。

Example

MacbookPro上のFirefox3。

7
John Fouhy

これがその例です Craigslistから。

そのページはISO-8859-1エンコーディングを使用してエンコードされていますが、Webサーバーは、次のヘッダーを送信することにより、ページがUTF-8であることをアナウンスしています。

コンテンツタイプ:text/html; charset = utf-8

これはCraigslistのバグです。 CraigslistのプログラマーがUnicodeについて 働くプログラマーが知っておくべき絶対最小値 を知らないというのは公正な仮定です。

ISO-8859-1では、これらのカーリーアポストロフィは、UTF-8では無効なバイトを使用してエンコードされます。したがって、Firefoxでは<?>として表示され、IEでは正方形として表示されます。

ページを表示しているときの問題を修正するには、[表示]メニューに移動し、[文字エンコード]> [西洋(ISO-8859-1)]を選択して、ページが実際にどのエンコードであるかをブラウザーに通知します。

15
Joel Spolsky

多くの場合、独自のコードページまたは文字セットを使用しているプログラムからカットアンドペーストすると発生します。ローカルプログラムはそれらをアポストロフィと見なしますが、これは非標準の文字であるため、レンダラーにとって意味がないため、デフォルトで黒いひし形/白い疑問符になります。

必須のJoelonsoftware写真:

alt text

ユニコードの詳細: http://www.joelonsoftware.com/articles/Unicode.html

19
hyperslug