web-dev-qa-db-ja.com

<meta charset = "utf-8">とは何ですか?

HTMLの学習を始めたばかりで(コーディングの背景はありません)、これが何を意味するのかわかりません。私は通常、後でコードを開始するときにそれを書きますが、それが何を意味するのか分かりません。 Doctypeの意味もわかりません。使用しないとどうなりますか?

19
Fedora

画面で読んでいる文字にはそれぞれ数値があります。 ASCII形式では、たとえば、文字「A」は65、「B」は66などです。 文字の表 ASCIIで利用可能コンピュータのメモリに保存された数値との間でそれらをエンコードするシステム。

UTF-8は、この要件を実装するために考案されたエンコード方式の1つにすぎません。あらゆる種類の言語でテキストを書くことができるので、このようなテキストと同様に、フランス語のアクセントが完璧に表示されます

Бзиазбаша(Bziazbaşa)、Фэсапщы、Ç'kemi、ሰላ

上記のテキストをコピーしてメモ帳に貼り付け、ファイルをANSI(別の形式)として保存しようとすると、この形式で保存すると一部の形式が失われるという警告が表示されます。それを受け入れ、テキストファイルを再ロードすると、次のようなものが表示されます。

???? ????? (Bzia zbasa)、???????、Ç'kemi、???、さらにこのような右から左への書き込み?????? ?????

39
Peter Morris

そのメタタグは、基本的にどの文字セットでWebサイトが記述されているかを指定します。

UTF-8の定義は次のとおりです。

UTF-8(Universal Character Set + Transformation Formatからの8ビット)は、可能なすべての文字(コードポイントと呼ばれる)をUnicodeでエンコードできる文字エンコードです。エンコードは可変長で、8ビットコード単位を使用します。

11
AndrewL64