UTF-8とBOM(Byte Order Mark)
BOMとは(UTF-8の場合)
「BOM」とは、プログラムがテキストデータを読み込むときに、事前にUnicodeで表現されたテキストデータであるということを示すため数バイトの【見えない文字】のことをいいます。
アプリケーションによってはBOM付きでないとUTF-8として認識できないもの、あるいはBOM無しでないとファイルを正しく取り扱えないものも存在しますので、アプリケーションや用途によって使い分ける必要があります。
しかし、現在、Web制作においては、「BOM」を必要とする機会は殆ど無く、特に「UTF-8」においてはBOMがなくても動作するよう作られており、逆にBOMがあることで文字化けのリスクを負うことがあります。
UTF-8はBOMなしがベターです。
最近のエディタでは、ぱっと見ただけでは「BOM付き」か「BOMなし」かが分からないというものがありますので、気をつけましょう。
文字コードが間違っていないのに、文字化けをする場合「BOM」の有無が原因のこともあることを覚えておきましょう。
講座では、「UTF-8」「 BOMなし」を使います。
Webページのエンコード
Webサイトで使われている文字エンコーディングの割合は、UTF-8が90%となっており、HTML5では、UTF-8を使用することが推奨されています。