文字参照(Character references)
HTMLでラテン文字、ギリシャ文字、各種記号を使いたい場合はSGML式文字参照を利用できます。 文字参照は、符号化方法に依存せずに文書文字集合に含まれる文字全てを利用可能にする仕掛けです。
HTMLの文字参照には、次の2つの形式が用意されています。
数値文字参照(十進法と十六進法の両方)と文字実体参照です。
数値文字参照(Numeric character references)
数値文字参照は、文書文字集合に関してコード位置を指し示すものです。数値文字参照には、2つの形式が用意されています。
- 「&#D;」という書き方。
Dには十進数の数値が記入され、ユニコードの当該文字番号を参照します。
- 「&#xH;」または「&#XH;」という書き方。
Hには十六進数の数値が記入され、ユニコードの当該文字番号を参照します。十六進数で数値文字参照を行う場合、数値のアルファベットは大文字小文字どちらでもかまいません。
数値文字参照の例。
- ©(十進数)は、Copyright を参照し「©」を表示します。
- ©(十六進数)も、同じく「©」を表示します。
- ©(十六進数)もまた、同じく「©」を表示します。
文字実体参照(Character entity references)
HTMLでは、より直感的に理解しやすい文字参照の方法として、文字実体参照が利用できます。 文字実体参照は、文字・記号の名前から取った符号名による文字参照なので、いちいち数値コード位置を記憶する必要がなくなります。
文字実体参照の例。
- 「©」はCopyright を参照するものですが、同じ文字の数値文字参照「©」より覚えやすいでしょう。
また、文字実体参照は大文字小文字を区別します。従って、「Å」と「å」は違う文字を参照します(各々大文字の「Å」と小文字の「å」を参照する)。
文字参照の基本4文字の説明。
- 「<」記号(ASCII十進数コード「60」)を表したい場合には、タグの開始記号だと解釈される可能性を排除するために、「<」というように記述せねばなりません。
- 「>」記号(ASCII十進数コード「62」)を二重引用符で囲った属性値の一部として使いたい場合にも、古いユーザエージェントがタグの終了記号と勘違いしてしまうことを避けるために、「>」と記す必要があります。
- 文字参照の開始記号として「&」が使われるため、本文中でアンパサンド(ASCII十進数コード「38」)を表すには「&」と書く必要があります。
- 二重引用符「"」が属性値の区切り記号として使用されるために、代替手段として「"」という文字参照を利用しましょう。
注記!
- 末尾の「;」は必ずしも必要ではありませんが、ブラウザが正しく認識できる様に「;」は書くようにしましょう。
- 多くの文字規格が十六進法を用いているので、十六進法での数値文字参照の利便性は高いでしょう。しかし、N N、N Cでは残念ながら未対応です。
- HTML 4.01は、文書文字集合のすべての文字に対して文字実体参照を提供しているわけではありません。
- ブラウザの対応状況により未対応で文字化けしたりして不徹底です。
|