バイトオーダーマーク単語

バイトオーダーマーク
  • 0
  • 0pt
掲示板へ

バイトオーダーマークとはUnicode文字符号化方式を判別するための仕組みである。

概要

Unicodeではファイルとの先頭にU+FEFFを挿入することが認められている。これがあると、ファイルの先頭4バイトを読むだけで、そのファイルがどの文字符号化方式(文字符号化形式にビッグエンディアンリトルエンディアンの区別を含めたもの)を使っているのか判定できるのだ。

UnicodeではU+EFBBは私用領域(E000-F8FF)にあるので、UTF-8のバイトオーダーマークが他のUTFと混同される心配はない。その他の混同を防ぐための割当制限についてはUTF-16, UTF-32の記事でバイトオーダーマークの項を参照。

U+FEFFって何の文字?

UnicodeでU+FEFFの符号位置にあるのはZERO WIDTH NO-BREAK SPACEであると定義されている。

本来、ZERO WIDTH NO-BREAK SPACEの記事に書くべきかもしれないが、ネタ記事になっている(ちなみに、あの記事のスペースは特にひねりのない全角スペースであり、非表示文字が埋め込まれたりはしていない模様)ので、こちらに記載する。

ZERO WIDTH NO-BREAK SPACEという名前定義されているものの、原則としてファイルの先頭でバイトオーダーマークとしてのみ使用することとし、ゼロ文字としての使用は非推奨とされている(2002年3月Unicode 3.2より)。

改行禁止ゼロ文字としては代わりにU+2060: WORD JOINERを使用することとされている。ただし、ファイルの先頭以外でZERO WIDTH NO-BREAK SPACEに遭遇したら、本来のゼロ文字として解釈することとなっている。

関連項目

【スポンサーリンク】

  • 0
  • 0pt
記事編集 編集履歴を閲覧

ニコニ広告で宣伝された記事

天外魔境II (単) 記事と一緒に動画もおすすめ!
提供: くるみ
もっと見る

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

バイトオーダーマーク

1 ななしのよっしん
2021/11/13(土) 09:08:13 ID: MuuGZFQnKg
そもそもなんでビッグエンディアンリトルエンディアンが存在するんだろう
UTF-8に慣れた人間からしたらビッグエンディアンだけでええんちゃうって思うんだけど
👍
高評価
0
👎
低評価
0
2 ななしのよっしん
2021/11/15(月) 21:29:44 ID: aLRRMQFU2e
>>1
エンディアンの記事に書いてみました。公式文書とかはなさそうなのでご容赦下さい。
👍
高評価
1
👎
低評価
0