バイトオーダーマーク単語

バイトオーダーマーク

掲示板へ

記事編集

バイトオーダーマークとはUnicodeの文字符号化方式を判別するための仕組みである。

概要

Unicodeではファイルとの先頭にU+FE FFを挿入することが認められている。これがあると、ファイルの先頭4バイトを読むだけで、そのファイルがどの文字符号化方式(文字符号化形式にビッグエンディアンとリトルエンディアンの区別を含めたもの)を使っているのか判定できるのだ。

UnicodeではU+EFBBは私用領域(E000-F8FF)にあるので、UTF-8のバイトオーダーマークが他のUTFと混同される心配はない。その他の混同を防ぐための割当制限についてはUTF-16, UTF-32の記事でバイトオーダーマークの項を参照。

UnicodeでU+FE FFの符号位置にあるのはZERO WIDTH NO-BREAK SPACEであると定義されている。

本来、ZERO WIDTH NO-BREAK SPACEの記事に書くべきかもしれないが、ネタ記事になっている(ちなみに、あの記事のスペースは特にひねりのない全角スペースであり、非表示文字が埋め込まれたりはしていない模様)ので、こちらに記載する。

ZERO WIDTH NO-BREAK SPACEという名前で定義されているものの、原則としてファイルの先頭でバイトオーダーマークとしてのみ使用することとし、ゼロ幅文字としての使用は非推奨とされている(2002年 3月のUnicode 3.2より)。

改行禁止ゼロ幅文字としては代わりにU+2060: WORD JOINERを使用することとされている。ただし、ファイルの先頭以外でZERO WIDTH NO-BREAK SPACEに遭遇したら、本来のゼロ幅文字として解釈することとなっている。

大和(艦これ) (単) 記事と一緒に動画もおすすめ！

提供： yui@柱島

12662600pt

お絵カキコがありません

ピコカキコがありません

1 ななしのよっしん非表示 2021/11/13(土) 09:08:13 ID: MuuGZFQnKg レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: そもそもなんでビッグエンディアンとリトルエンディアンが存在するんだろう
UTF-8に慣れた人間からしたらビッグエンディアンだけでええんちゃうって思うんだけど; 👍
高評価

0
👎
低評価

0
2 ななしのよっしん非表示 2021/11/15(月) 21:29:44 ID: aLRRMQFU2e レスを非表示にする レスを表示する IDを非表示にする IDの書き込みを表示: >>1
エンディアンの記事に書いてみました。公式文書とかはなさそうなのでご容赦下さい。; 👍
高評価

1
👎
低評価

0