UTF-32単語

ユーティーエフサンジュウニ

1.4千文字の記事

1
0pt

掲示板へ

記事編集

UTF-32とは、Unicodeの文字符号化形式/文字符号化方式の一つである。

概要

UTF-32とは、Unicodeの文字符号化形式/文字符号化方式の一つで、Unicodeの21ビットを表現するのに32ビット(=4バイト)あれば十分だろうということで、全て4バイト固定長で表現する方式である。ただ、異体字セレクタなど、前の文字と結合して用いるものがあるので、完全な1単位1文字は実現できていない。

UTF-8なら1バイトで表現できる英数字にも4バイトを消費する反面、コードポイント数*4バイトが長さに一致するので、何番目と指定された文字に高速にアクセスできるという利点がある。

Unicodeは21ビットまでなので、先頭のバイト(厳密には11ビット)は常に0になり、メモリの無駄が多いので使用される場面は少ない。

Unicodeの符号位置を表記するのにU+の後に16進数を続ける書式があるが、UTF-32ではこの16進数がそのまま格納される。

バイトオーダーマーク

UTF-16と同様である。UTF-32BE, UTF-32LEではバイトオーダーマークは使用禁止。無印 UTF-32では、00 00 FE FFはビッグエンディアン、FF FE 00 00はリトルエンディアン、省略されるとビッグエンディアンと解釈される。

また、Unicodeの各面におけるFF FEで終わる符号位置U+?FF FE(?は0-10₍₁₆₎)はUTF-32でリトルエンディアンになると、FE FF 0x 00となり、UTF-16のBOMありビッグエンディアンと区別が難しくなるため使用しないことになっている。

関連項目

コラム: UTF-24?

Unicodeの文字は21ビットで表現可能である。8ビット(=1バイト)単位になるのは仕方がないとしても、24ビット(=3バイト)あれば十分なはずで、32ビット(=4バイト)もいらないのではないだろうか。

というようなことは2007年に既に検討済みである。

当時主流の32ビットコンピューターではデータのやり取りを行う単位が32ビット(1つのメモリアドレスに保持するデータは32ビット)であった。24ビットという中途半端な単位では、下記の2文字目のように、1文字3バイトが1バイト+2バイトといった形で2つのアドレスに分かれて保管されてしまう。

アドレス単位	1				2				3
バイト単位	1	2	3	4	5	6	7	8	9	10	11	12
文字単位	1			2			3			4

2つのアドレスに分かれて保管された場合、ランダムアクセスで読み出す時にも2つのアドレスへのアクセス(+ 有効部分のバイトデータ切り出し + 結合)が必要となり、1メモリアドレスにアクセスするだけで読み出せるUTF-32に比べて倍以上の時間が必要になる。

固定長方式はアクセス速度向上のためならメモリ容量の無駄をいとわないようなシビアな局面での使用が想定されるため、格段に速度が低下するUTF-24は不採用になったようだ。

この点、UTF-8は可変長なので1文字のデータがアドレスの境界をまたぐのは日常茶飯事なのだが、UTF-8はそもそも可変長ゆえにアドレスを指定してのランダムアクセスができないので、こういう意味でのパフォーマンス向上には意味がないと言える。

もっと見る >

1
0pt

ページ番号: 5638877
初版作成日: 21/11/06 13:18

リビジョン番号: 2973017
最終更新日: 21/11/13 06:51

編集内容についての説明/コメント:

誤りの訂正と表現の修正。

記事編集編集履歴を閲覧

キーワード「UTF-32」でニコニコ動画を検索

タグ「UTF-32」でニコニコ動画を検索

hatena

ニコニ広告で宣伝された記事

フランドール・スカーレット (単) 記事と一緒に動画もおすすめ！

提供：ゆんなの「推しタグエントリー」

40232600pt

もっと見る

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

UTF-32

まだ掲示板に書き込みがありません…以下のようなことを書き込んでもらえると嬉しいでーす！

記事を編集した人の応援(応援されると喜びます)
記事に追加して欲しい動画・商品・記述についての情報提供(具体的だと嬉しいです)
UTF-32についての雑談(ダラダラとゆるい感じで)

書き込みを行うには、ニコニコのアカウントが必要です！

急上昇ワード改

2026/06/17(水)19時00分現在

もっとみる

おすすめトレンド

最新の話題で記事を新しくしてみませんか？

6月17日記念日の一覧メイショウタバル吉野家コピペタゴサク構文プログラマの夫 2026年春アニメ碇チンボウ

ニコニコニューストピックス

「マツケン」のぬいぐるみと話せちゃう新ブランド「AI Charmy」が発表、12月に発売へ。本人収録の声を基にしたリアルボイス使用のAI、思い出を日記で読み返したり会話を重ねるほど親密度が上昇する要素も収録

【80%オフ】美しいアートのような世界を少女が探索する「圧倒的に好評」のゲーム『GRIS』を340円で買えるSteamセール開催中。テキストがほとんどなく、世界観に没頭することができる名作

『ペルソナ５ザ・ロイヤル』Switch版が70%オフ「2303円」で購入できるセールが開催中。『メタファー』PS5/PS4版のアニバーサリーエディションは半額に

ガスト、創業当時の「初代和風さらだうどん」を約20年ぶりに復刻 / 白桃デザート3種も発売

【関東在住者に聞いた】「買ってきてほしい愛媛県のお土産」ランキング！　2位は「まるごとみかん大福」、1位は？

「性別『モナリザ』の君へ。」シャフト制作でTVアニメ化決定　無性別のまま生きる主人公の青春劇

“舞い降りる剣”フリーダムガンダムのリニューアル版が予約スタート！ハイマットフルバーストや連結状態のビームサーベルなどプレイバリュー豊富

【最大6人】超巨大迷宮から脱出するサバイバルホラーゲーム『Inferno Protocol』の体験版がSteamにて公開中。スプレーやチョークの目印を頼りに探索していく

「さすがにタフ」「持ってて損なし」　“スマホ連携できる”G-SHOCKが高評価　「珍しい色だったので一目惚れ」「普段使いとしても支障ない」

@nico_nico_pedia