Unicode 単語


ニコニコ動画でUnicodeの動画を見に行く

ユニコード

1.2千文字の記事
これはリビジョン 899276 の記事です。
内容が古い・もしくは誤っている可能性があります。
最新版をみる

Unicodeとは、文字などに関するコンピュータ業界の規格の一つである。特定の言語によらず広く文字を扱い、そのエンコーディング方法を定義する。

概要

Unicodeでは、文字集合と文字エンコーディングを定めている。

扱う文字は主な言語の主な文字をカバーしており、現在は使われていない過去の言語の文字やさまざまな記号、制御文字も扱う。扱う文字の数は100万を越える。

Unicodeを用いることで異なる文字集合、文字エンコーディングを同時に取り扱う煩わしさを排除できる。Unicodeは主に国際化対応が必要なソフトウェア、規格、プログラミング言語で標準的に用いられる。たとえばインターネット関係の仕様、主要なOS、Java, .NET Frameworkなどで使われている。

符号化文字集合

Unicodeの符号化文字集合はISO/IEC 10646で定める符号化文字集合と一致している。

Unicodeでは2バイトで表せる範囲(65,536)のコードポイントの集まりを面(Plane)と呼んでいて、0から16までの全部で17の面から構成される。一番最初の面は基本言語面(Basic Multilingual Plane,BMP)と呼ばれ、基本ラテン、平仮名、片仮名、基本的な漢字を含む。第02面は補助漢字面と呼ばれBMPに含まれない漢字が置かれている。

面はブロックと呼ばれる関連性の強い文字を集めた部分集合に分割される。日本でおなじみの文字があるブロックは基本ラテン(U+0020 - 007F)、ひらがな(U+3000 - 309F)、かたかな(U+30A0 - 30FF)、CJK統合漢字(U+4E00 - U+9FFF)、半角形/全角形(U+FF00-U+FFEF)などである。

文字エンコーディング

  • UTF-7 - 7ビットエンコーディング。可変長式。ほとんど用いられない。
  • UTF-8 - 8ビットエンコーディング。可変長式。World Wide Webでのエンコーディングのデファクトスタンダードであり、Unicodeの文字エンコーディングとしてもっともメジャーである。
  • UTF-16 - 16ビットエンコーディング。可変長式(基本言語面については固定幅)。ビッグエンディアン式とリトルエンディアン式がある。
  • UTF-32 - 32ビットエンコーディング。完全固定幅。
  • UCS-2 - Unicodeの基本言語面をそのまま16ビットエンコーディングとする

アスキーアート・顔文字

UnicodeはJIS X 0208に定められた文字集合よりもはるかに多くの文字を含み、多くの新たな系統のアスキーアート・顔文字が生まれた。たとえば以下のような顔文字が作られた。

  • (╬☉д⊙)
  • (´◉◞౪◟◉)

関連動画

関連商品

ニコニコ市場は2023年11月に終了しました。 ニコニコ市場は2023年11月に終了しました。 ニコニコ市場は2023年11月に終了しました。 ニコニコ市場は2023年11月に終了しました。

関連サイト

関連項目

  • 文字エンコーディング
関連記事

子記事

兄弟記事

  • なし

おすすめトレンド

ニコニ広告で宣伝された記事

記事と一緒に動画もおすすめ!
もっと見る

急上昇ワード改

最終更新:2025/12/25(木) 01:00

ほめられた記事

最終更新:2025/12/25(木) 01:00

ウォッチリストに追加しました!

すでにウォッチリストに
入っています。

OK

追加に失敗しました。

OK

追加にはログインが必要です。

           

ほめた!

すでにほめています。

すでにほめています。

ほめるを取消しました。

OK

ほめるに失敗しました。

OK

ほめるの取消しに失敗しました。

OK

ほめるにはログインが必要です。

タグ編集にはログインが必要です。

タグ編集には利用規約の同意が必要です。

TOP