単語記事: Unicode

編集  

Unicodeとは、文字コードの規格の一つである。特定の言によらず広く文字を扱い、そのエンコディング方法を定義する。

概要

Uncodeは、Unicodeコンソーシアムが定める際的な文字コードの規格であり、符号化文字集合文字エンコディングを定めている。

扱う文字は、世界中のな言文字カバーしており、現在は使われていない過去の言文字やさまざまな記号、制御文字も扱う。扱う文字の数は100万を越える。

Unicodeを用いることで異なる文字集合文字エンコディングを同時に取り扱う煩わしさを排除できる。Unicode際化対応が必要なソフトウェア、規格、プログラミング言語で標準的に用いられる。たとえばHTMLなどインターネット関係の仕様要なOSJava.NET Frameworkなどで使われている。

Unicodeは、ISO/IEC 10646と非常に密接な関係にある。もともとは統一的な文字コードの規格としてばらばらに誕生したものだが、1991年に統合されており、文字の追加などは同時に行われる。

符号化文字集合

Unicodeの符号化文字集合ISO/IEC 10646で定める符号化文字集合と一致している。

Unicodeでは2バイトで表せる範囲(65,536)のコードポイントの集まりを面(Plane)と呼んでいて、0から16までの全部で17の面から構成される。一番最初の面は基本多面(Basic Multilingual Plane,BMP)と呼ばれ、基本ラテン平仮名片仮名、基本的な漢字を含む。第02面は補助漢字面と呼ばれBMPに含まれない漢字が置かれている。

面はブロックと呼ばれる関連性の強い文字を集めた部分集合分割される。日本でおなじみの文字があるブロックは基本ラテン(U+0020 - 007F)、ひらがな(U+3000 - 309F)、かたかな(U+30A0 - 30FF)、CJK統合漢字(U+4E00 - U+9FFF)、半形/全角形(U+FF00-U+FFEF)などである。

Unicode6.0からは携帯電話絵文字も収録された。(参考:Wikipedia:Unicode6.0の携帯電話の絵文字の一覧)

文字エンコーディング

文字集合

アスキーアート・顔文字

Unicodeは、JIS X 0208に定められた文字集合よりもはるかに多くの文字を含み、多くの新たな系統のアスキーアート顔文字が生まれた。たとえば以下のような顔文字が作られた。

関連動画

関連商品

関連サイト

関連項目


【スポンサーリンク】

携帯版URL:
http://dic.nicomoba.jp/k/a/unicode
ページ番号: 4302199 リビジョン番号: 2534651
読み:ユニコード
初版作成日: 10/03/07 18:58 ◆ 最終更新日: 17/10/22 14:26
編集内容についての説明/コメント: UCSに追記
記事編集 / 編集履歴を閲覧
このエントリーをはてなブックマークに追加

この記事の掲示板に最近描かれたお絵カキコ

お絵カキコがありません

この記事の掲示板に最近投稿されたピコカキコ

ピコカキコがありません

Unicodeについて語るスレ

54 : ななしのよっしん :2016/02/13(土) 18:39:37 ID: bINOfe+1jA
᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏
᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏

᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏
᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇͏

᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏

᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏᷇᷇᷇᷇᷇᷇᷇᷇᷇᷇͏
55 : ななしのよっしん :2016/10/16(日) 16:48:33 ID: MAK320npJ8
༆ᬃ᬴࿓ྉྉྉྉᭆᭆᭆ   ポッホァッホホーッッ
༆꧃꧄༒༒༒ ༊ ༒༒༒
༆꧅ꦿ ဪဣᙰᙰ
༆﷽ꦙᭆᭆᭆ﷼
࿐࿐࿐꧁_꧂࿐࿐࿐
༆࿊
           ⚚⚚⚚⚚⚚꫞⚚⚚⚚⚚⚚
ꦿꦿꦼ꧍。。。᪣᪣᪣᳄᪣᪣᪣


56 : ななしのよっしん :2016/12/07(水) 16:50:40 ID: wj2tc6/IaZ
カナ表記の「ユニコード」を本記事にリダイレクトしました(2016/12/7)
57 : ななしのよっしん :2017/05/22(月) 11:41:05 ID: 6INGJ1XL6P
ด้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้(・ω・)ด้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้้้้้้้้็็็็็้้้้้็็็็็้

子供の頃ウンコードって読んでた
58 : ななしのよっしん :2017/06/20(火) 14:55:06 ID: Jz2WBeBaGe
>>52
>>53
MSがUTF16のことをUnicodeと呼ぶのは「当時としては」間違ってなかったのよ
http://yanok.net/2016/03/utf-16-unicode.html
後から変えると紛らわしいからそのままにしてある
今から見ると確かに意味不明だが……
59 : ななしのよっしん :2017/07/13(木) 12:24:40 ID: O9azhLBWUe

これなんでリンクされんの?
60 : ななしのよっしん :2017/07/17(月) 19:19:54 ID: kE1KLe98oH
Unicode10.0が2017年6月20リリースされてた。

> Unicode Consortiumは20日、文字コード標準規格「Unicode」の新バージョン「10.0」が利用可になったことを発表した。新たに8518文字が追加され、計13万6690文字を利用できる。日本語関連では、縦書きテキストレイアウトに関する仕様や、「変体仮名文字」などが追加されている。

> 変体仮名文字は、ひらがな歴史的な変種となっており、Unicode 10.0では285文字が追加された。このほか、2015年6月の「Unicode 8.0」で対応したCJK統合漢字Eの漢字5762文字に続き、Unicode 10.0ではCJK統合漢字Fの漢字7473文字も新たに追加されている。

http://internet.watch.impress.co.jp/docs/news/1066482.html
61 : ななしのよっしん :2017/09/18(月) 02:19:15 ID: 0RJLqz/JwF
>>59
テキスト大百科タイトル名共にUnicode正規化した上で較してリンクが貼られる。

> ruby -e "require 'unf'; puts UNF::Normalizer.normalize('᠌', :nfkc)"
20点᠌
62 : ななしのよっしん :2017/09/18(月) 02:38:00 ID: 0RJLqz/JwF
いや、存在しない記事なのかこれ
確かに
63 : ななしのよっしん :2017/09/18(月) 03:00:43 ID: BmmqfrIeNB
中にききたくなかった
こわ
ニコニコニューストピックス
電ファミwiki
  JASRAC許諾番号: 9013388001Y45123
  NexTone許諾番号: ID000001829