ニコニコ大百科: 「サロゲートペア」について語るスレ 1番目から30個の書き込み

サロゲートペア

について語るスレ

記事をみる

＜＜

＜

＞

＞＞

1/1

1 ななしのよっしん非表示

2016/12/11(日) 09:04:53 ID: yQfk9VTYWz

UTF-8 がどうしてあんなにややこしい仕組みになってるのか分からんのだが。
互換の問題とか？
👍
0
👎
0
2 ななしのよっしん非表示

2017/01/22(日) 12:43:55 ID: VRIKsFmQ3o

>>1
間違ってない。
UTF-8は「アスキー文字（00～7F）をそのまま扱えるUnicode」という目論見で作られた。
おかげで非アスキー文字の扱いが煩雑で、「機械には分かるが、人間には分かりにくい」仕様になってしまった。
👍
0
👎
0
3 ななしのよっしん非表示

2020/02/14(金) 20:20:36 ID: S+qzHqSvfl

テキストデータだと思うから煩雑に見える
Unicodeは文字指示言語で、それを1命令ごとに可変長数値表現にして並べてるだけの単純な形式だよ
👍
0
👎
0
4 ななしのよっしん非表示

2021/11/07(日) 08:19:44 ID: Z0FpPbHF2L

UTF-16の記事に用意していた内容と、改定していただいた内容が被ってしまったのですが、いかがしましょうか。

1. サロゲートペアはUnicodeで規定されているが、UTF-16以外では使用されないので、UTF-16に統合する。
2. サロゲートペアには、サロゲートペアによる拡張の処理について記述し、それ以外の内容はUTF-16に統合する。
3. UTF-16にはサロゲートペアに先行して記載された内容は載せない。

こちらで思いつくのはこれくらいですが、3.はあまりよい考えとは思っていません。
👍
0
👎
0
5 ななしのよっしん非表示

2021/11/07(日) 08:38:59 ID: 7kHCqruzVb

>>4
私も1.で考えてます
追加面の文字を指して「サロゲートペア文字」と呼ぶこともあるので単語記事自体は残しておいたほうが良さそうな気もしますが、Unicode記事でフォローすれば足りますかね
👍
0
👎
0
6 ななしのよっしん非表示

2021/11/07(日) 13:10:13 ID: Z0FpPbHF2L

>>5
この記事はリダイレクト化ではなく記事として残すということでしょうか。
それなら、2.もいいかなと思いますが、いかがでしょう。
👍
0
👎
0
7 ななしのよっしん非表示

2021/11/09(火) 23:20:32 ID: Z0FpPbHF2L

>>5
とりあえず、2.の部分については統合の合意ができていると思うので、統合作業を行いました。

スレチですが、ハッキングの>>17で述べたことがASCIIでも起きたのでこの場を借りて通知させて頂きます。
👍
0
👎
0

＜＜

＜

＞

＞＞

1/1

TOP