7
<<
<
>
>>
1/1
1 ななしのよっしん
2016/12/11(日) 09:04:53 ID: yQfk9VTYWz
UTF-8 がどうしてあんなにややこしい仕組みになってるのか分からんのだが。
互換の問題とか?
2 ななしのよっしん
2017/01/22(日) 12:43:55 ID: VRIKsFmQ3o
>>1
間違ってない。
UTF-8は「アスキー文字(00~7F)をそのまま扱えるUnicode」という目論見で作られた。
おかげで非アスキー文字の扱いが煩雑で、「機械には分かるが、人間には分かりにくい」仕様になってしまった。
3 ななしのよっしん
2020/02/14(金) 20:20:36 ID: S+qzHqSvfl
テキストデータだと思うから煩雑に見える
Unicodeは文字指示言語で、それを1命令ごとに可変長数値表現にして並べてるだけの単純な形式だよ
4 ななしのよっしん
2021/11/07(日) 08:19:44 ID: Z0FpPbHF2L
UTF-16の記事に用意していた内容と、改定していただいた内容が被ってしまったのですが、いかがしましょうか。
1. サロゲートペアはUnicodeで規定されているが、UTF-16以外では使用されないので、UTF-16に統合する。
2. サロゲートペアには、サロゲートペアによる拡張の処理について記述し、それ以外の内容はUTF-16に統合する。
3. UTF-16にはサロゲートペアに先行して記載された内容は載せない。
こちらで思いつくのはこれくらいですが、3.はあまりよい考えとは思っていません。
5 ななしのよっしん
2021/11/07(日) 08:38:59 ID: 7kHCqruzVb
>>4
私も1.で考えてます
追加面の文字を指して「サロゲートペア文字」と呼ぶこともあるので単語記事自体は残しておいたほうが良さそうな気もしますが、Unicode記事でフォローすれば足りますかね
6 ななしのよっしん
2021/11/07(日) 13:10:13 ID: Z0FpPbHF2L
>>5
この記事はリダイレクト化ではなく記事として残すということでしょうか。
それなら、2.もいいかなと思いますが、いかがでしょう。
7 ななしのよっしん
2021/11/09(火) 23:20:32 ID: Z0FpPbHF2L
>>5
とりあえず、2.の部分については統合の合意ができていると思うので、統合作業を行いました。
スレチですが、ハッキングの>>17で述べたことがASCIIでも起きたのでこの場を借りて通知させて頂きます。
<<
<
>
>>
1/1
ほめた!
ほめるを取消しました。
ほめるに失敗しました。
ほめるの取消しに失敗しました。