トップページ > プログラム > 2020年09月24日 > 2TpuCg1t

書き込み順位&時間帯一覧

10 位/139 ID中時間01234567891011121314151617181920212223Total
書き込み数0200000001011100000000028



使用した名前一覧書き込んだスレッド一覧
デフォルトの名無しさん
文字コード総合スレ Part12

書き込みレス一覧

文字コード総合スレ Part12
143 :デフォルトの名無しさん[sage]:2020/09/24(木) 01:15:56.19 ID:2TpuCg1t
>>142
だれもそんな比較してない。よく読め
UTF8方式が提案された年とUTF16方式が提案された年を比較してる。
文字コード総合スレ Part12
146 :デフォルトの名無しさん[sage]:2020/09/24(木) 01:48:26.24 ID:2TpuCg1t
>>145
何? その超理論、詳しく教えて?
どうやったらサロゲートペアより前に UTF16が存在できるの?
どの規格書に書いてある用語使ってるの?
文字コード総合スレ Part12
148 :デフォルトの名無しさん[sage]:2020/09/24(木) 09:22:54.19 ID:2TpuCg1t
>>147
だから、それも違うんだ。
Unicode に固定長エンコーディングしか無かったのは正しい。
一方で UTF-8 は Unicode のために作られらのでは無くて国際規格の UCS-4 のために作られた。
その後に Unicode と国際規格が事実上統合された。
文字コード総合スレ Part12
150 :デフォルトの名無しさん[sage]:2020/09/24(木) 11:57:01.94 ID:2TpuCg1t
>>149
細かいこ指摘だけど UCS に Tranmsform するのではなくて、UCS から Transform がより正確だよ。
文字コード総合スレ Part12
151 :デフォルトの名無しさん[sage]:2020/09/24(木) 12:55:17.64 ID:2TpuCg1t
簡単な用語定義 (※元々は ISO における用語、後に Unicode にも取り入れられた)
ユニコード・コンソーシアムが定めている文字コードを「Unicode」という
国際規格委員会が ISO-10646 で定めている文字コードを「UCS」という
国際規格 UCS を 32 bit 固定長で符号化したものを「UCS-4」と呼ぶ
国際規格 UCS の BMP だけを 16 bit 固定長で符号化した簡易実装を「UCS-2」と呼ぶ(後に廃止)
第一次国際規格(1993年)の付録に定められた UCS の 8-bit 可変長符号化を「UTF」(UCS 変形フォーマットの意味)と呼ぶ(後に廃止)
国際規格の追補(1996年)で追加された UCS の 8-bit 可変長符号化を「UTF-8」と呼ぶ
国際規格の追補(1996年)で追加された UCS のサロゲートペアを用いた 16-bit 可変長フォーマットを「UTF-16」と呼ぶ

備考
UCS-2 は Unicode 1.1 とほぼ互換になるように定められた
UTF-16 は Unicode 2.0 (サロゲートペア有)と互換になるように定められた
後に定められた「UTF-32 」と UCS-4 は実質的に同じもの
UTF は UTF-8 と区別するために UTF-1 と呼ばれるようになった
UTF-8 は規格化される前は FSS-UTF とか UTF-2 などと呼ばれていた
文字コード総合スレ Part12
152 :デフォルトの名無しさん[sage]:2020/09/24(木) 13:18:02.55 ID:2TpuCg1t
以上の用語定義で UTF-8 導入の経緯は

Unicode はもともと内部 16 bit、外部 16 bit の使用法を前提にしていたが、国際規格では内部 32 bit、外部 8 bit可変長で実装することも想定していた。

このための外部用 8 bit 可変長文字コードとして最初に提案されたのが、UTF (UTF-1) 方式。

だだこの UTF-1 方式は Unix のファイル名等に使えないという欠点があっったので、すぐに改良版の FSS-UTF (UTF-8) 方式が提案され、そっちで実装が進んだ。

第一次規格(1993年)では時間的に変更が間に合わなくて UTF-1 方式の方が規格書の付録に記載されたが、後から追補(1996年)によって UTF-1 方式と UTF-8 方式を入れ換えた。
文字コード総合スレ Part12
154 :デフォルトの名無しさん[sage]:2020/09/24(木) 23:00:01.78 ID:2TpuCg1t
UTF-1 があるから歴史が古いなんて言ってる人いないけど、どこ見てるの。
UTF-1 のすぐ後に UTF-8 が提案されてて間は1年もないよ。寝惚けてるの?
文字コード総合スレ Part12
157 :デフォルトの名無しさん[sage]:2020/09/24(木) 23:22:52.82 ID:2TpuCg1t
>>155
だから、それが間違いって指摘してるんだが


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。