- 文字コード総合スレ Part12
143 :デフォルトの名無しさん[sage]:2020/09/24(木) 01:15:56.19 ID:2TpuCg1t - >>142
だれもそんな比較してない。よく読め UTF8方式が提案された年とUTF16方式が提案された年を比較してる。
|
- 文字コード総合スレ Part12
146 :デフォルトの名無しさん[sage]:2020/09/24(木) 01:48:26.24 ID:2TpuCg1t - >>145
何? その超理論、詳しく教えて? どうやったらサロゲートペアより前に UTF16が存在できるの? どの規格書に書いてある用語使ってるの?
|
- 文字コード総合スレ Part12
148 :デフォルトの名無しさん[sage]:2020/09/24(木) 09:22:54.19 ID:2TpuCg1t - >>147
だから、それも違うんだ。 Unicode に固定長エンコーディングしか無かったのは正しい。 一方で UTF-8 は Unicode のために作られらのでは無くて国際規格の UCS-4 のために作られた。 その後に Unicode と国際規格が事実上統合された。
|
- 文字コード総合スレ Part12
150 :デフォルトの名無しさん[sage]:2020/09/24(木) 11:57:01.94 ID:2TpuCg1t - >>149
細かいこ指摘だけど UCS に Tranmsform するのではなくて、UCS から Transform がより正確だよ。
|
- 文字コード総合スレ Part12
151 :デフォルトの名無しさん[sage]:2020/09/24(木) 12:55:17.64 ID:2TpuCg1t - 簡単な用語定義 (※元々は ISO における用語、後に Unicode にも取り入れられた)
ユニコード・コンソーシアムが定めている文字コードを「Unicode」という 国際規格委員会が ISO-10646 で定めている文字コードを「UCS」という 国際規格 UCS を 32 bit 固定長で符号化したものを「UCS-4」と呼ぶ 国際規格 UCS の BMP だけを 16 bit 固定長で符号化した簡易実装を「UCS-2」と呼ぶ(後に廃止) 第一次国際規格(1993年)の付録に定められた UCS の 8-bit 可変長符号化を「UTF」(UCS 変形フォーマットの意味)と呼ぶ(後に廃止) 国際規格の追補(1996年)で追加された UCS の 8-bit 可変長符号化を「UTF-8」と呼ぶ 国際規格の追補(1996年)で追加された UCS のサロゲートペアを用いた 16-bit 可変長フォーマットを「UTF-16」と呼ぶ 備考 UCS-2 は Unicode 1.1 とほぼ互換になるように定められた UTF-16 は Unicode 2.0 (サロゲートペア有)と互換になるように定められた 後に定められた「UTF-32 」と UCS-4 は実質的に同じもの UTF は UTF-8 と区別するために UTF-1 と呼ばれるようになった UTF-8 は規格化される前は FSS-UTF とか UTF-2 などと呼ばれていた
|
- 文字コード総合スレ Part12
152 :デフォルトの名無しさん[sage]:2020/09/24(木) 13:18:02.55 ID:2TpuCg1t - 以上の用語定義で UTF-8 導入の経緯は
Unicode はもともと内部 16 bit、外部 16 bit の使用法を前提にしていたが、国際規格では内部 32 bit、外部 8 bit可変長で実装することも想定していた。 このための外部用 8 bit 可変長文字コードとして最初に提案されたのが、UTF (UTF-1) 方式。 だだこの UTF-1 方式は Unix のファイル名等に使えないという欠点があっったので、すぐに改良版の FSS-UTF (UTF-8) 方式が提案され、そっちで実装が進んだ。 第一次規格(1993年)では時間的に変更が間に合わなくて UTF-1 方式の方が規格書の付録に記載されたが、後から追補(1996年)によって UTF-1 方式と UTF-8 方式を入れ換えた。
|
- 文字コード総合スレ Part12
154 :デフォルトの名無しさん[sage]:2020/09/24(木) 23:00:01.78 ID:2TpuCg1t - UTF-1 があるから歴史が古いなんて言ってる人いないけど、どこ見てるの。
UTF-1 のすぐ後に UTF-8 が提案されてて間は1年もないよ。寝惚けてるの?
|
- 文字コード総合スレ Part12
157 :デフォルトの名無しさん[sage]:2020/09/24(木) 23:22:52.82 ID:2TpuCg1t - >>155
だから、それが間違いって指摘してるんだが
|