- 【Lua】組み込み系言語総合 その6【Squirrel】
815 :デフォルトの名無しさん[sage]:2016/02/12(金) 09:29:05.34 ID:whWT7zC/ - >>814
「文字列型のエンコーディング」の話をする場合、 内部の保持方法なのか、文字単位で扱う場合の見え方なのかで祖語があったかも。 私見だが、内部表現は言語本体の開発者だけが知っていれば良いもので、 使う側は文字単位でしか扱えなくて構わないと思ってる。 UTF-8で保持して、文字を要求されるとUTF-32で返す実装ももちろんアリだ。 UTF-32 Luaもそんなイメージだった。 UTF-8での保持が前提だから、WindowsではUTF-16へ変換してW系のAPIを使えるし 長さ, substr, 正規表現 等は、バイトではなく文字数で指定させる。
|