- 【Bash】Windows Subsystem for Linux【Ubuntu】2©2ch.net
443 :login:Penguin[sage]:2017/11/15(水) 11:56:01.57 ID:uITZ0j6D - UTF16 は、2バイト文字だけなら、
例えば10バイトなら、5文字って簡単に計算できるけど、 4バイト文字(サロゲートペア)があるから「2, 4, 2, 2, 2」で4文字になったりするから、 前から順番に、すべて走査しないと、文字数がわからない UTF32 にすると、すべてが4バイト文字になるから、簡単に文字数が計算できるけど、 メモリを2倍使うから、無駄が大きい また、mac では「が」などを、「か」+ 濁点で表すから、「が」が検索できない Windows, Linux は、合成済み文字・NFC。 mac は、結合文字列・NFD
|