トップページ > Linux > 2017年11月15日 > uITZ0j6D

書き込み順位&時間帯一覧

17 位/159 ID中時間01234567891011121314151617181920212223Total
書き込み数0000000000011000000000002



使用した名前一覧書き込んだスレッド一覧
login:Penguin
【Bash】Windows Subsystem for Linux【Ubuntu】2©2ch.net
くだらねえ質問はここに書き込め!Part 229©2ch.net

書き込みレス一覧

【Bash】Windows Subsystem for Linux【Ubuntu】2©2ch.net
443 :login:Penguin[sage]:2017/11/15(水) 11:56:01.57 ID:uITZ0j6D
UTF16 は、2バイト文字だけなら、
例えば10バイトなら、5文字って簡単に計算できるけど、

4バイト文字(サロゲートペア)があるから「2, 4, 2, 2, 2」で4文字になったりするから、
前から順番に、すべて走査しないと、文字数がわからない

UTF32 にすると、すべてが4バイト文字になるから、簡単に文字数が計算できるけど、
メモリを2倍使うから、無駄が大きい

また、mac では「が」などを、「か」+ 濁点で表すから、「が」が検索できない

Windows, Linux は、合成済み文字・NFC。
mac は、結合文字列・NFD
くだらねえ質問はここに書き込め!Part 229©2ch.net
582 :login:Penguin[sage]:2017/11/15(水) 12:07:38.66 ID:uITZ0j6D
>>574
TeraPad なんか、中国の地名の「深せん」の「せん」が、? になる

Unicode 文字は、ドンドン追加されていくのに、すべてのアプリで対応するのは無理


※このページは、『2ちゃんねる』の書き込みを基に自動生成したものです。オリジナルはリンク先の2ちゃんねるの書き込みです。
※このサイトでオリジナルの書き込みについては対応できません。
※何か問題のある場合はメールをしてください。対応します。