- 文字コード総合スレ part9
7 :デフォルトの名無しさん[sage]:2014/05/29(木) 03:43:39.63 ID:AMcBMTZL - ■ライブラリ
IBM Globalization - ICU http://www-306.ibm.com/software/globalization/icu/ NKF32.DLL http://www.vector.co.jp/soft/win95/util/se020949.html バベル http://tricklib.com/cxx/ex/babel/ バベルの文字コード判定で使ってる日本語文書内での各文字の出現頻度データです。 http://tricklib.com/cxx/ex/babel/scoremap.csv mlang http://msdn.microsoft.com/ja-jp/library/aa767865(en-us).aspx iconv http://www.gnu.org/software/libiconv/ ICU http://www.icu-project.org/
|
- 文字コード総合スレ part9
8 :デフォルトの名無しさん[sage]:2014/05/29(木) 03:44:10.17 ID:AMcBMTZL - ■単語一覧
・UTF-16は16ビット単位にエンコードするけど、サロゲートペアがある 表現できる文字空間はUTF-8と同じく20ビットとちょっと ・丸付き数字は機種依存文字か?MSIME2007ではCP932に収録されてない文字は「環境依存文字」って表示。 MacJapaneseではフォントによっては表示されないし、フォントによっては表示される。 今のMac(内部Unicodeアプリ)は、フォント依存ではなくアプリ依存。 似非ISO-2022-JPや似非Shift_JISのドキュメント中の丸付き数字は、 素直にAppleのAPIを使ってるアプリならゲタ(U+FFFD)になる。 ・Mail.appではISO-2022-JPに収まらずCP932に収まるメールは、含まれる字種によって charset=CP932で送信される場合とISO-2022-JP(もどき)で送信される場合がある ・MSでのウニコードとSJIS変換のバグ。 U+007E TILDE <-> Shift_JIS 0x7E OVERLINE U+301C WAVE DASH -> Shift_JIS NA 【MSの問題】 U+FF5E FULLWIDTH TILDE <-> Shift_JIS 0x8160 WAVE DASH 【MSの問題】 ・SafariでのウニコードとSJIS変換のバグ。 U+007E TILDE -> Shift_JIS 0x8160 WAVE DASH 【Safariの問題】 U+301C WAVE DASH <-> Shift_JIS 0x8160 WAVE DASH U+FF5E FULLWIDTH TILDE <-> Shift_JIS NA ・winzipの規格ではファイル名のコードページ指定もしくは記録情報が存在しない。 解決策:取り合えず、MSWin+JPではShift-jisでファイル自体には保存されている。 MACOSX=Unicode,Unix=UTF/EUC/S-JISどれでもありえる。文字に関係なくLocalLangで 再変換しているので、それをしなければよい。 ・charlenでの文字列長の判定はプラットフォームにより返り値が違う(機種依存文字等)。マニュアル嫁。 ・JISのエスケープシーケンスが正しく認識されない本文とか。 '0x1b, 0x24, 0x42' という3バイトを先頭に、'0x1b, 0x28, 0x42' を末尾に追加汁。 あるいはhttp://masaka.dw.land.to/mr/jmr.phpとか。
|
- 文字コード総合スレ part9
9 :デフォルトの名無しさん[sage]:2014/05/29(木) 03:45:57.03 ID:AMcBMTZL - JTC1/SC2/WG2 - ISO/IEC 10646 - UCS
http://std.dkuug.dk/JTC1/SC2/WG2/ ISO/IEC JTC1/SC2/WG2/IRG Ideographic Rapporteur Group http://appsrv.cse.cuhk.edu.hk/~irg/
|
- 文字コード総合スレ part9
10 :デフォルトの名無しさん[sage]:2014/05/29(木) 03:47:58.07 ID:AMcBMTZL - テンプレ
リンクきれてます(?) 会員制(?) ISO-IR - 2.8.1 Coding systems with Standard return http://www.itscj.ipsj.or.jp/ISO-IR/2-8-1.htm ISO-IR - 2.8.2 Coding Systems without Standard return http://www.itscj.ipsj.or.jp/ISO-IR/2-8-2.htm 日本の委員 (JSC2) http://www.itscj.ipsj.or.jp/meibo/020000.pdf
|
- 文字コード総合スレ part8
993 :デフォルトの名無しさん[sage]:2014/05/29(木) 03:49:04.43 ID:AMcBMTZL - 次スレ
文字コード総合スレ part9 http://peace.2ch.net/test/read.cgi/tech/1401301779/
|