-
UTF8(旧)
-
正式名称
- UTF8
- 下位互換
-
「~」化ける?
- 化けない
-
各国語対応
- VARCHAR2
- CLOB
-
UTF8(新)
-
正式名称
- AL32UTF8
-
最大格納バイト
-
4000
- ASCII(英語)1バイト
- 日本語3バイト
- 中国語3バイト
-
Unicode補助文字4バイト
- 日本語の第3,4水準
- Hibernate利用不可能
-
UTF16
-
正式名称
- AL16UTF16
-
最大格納桁
-
2000
- 英語2000文字?
- 日本語、中国語2000文字
-
その他4バイト文字の種類は?
- Unicode補助文字
- 丸番号など
- Hibernate利用不可能
-
SJIS
- AL16SJIS(TILDE)
- 「~」化ける
-
特徴
- UTF8に変換必要
-
消費バイト
-
日本語
- 2バイト
-
ASCII
- 1バイト
-
中国
- サポート外
- UTF8、16との比較
-
中国語
- BLOB型として格納
-
codePointAt
- コードポイントに変換
-
Character.toChars()
- コードポイントから文字列変換
-
VARCHAR,NVARCHARの
格納バイトの指定
-
VARCHAR→バイト数?
NVARCHAR→桁数?
- こちらが正しい
- UTF8→バイト数?
UTF16→桁数?
-
検証
- 標準、各国語ともに、UTF8に設定して、
どちらもバイト数でカラムのサイズが指定できるか検証する。