检查字符属性

比较字符串

执行与语言环境无关的比较

自定义排序规则

提高排序性能

Unicode

术语

辅助字符作为代理

字符和字符串 API

设计注意事项

检测文本边界

关于 BreakIterator 类

行边界

将拉丁数字转换为其他 Unicode 数字

转换非 Unicode 文本

字节编码和字符串

字符和字节流

规范化文本

使用 JTextComponent 类处理双向文本

路径：国际化
课程：文本处理
章节：Unicode

« 上一页 • 路径 • 下一页 »

设计注意事项

为了编写适用于任何语言和脚本的代码，需要记住一些事情。

考虑因素	原因
避免使用`char`数据类型的方法。	避免使用`char`原始数据类型或使用`char`数据类型的方法，因为使用该数据类型的代码无法处理补充字符。对于接受`char`类型参数的方法，应该使用相应的`int`方法（如果有的话）。例如，使用`Character.isDigit(int)`方法而不是`Character.isDigit(char)`方法。
使用`isValidCodePoint`方法验证码点值。	码点被定义为`int`数据类型，允许超出0x0000到0x10FFFF有效码点范围的值。出于性能原因，接受码点值作为参数的方法不会检查参数的有效性，但是可以使用`isValidCodePoint`方法来检查值。
使用`codePointCount`方法计算字符数。	`String.length()`方法返回字符串中代码单元或16位`char`值的数量。如果字符串包含补充字符，则计数可能会误导，因为它不会反映真实的代码点数。要准确计算字符数（包括补充字符），请使用`codePointCount`方法。
使用`String.toUpperCase(int codePoint)`和`String.toLowerCase(int codePoint)`方法而不是`Character.toUpperCase(int codePoint)`或`Character.toLowerCase(int codePoint)`方法。	`Character.toUpperCase(int)`和`Character.toLowerCase(int)`方法确实可以处理码点值，但是有一些字符无法进行一对一的转换。例如，德语的小写字符ß在转换为大写时会变成两个字符SS。同样，希腊小写Sigma字符在字符串中的位置不同而有所不同。`Character.toUpperCase(int)`和`Character.toLowerCase(int)`方法无法处理这些情况；然而，`String.toUpperCase`和`String.toLowerCase`方法可以正确处理这些情况。
删除字符时要小心。	在调用`StringBuilder.deleteCharAt(int index)`或`StringBuffer.deleteCharAt(int index)`方法删除索引指向补充字符的情况下，只会删除该字符的前半部分（第一个`char`值）。首先，在字符上调用`Character.charCount`方法以确定是否需要删除一个或两个`char`值。
翻转字符序列时要小心。	在对包含补充字符的文本调用`StringBuffer.reverse()`或`StringBuilder.reverse()`方法时，高位和低位代理对会被颠倒，导致出现错误和可能无效的代理对。

« 上一页 • 目录 • 下一页 »

上一页：示例用法
下一页：更多信息