文档

Java™教程
隐藏目录
自定义排序规则
路径:国际化
课程:处理文本
章节:比较字符串

自定义排序规则

前一节讨论了如何使用预定义的规则来比较字符串。这些排序规则决定了字符串的排序顺序。如果预定义的排序规则不能满足您的需求,您可以设计自己的规则并将它们分配给RuleBasedCollator对象。

自定义排序规则包含在传递给RuleBasedCollator构造函数的String对象中。以下是一个简单的示例:

String simpleRule = "< a < b < c < d";
RuleBasedCollator simpleCollator = new RuleBasedCollator(simpleRule);

在前面的示例中,a小于bb小于c,依此类推。在比较字符串时,simpleCollator.compare方法引用这些规则。构建排序规则的完整语法比这个简单示例更灵活和复杂。有关语法的完整描述,请参阅RuleBasedCollator类的API文档。

接下来的示例对一个包含两个排序器的西班牙语单词列表进行排序。该示例的完整源代码在RulesDemo.java中。

RulesDemo程序首先定义了英语和西班牙语的排序规则。程序将按传统方式对西班牙语单词进行排序。按传统规则排序时,字母ch和ll及其大写形式在排序顺序中都有自己的位置。这些字符对比时视为一个字符。例如,ch按单个字母排序,在排序顺序中紧随cz。请注意两个排序器的规则的区别:

String englishRules = (
    "< a,A < b,B < c,C < d,D < e,E < f,F " +
    "< g,G < h,H < i,I < j,J < k,K < l,L " +
    "< m,M < n,N < o,O < p,P < q,Q < r,R " +
    "< s,S < t,T < u,U < v,V < w,W < x,X " +
    "< y,Y < z,Z");

String smallnTilde = new String("\u00F1");    // ñ
String capitalNTilde = new String("\u00D1");  // Ñ

String traditionalSpanishRules = (
    "< a,A < b,B < c,C " +
    "< ch, cH, Ch, CH " +
    "< d,D < e,E < f,F " +
    "< g,G < h,H < i,I < j,J < k,K < l,L " +
    "< ll, lL, Ll, LL " +
    "< m,M < n,N " +
    "< " + smallnTilde + "," + capitalNTilde + " " +
    "< o,O < p,P < q,Q < r,R " +
    "< s,S < t,T < u,U < v,V < w,W < x,X " +
    "< y,Y < z,Z");

以下代码行创建排序器并调用排序例程:

try {
    RuleBasedCollator enCollator = new RuleBasedCollator(englishRules);
    RuleBasedCollator spCollator =
        new RuleBasedCollator(traditionalSpanishRules);

    sortStrings(enCollator, words);
    printStrings(words);
    System.out.println();

    sortStrings(spCollator, words);
    printStrings(words);
} catch (ParseException pe) {
    System.out.println("解析规则异常");
}

排序程序的名称为sortStrings,是通用的。它可以根据任何Collator对象的规则对任何单词数组进行排序:

public static void sortStrings(Collator collator, String[] words) {
    String tmp;
    for (int i = 0; i < words.length; i++) {
        for (int j = i + 1; j < words.length; j++) {
            if (collator.compare(words[i], words[j]) > 0) {
                tmp = words[i];
                words[i] = words[j];
                words[j] = tmp;
            }
        }
    }
}

使用英语排序规则对单词数组进行排序后,结果如下:

chalina
curioso
llama
luz

将上述列表与按照传统西班牙排序规则排序的列表进行比较:

curioso
chalina
luz
llama

上一页: 执行与语言环境无关的比较
下一页: 提高排序性能