以元素频率顺序迭代多集的最简单方法?

2022-09-01 09:43:04

请考虑此示例,它打印出一些设备类型统计信息。(“DeviceType”是一个包含十几个值的枚举。

Multiset<DeviceType> histogram = getDeviceStats();
for (DeviceType type : histogram.elementSet()) {
    System.out.println(type + ": " + histogram.count(type));
}

按照频率顺序打印不同元素的最简单、最优雅的方法是什么(最常见的类型排在第一位)?

快速浏览一下Multiset接口,没有现成的方法,而且Guava的实现(,等)似乎也没有自动保持元素的频率顺序。MultisetHashMultisetTreeMultiset


答案 1

我刚刚将此功能添加到Guava,请参阅此处的Javadoc。

编辑:根据原始问题的用法示例:Multisets.copyHighestCountFirst()

Multiset<DeviceType> histogram = getDeviceStats();
for (DeviceType type : Multisets.copyHighestCountFirst(histogram).elementSet()) {
    System.out.println(type + ": " + histogram.count(type));
}

答案 2

这是一个返回一个条目的方法,按频率排序(更新:使用标志来切换升序/降序,并使用番石榴最喜欢的玩具:在有效的Java中找到,项目3):ListEnum Singleton Pattern

private enum EntryComp implements Comparator<Multiset.Entry<?>>{
    DESCENDING{
        @Override
        public int compare(final Entry<?> a, final Entry<?> b){
            return Ints.compare(b.getCount(), a.getCount());
        }
    },
    ASCENDING{
        @Override
        public int compare(final Entry<?> a, final Entry<?> b){
            return Ints.compare(a.getCount(), b.getCount());
        }
    },
}

public static <E> List<Entry<E>> getEntriesSortedByFrequency(
    final Multiset<E> ms, final boolean ascending){
    final List<Entry<E>> entryList = Lists.newArrayList(ms.entrySet());
    Collections.sort(entryList, ascending
        ? EntryComp.ASCENDING
        : EntryComp.DESCENDING);
    return entryList;
}

测试代码:

final Multiset<String> ms =
    HashMultiset.create(Arrays.asList(
        "One",
        "Two", "Two",
        "Three", "Three", "Three",
        "Four", "Four", "Four", "Four"
    ));

System.out.println("ascending:");
for(final Entry<String> entry : getEntriesSortedByFrequency(ms, true)){
    System.out.println(MessageFormat.format("{0} ({1})",
        entry.getElement(), entry.getCount()));
}

System.out.println("descending:");
for(final Entry<String> entry : getEntriesSortedByFrequency(ms, false)){
    System.out.println(MessageFormat.format("{0} ({1})",
        entry.getElement(), entry.getCount()));
}

输出:

升序:
一 (1)
二 (2)
三 (3)
四 (4)
降序:
四 (4)
三 (3)
二 (2)
一 (1)


推荐