Java 对象类似于 R data.frame [已关闭]

2022-09-01 00:09:45

我真的很喜欢R中的data.frames,因为你可以在一个数据结构中存储不同类型的数据,并且你有很多不同的方法来修改数据(添加列,合并data.frames,...),从数据中提取子集真的很容易,...

是否有任何具有相同功能的Java库可用?我最感兴趣的是以类似矩阵的方式存储不同类型的数据,并能够提取数据的子集。

在Java中使用二维数组可以提供类似的结构,但是添加列然后提取前k条记录要困难得多。


答案 1

Tablesaw(https://github.com/jtablesaw/tablesaw)是Java数据框架,始于2015年,正在积极开发(2018年)。它被设计为尽可能可扩展,而不会牺牲易用性。功能包括按行和列进行过滤,描述性统计信息,映射/减少函数,交叉表,绘图,机器学习。Apache 许可证。

在一个查询测试中,它在 2 毫秒内从 1/20 亿个记录表中返回了 500 多个记录。

欢迎贡献、功能请求和反馈。


答案 2

我刚刚开源了Paleo的第一个草稿版本,这是一个Java 8库,它提供了基于类型化列的数据帧(包括对基元值的支持)。列可以通过编程方式创建(通过简单的生成器 API),也可以从文本文件导入。

有关更多详细信息,请参阅自述文件。

该项目从出生起就仍然湿透 - 我对反馈/ PR,tia非常感兴趣!


推荐