bigdata 第1页

首页 ❯

bigdata

更多 »

database java architecture scalability bigdata
如何处理来自不同服务器的多个数据库结果的请求我有云统计（结构化数据：：CSV）信息;我必须向管理员和用户公开。但是为了可扩展性;数据收集将由与各个DB连接的多台机器（性能监视器）收集。现在管理器（Mgr）负责将请求多播到所有pe
java google-cloud-platform publish-subscribe apache-beam bigdata
使用Google pub/sub更新单例HashMap 我有一个用例，我初始化了一个包含一组查找数据（有关物联网设备的物理位置等的信息）的HashMap。此查找数据用作第二个数据集的参考数据，该数据集是 PCollection。此 PCollection 是一个数据流�
java cassandra datastax bigdata cqlsh
卡桑德拉的 cqlsh 控制台中的操作超时错误我有一个三个节点Cassandra Cluster，我创建了一个超过2，000，000行的表。当我在cqlsh中执行此（）查询时，我得到了这个错误：操作超时输出：错误={}，last_host=192.168.1.2 当我运行计数函数的�
java scala apache-spark bigdata
如何知道作业的哪个阶段当前在 Apache Spark 中运行？考虑一下我在Spark中有一份工作; CSV 文件 ==> 按列筛选 ==> 取样本 ==> 另存为 JSON 现在我的要求是我如何知道作业的哪个步骤（提取文件或过滤或采样）当前正在以编程方式执行（最好使用Java API�