hadoop 第7页

首页 ❯

hadoop

更多 »

java hadoop
线程 “main” java.lang.UnsatisfiedLinkError 中的异常：org.apache.hadoop.io.nativeio.NativeIO$Windows.access0（Ljava/lang/String;I）Z 尝试在Windows 7中运行MR程序版本（2.7），在eclipse中运行64位，同时运行上述异常发生。我验证了使用64位1.8 java版本，并观察到所有hadoop守护进程都在运行。任何建议都非常感谢
java user-defined-functions hadoop hive
COLLECT_SET（）在 Hive 中，保留重复项？有没有办法将重复项保留在 Hive 的收集集中，或者模拟 Hive 使用其他方法提供的聚合集合类型？我想将列中具有相同键的所有项目聚合到一个数组中，并带有重复项。即：
java gradle hadoop cascading scalding
级联示例无法编译？在 shell 中，我在 Impatient/part1 目录中键入了 gradle。输出如下。错误是“找不到 org.apache.hadoop.mapred.JobConf 的类文件”。为什么它无法编译？
java apache-zookeeper hadoop
为什么我们需要Hadoop堆栈中的ZooKeeper？我是Hadoop/ZooKeeper的新手。我无法理解将ZooKeeper与Hadoop一起使用的目的，ZooKeeper是否在Hadoop中编写数据？如果不是，那么我们为什么要在Hadoop上使用ZooKeeper呢？
java mapreduce hadoop
Hadoop DistributedCache已被弃用 - 什么是首选的API？我的地图任务需要一些配置数据，我想通过分布式缓存分发这些数据。 Hadoop 。实现这一目标的新首选方法是什么？是否有涵盖此 API 的最新示例或教程？
java hadoop
刚好够 Java 的 Hadoop [已关闭] 我做C++开发人员已经有10年了。我需要为Hadoop选择Java。我怀疑我不会在Java中做任何其他事情。所以，我想要一个我需要拿起的东西的清单。当然，我需要学习核心语言，但
java scala hadoop apache-spark
如何强制 Spark 执行代码？我如何强制Spark执行对map的调用，即使它认为由于延迟评估而不需要执行？我试图放地图调用，但这仍然没有解决问题。我的地图方法实际上将结果上传到HDFS。所以，它不是无用的，但Spark认为
java mapreduce hadoop
使用MapReduce/Hadoop对大数据进行排序我正在阅读有关MapReduce的信息，以下事情使我感到困惑。假设我们有一个包含100万个条目（整数）的文件，并且我们想使用MapReduce对它们进行排序。我理解的方式如下：编写一个对整数进行排
java mapreduce hadoop
没有这样的方法例外Hadoop<init> 当我从命令提示符运行Hadoop.jar文件时，它会引发一个异常，说没有这样的方法StockKey方法。 StockKey是我自己为我自己的密钥类型定义的自定义类。这是例外：
file type-conversion java hadoop hive
如何将.txt文件转换为Hadoop的序列文件格式为了有效地利用存储数据。但是，目前数据仅采用平面.txt格式。任何人都可以建议一种方法，我可以将.txt文件转换为序列文件？

1...3 4 5 6 7 8