在 Hadoop 中使用 NullWriteable 的优势
与使用文本相比,使用键/值有哪些优势(即 )。我从《Hadoop: The Definitive Guide》一书中看到了以下内容。NullWritable
null
null
new Text(null)
NullWritable
是 一种特殊类型的 ,因为它具有零长度序列化。不会向流写入或读取任何字节。它被用作占位符;例如,在MapReduce中,当您不需要使用该位置时,可以将键或值声明为该位置 - 它有效地存储了一个恒定的空值。NullWriteable 在您想要存储值列表(而不是键值对)时也可以用作键。它是一个不可变的单例:实例可以通过调用来检索Writable
NullWritable
SequenceFile
NullWritable.get()
我不清楚如何使用?在开始的输出文件中是否会有一个常量值指示此文件的键或值是 ,以便MapReduce框架可以忽略读取键/值(以)为准)?另外,文本实际上是如何序列化的?NullWritable
null
null
null
null
谢谢
文卡特