导致随机播放的 Spark 转换有哪些?
2022-09-01 02:27:43
我在 Spark 文档操作中很难找到导致随机播放的操作,而操作则不会。在此列表中,哪些会导致洗牌,哪些不会导致洗牌?
地图和过滤器不会。但是,我不确定其他人。
map(func)
filter(func)
flatMap(func)
mapPartitions(func)
mapPartitionsWithIndex(func)
sample(withReplacement, fraction, seed)
union(otherDataset)
intersection(otherDataset)
distinct([numTasks]))
groupByKey([numTasks])
reduceByKey(func, [numTasks])
aggregateByKey(zeroValue)(seqOp, combOp, [numTasks])
sortByKey([ascending], [numTasks])
join(otherDataset, [numTasks])
cogroup(otherDataset, [numTasks])
cartesian(otherDataset)
pipe(command, [envVars])
coalesce(numPartitions)