如何有效地将多个 json 文件读取到 Dataframe 或 JavaRDD 中?
2022-09-03 03:52:50
我可以使用以下代码读取单个 json 文件,但我需要读取多个 json 文件并将它们合并到一个数据帧中。我该怎么做?
DataFrame jsondf = sqlContext.read().json("/home/spark/articles/article.json");
或者有没有办法将多个json文件读取到JavaRDD中,然后转换为Dataframe?