Scala 中的包私有作用域在 Java 中可见
我刚刚发现了一个非常奇怪的 Scala 范围界定行为,当从 Java 代码中使用 Scala 代码生成的字节码时。考虑以下使用 Spark (Spark 1.4, Hadoop 2.6) 的代码段:
import java.util.Arrays;
import java.util.List;
import org.apache.spark.SparkConf;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.broadcast.Broadcast;
public class Test {
public static void main(String[] args) {
JavaSparkContext sc =
new JavaSparkContext(new SparkConf()
.setMaster("local[*]")
.setAppName("test"));
Broadcast<List<Integer>> broadcast = sc.broadcast(Arrays.asList(1, 2, 3));
broadcast.destroy(true);
// fails with java.io.IOException: org.apache.spark.SparkException:
// Attempted to use Broadcast(0) after it was destroyed
sc.parallelize(Arrays.asList("task1", "task2"), 2)
.foreach(x -> System.out.println(broadcast.getValue()));
}
}
这段代码失败了,这是我在使用它之前自愿销毁的,但问题是,在我的心智模型中,它甚至不应该编译,更不用说运行良好了。Broadcast
实际上,它被声明为从我的代码中不可见。我会尝试查看的字节码,但这不是我的专长,这就是为什么我更喜欢发布这个问题。另外,很抱歉,我懒得创建一个不依赖于Spark的示例,但至少你明白了。请注意,我可以使用Spark的各种包私有方法,这不仅仅是关于.Broadcast.destroy(Boolean)
private[spark]
Broadcast
Broadcast
对正在发生的事情有任何想法吗?