如何使用Java中的火花在Dataframe中将空值替换为特定值?
2022-09-01 15:04:04
我正在尝试使用Java提高在Spark中实现的Logistic回归算法的准确性。为此,我正在尝试将列中存在的 Null 或无效值替换为该列中最常用的值。例如:-
Name|Place
a |a1
a |a2
a |a2
|d1
b |a2
c |a2
c |
|
d |c1
在本例中,我将“Name”列中的所有 NULL 值替换为“a”,将“Place”列中的所有 NULL 值替换为 “a2”。到目前为止,我只能提取特定列中最常见的列。您能否帮助我完成第二步,了解如何将空值或无效值替换为该列中最常用的值。