Java 简单的神经网络设置

我决定尝试一些涉及Java神经网络的简单概念,并且在改编我在论坛上发现的一些无用的代码时,我已经能够为典型的初学者的XOR模拟创建一个非常简单的模型:


public class MainApp {
    public static void main (String [] args) {
        Neuron xor = new Neuron(0.5f);
        Neuron left = new Neuron(1.5f);
        Neuron right = new Neuron(0.5f);
        left.setWeight(-1.0f);
        right.setWeight(1.0f);
        xor.connect(left, right);

        for (String val : args) {
            Neuron op = new Neuron(0.0f);
            op.setWeight(Boolean.parseBoolean(val));
            left.connect(op);
            right.connect(op);
        }

        xor.fire();

        System.out.println("Result: " + xor.isFired());

    }
}

public class Neuron {
    private ArrayList inputs;
    private float weight;
    private float threshhold;
    private boolean fired;

    public Neuron (float t) {
        threshhold = t;
        fired = false;
        inputs = new ArrayList();
    }

    public void connect (Neuron ... ns) {
        for (Neuron n : ns) inputs.add(n);
    }

    public void setWeight (float newWeight) {
        weight = newWeight;
    }

    public void setWeight (boolean newWeight) {
        weight = newWeight ? 1.0f : 0.0f;
    }

    public float getWeight () {
        return weight;
    }

    public float fire () {
        if (inputs.size() > 0) {
            float totalWeight = 0.0f;
            for (Neuron n : inputs) {
                n.fire();
                totalWeight += (n.isFired()) ? n.getWeight() : 0.0f;
            }
            fired = totalWeight > threshhold;
            return totalWeight;
        }
        else if (weight != 0.0f) {
            fired = weight > threshhold;
            return weight;
        }
        else {
            return 0.0f;
        }
    }

    public boolean isFired () {
        return fired;
    }
}

在我的主课程中,我在对Jeff Heaton的图表进行建模时创建了简单的模拟:XOR diagram

但是,我想确保神经元类的实现是正确的。我已经测试了所有可能的输入([true true],[true false],[false true],[false true],[false false]),并且它们都通过了我的手动验证。此外,由于该程序接受输入作为参数,因此它似乎还通过对输入的手动验证,例如[true false false],[true true false]等。

但从概念上讲,这种实现是否正确?或者,在我开始进一步开发和研究此主题之前,我该如何改进它?

谢谢!


答案 1

这看起来是一个很好的起点。我确实有一些建议:

  1. 为了提高可伸缩性,应该重新构建fire(),以便已经使用当前输入集触发的神经元不必每次都重新计算。如果您有另一个隐藏层或多个输出节点,则会出现这种情况。

  2. 请考虑将阈值计算拆分为自己的方法。然后,您可以子类神经元并使用不同类型的激活函数(双极性Sigmoid,RBF,线性等)。

  3. 要学习更复杂的函数,请为每个神经元添加偏差输入。它基本上就像另一个具有自身权重值的输入,但输入始终固定在1(或-1)。

  4. 不要忘记允许训练方法。反向传播将需要类似fire()的反函数,以获取目标输出并波纹每个层的权重变化。


答案 2

从我用神经网络完成的(有限的)工作来看,这个实现和模型对我来说是正确的 - 输出是我期望的,源代码看起来很可靠。


推荐