安卓音频FFT,使用录音检索特定频率幅度

2022-09-01 04:41:14

我目前正在尝试使用Android实现一些代码,以检测何时通过手机的麦克风播放许多特定的音频范围。我使用该类设置了该类:AudioRecord

int channel_config = AudioFormat.CHANNEL_CONFIGURATION_MONO;
int format = AudioFormat.ENCODING_PCM_16BIT;
int sampleSize = 8000;
int bufferSize = AudioRecord.getMinBufferSize(sampleSize, channel_config, format);
AudioRecord audioInput = new AudioRecord(AudioSource.MIC, sampleSize, channel_config, format, bufferSize);

然后读取音频:

short[] audioBuffer = new short[bufferSize];
audioInput.startRecording();
audioInput.read(audioBuffer, 0, bufferSize);

执行FFT是我陷入困境的地方,因为我在这方面几乎没有经验。我一直在尝试使用这个类:

Java中的FFT复杂类与之配合

然后,我发送以下值:

Complex[] fftTempArray = new Complex[bufferSize];
for (int i=0; i<bufferSize; i++)
{
    fftTempArray[i] = new Complex(audio[i], 0);
}
Complex[] fftArray = fft(fftTempArray);

这很容易让我误解这个类是如何工作的,但是返回的值跳遍了整个地方,即使在沉默中也不能代表一致的频率。有没有人知道执行此任务的方法,或者我是否过于复杂地尝试仅获取少量的频率范围,而不是将其绘制为图形表示?


答案 1

首先,您需要确保获得的结果正确转换为浮点数/双精度。我不确定 short[] 版本是如何工作的,但 byte[] 版本只返回原始字节版本。然后,需要将此字节数组正确转换为浮点数。转换的代码应如下所示:

    double[] micBufferData = new double[<insert-proper-size>];
    final int bytesPerSample = 2; // As it is 16bit PCM
    final double amplification = 100.0; // choose a number as you like
    for (int index = 0, floatIndex = 0; index < bytesRecorded - bytesPerSample + 1; index += bytesPerSample, floatIndex++) {
        double sample = 0;
        for (int b = 0; b < bytesPerSample; b++) {
            int v = bufferData[index + b];
            if (b < bytesPerSample - 1 || bytesPerSample == 1) {
                v &= 0xFF;
            }
            sample += v << (b * 8);
        }
        double sample32 = amplification * (sample / 32768.0);
        micBufferData[floatIndex] = sample32;
    }

然后,使用 micBufferData[] 创建输入复杂数组。

获得结果后,在结果中使用复数的大小。除具有实际值的频率外,大多数幅度应接近于零。

您需要采样频率才能将数组索引转换为此类幅度到频率:

private double ComputeFrequency(int arrayIndex) {
    return ((1.0 * sampleRate) / (1.0 * fftOutWindowSize)) * arrayIndex;
}

答案 2

推荐