通过 Android 上的 TCP 套接字进行音频流传输

我正在通过套接字从C服务器流式传输麦克风输入。我知道该流有效,因为它与C客户端一起使用,并且我在Android客户端上获得了正确的值。

我正在流式传输1024浮动阵列。一个浮点数为 4 个字节。所以我得到了一个每帧4096字节的传入流。我正在从这个字节中获取浮点数,我知道这个浮点数是我发送的浮点数,所以该部分应该可以工作。

现在,我想使用 AudioTrack 将该流直接传输到手机扬声器。我试图输入我直接收到的字节:只是噪音。我试图把它转换回一个字节数组,仍然一样。我试图将浮点投射成短(因为AudioTrack需要字节或短)。我本可以得到一些可能是我的麦克风输入(敲门)的东西,但非常粗糙,而且非常滞后。如果帧之间有滞后,我会理解,但我甚至无法获得一个清晰的声音。然而,我可以清楚地输出一个罪恶的声音,我在当地制作并放入那个短数组中。现在我想知道我是否在我的代码中遇到了一些问题,你们中的任何一个人都可以看到,因为我没有看到它们。

我正在做的是:我在一个字节数组中放置4个字节。我把浮子从中取出。一旦我在浮子数组中获得了一个Frame(我用一个boool控制它,不好,但它应该有效),我就把它放在我的shortarray中,让audiotrack播放它。这种双重投射可能很慢,但我这样做是因为这是我最接近实际输入的。

编辑:我通过比较浮点数来检查字节序,它们在-1和1之间具有适当的值,并且与我发送的值相同。由于我不会在转换为浮动时更改字节序,因此我不明白为什么将4096字节数组直接转发到AudioTrack也不起作用。多线程可能有问题,但我不明白它可能是什么。

编辑 2:我发现了一个小问题 - 我在1023重置了j。但缺少浮存金不应该是问题所在。除此之外,我所做的是将从套接字获取流的方法放在另一个线程中,而不是在异步任务中调用它。这使得它工作,我现在能够理解麦克风的声音。质量仍然很差 - 代码中是否有原因?另外,我得到了大约10秒的延迟。只有大约半秒钟是由WLAN引起的,所以我想知道这是否可能是代码错误。任何进一步的想法都值得赞赏。

编辑3:我玩了一下代码,并在评论中实现了一些绿色应用程序的想法。使用新的线程结构,我面临着无法获得任何声音的问题。就像一样。我不明白这怎么可能,所以我切换回去。我试图使线程更轻量级的其他事情没有任何效果。我得到了一个延迟,我得到了一个非常差的质量(我可以识别敲门声,但我无法理解声音)。我认为我的转换可能有问题,所以我把从插座收到的字节直接放在AudioTrack中 - 除了丑陋的脉冲静态噪音之外什么都没有。现在我更加困惑,因为这个确切的流仍然适用于C客户端。如果我找到解决方案,我会报告回来,但仍然欢迎任何帮助。

编辑 4我应该补充一点,我可以播放来自另一个Android应用程序的麦克风输入,在那里我直接以字节的形式发送该输入(我会排除浮点转换的东西,并将我收到的字节直接放在我的播放器代码中的audioTrack中)。
我也想到,这可能是一个问题,C服务器流式传输的所述浮动阵列来自64位机器,而手机是32位。这是否在某种程度上是一个问题,即使我只是将浮点数流式传输为4个字节?或者,我的另一个想法:我收到的字节的基础数字格式是浮点型。AudioTrack期望什么格式?即使只输入字节 - 我是否需要将浮点数转换为int并将其转换回字节或其他东西?

新代码:

public class PCMSocket {

AudioTrack audioTrack;
boolean doStop = false;
int musicLength = 4096;
byte[] music;
Socket socket;
short[] buffer = new short[4096];
float[] fmusic = new float[1024];
WriteToAudio writeThread;
ReadFromSocket readThread;


public PCMSocket()
{

}

public void start()
{
    doStop = false;
    readThread = new ReadFromSocket();
    readThread.start();
}

public class ReadFromSocket extends Thread
{       
    public void run()
    {
    doStop=true;

    InetSocketAddress address = new InetSocketAddress("xxx.xxx.xxx.x", 8000);

    socket = new Socket();
    int timeout = 6000;   
    try {
        socket.connect(address, timeout);
    } catch (IOException e2) {
        e2.printStackTrace();
    }

     musicLength = 1024;

    InputStream is = null;

    try {
        is = socket.getInputStream();
    } catch (IOException e) {
        e.printStackTrace();
    }

    BufferedInputStream bis = new BufferedInputStream(is);
    DataInputStream dis = new DataInputStream(bis);     

    try{

    int minSize =AudioTrack.getMinBufferSize( 44100, AudioFormat.CHANNEL_CONFIGURATION_STEREO, AudioFormat.ENCODING_PCM_16BIT ); 

    audioTrack = new AudioTrack(AudioManager.STREAM_MUSIC, 44100,
            AudioFormat.CHANNEL_OUT_STEREO, 
            AudioFormat.ENCODING_PCM_16BIT, minSize,
            AudioTrack.MODE_STREAM);
        audioTrack.play();

      } catch (Throwable t)
      {
          t.printStackTrace();
        doStop = true;
      }

    writeThread = new WriteToAudio();
    readThread.start();

    int i = 0;   
    int j=0;

    try {
        if(dis.available()>0)Log.d("PCMSocket", "receiving");
        music = new byte[4];
        while (dis.available() > 0)
        {
            music[i]=0;
            music[i] = dis.readByte(); 

            if(i==3)
            {
                int asInt = 0;
                asInt = ((music[0] & 0xFF) << 0) 
                        | ((music[1] & 0xFF) << 8) 
                        | ((music[2] & 0xFF) << 16) 
                        | ((music[3] & 0xFF) << 24);
                float asFloat = 0;
                asFloat = Float.intBitsToFloat(asInt);
                fmusic[j]=asFloat;
            }

            i++;
            j++;
            if(i==4)
            {
                music = new byte[4]; 
                i=0;
            }
            if(j==1024)
            {
                j=0;
                if(doStop)doStop=false;
            }
        }
    } catch (IOException e) {
        e.printStackTrace();
    }

    try {
        dis.close();
    } catch (IOException e) {
        e.printStackTrace();
    }  

    }
};


public class WriteToAudio extends Thread
{       
    public void run()
    {
        while(true){
        while(!doStop)
        {           
            try{
                writeSamples(fmusic);

            }catch(Exception e)
            {
                e.printStackTrace();
            }    
            doStop = true;
        }
        }
    }
};


public void writeSamples(float[] samples) 
{   
   fillBuffer( samples );
   audioTrack.write( buffer, 0, samples.length );
}

private void fillBuffer( float[] samples )
{ 
   if( buffer.length < samples.length )
      buffer = new short[samples.length];

   for( int i = 0; i < samples.length; i++ )
   {
      buffer[i] = (short)(samples[i] * Short.MAX_VALUE);
   }
}   


}

旧代码:

public class PCMSocket {
AudioTrack audioTrack;
WriteToAudio thread;
boolean doStop = false;
int musicLength = 4096;
byte[] music;
Socket socket;
short[] buffer = new short[4096];
float[] fmusic = new float[1024];


public PCMSocket()
{

}

public void start()
{
    doStop = false;
    new GetStream().executeOnExecutor(AsyncTask.THREAD_POOL_EXECUTOR);
}

private class GetStream extends AsyncTask<Void, Void, Void> {

    @Override
    protected Void doInBackground(Void... values) { 
        PCMSocket.this.getSocket();
        return null;

    }

    @Override
    protected void onPreExecute() {
    }



    @Override
    protected void onPostExecute(Void result)
    {
        return;
    }

    @Override
    protected void onProgressUpdate(Void... values) {
    }
}

private void getSocket()
{
    doStop=true;

    InetSocketAddress address = new InetSocketAddress("xxx.xxx.xxx.x", 8000);

    socket = new Socket();
    int timeout = 6000;   
    try {
        socket.connect(address, timeout);
    } catch (IOException e2) {
        e2.printStackTrace();
    }

     musicLength = 1024;

    InputStream is = null;

    try {
        is = socket.getInputStream();
    } catch (IOException e) {
        e.printStackTrace();
    }

    BufferedInputStream bis = new BufferedInputStream(is);
    DataInputStream dis = new DataInputStream(bis);     

    try{

    int minSize =AudioTrack.getMinBufferSize( 44100, AudioFormat.CHANNEL_CONFIGURATION_STEREO, AudioFormat.ENCODING_PCM_16BIT ); 

    audioTrack = new AudioTrack(AudioManager.STREAM_MUSIC, 44100,
            AudioFormat.CHANNEL_OUT_STEREO, 
            AudioFormat.ENCODING_PCM_16BIT, minSize,
            AudioTrack.MODE_STREAM);
        audioTrack.play();

      } catch (Throwable t)
      {
          t.printStackTrace();
        doStop = true;
      }

    thread = new WriteToAudio();
    thread.start();

    int i = 0;   
    int j=0;

    try {
        if(dis.available()>0)Log.d("PCMSocket", "receiving");
        music = new byte[4];
        while (dis.available() > 0)
        {
            music[i]=0;
            music[i] = dis.readByte(); 

            if(i==3)
            {
                int asInt = 0;
                asInt = ((music[0] & 0xFF) << 0) 
                        | ((music[1] & 0xFF) << 8) 
                        | ((music[2] & 0xFF) << 16) 
                        | ((music[3] & 0xFF) << 24);
                float asFloat = 0;
                asFloat = Float.intBitsToFloat(asInt);
                fmusic[j]=asFloat;
            }

            i++;
            j++;
            if(i==4)
            {
                music = new byte[4]; 
                i=0;
            }
            if(j==1023)
            {
                j=0;
                if(doStop)doStop=false;
            }
        }
    } catch (IOException e) {
        e.printStackTrace();
    }

    try {
        dis.close();
    } catch (IOException e) {
        e.printStackTrace();
    }  

}


public class WriteToAudio extends Thread
{       
    public void run()
    {
        while(true){
        while(!doStop)
        {           
            try{
                writeSamples(fmusic);

            }catch(Exception e)
            {
                e.printStackTrace();
            }    
            doStop = true;
        }
        }
    }
};


public void writeSamples(float[] samples) 
{   
   fillBuffer( samples );
   audioTrack.write( buffer, 0, samples.length );
}

private void fillBuffer( float[] samples )
{ 
   if( buffer.length < samples.length )
      buffer = new short[samples.length*4];

   for( int i = 0; i < samples.length; i++ )
   {
      buffer[i] = (short)(samples[i] * Short.MAX_VALUE);
   }
}   


}

答案 1

所以。。。在我绝望地给它带来赏金几个小时后,我就解决了这个问题,但这是值得的。

我决定重新开始。对于设计的东西与线程等。我从这个很棒的项目中得到了一些帮助,它帮助了我很多。现在我只使用一个线程。似乎重点是选角的东西,但我不太确定,它也可能是多线程的。我不知道 AudioTracker 的 byte[] 构造函数期望什么样的字节,但肯定没有浮点字节。所以我知道我需要使用 short[] 构造函数。我所做的是
- 将字节放在一个字节中[]
- 取其中4个并将它们转换为循环
中的浮点数 - 获取每个浮点数并将它们转换为短裤

由于我之前已经这样做了,我不太确定问题是什么。但现在它有效。我希望这可以帮助那些和我一样痛苦的人。非常感谢所有参与和评论的人。

编辑:我只是考虑了这些变化,并认为我之前使用CHANNEL_CONFIGURATION_STEREO而不是MONO对口吃有很大贡献。因此,如果您遇到此问题,则可能需要先尝试该方法。对我来说,这只是解决方案的一部分,只是改变没有帮助。

    static final int frequency = 44100;
    static final int channelConfiguration = AudioFormat.CHANNEL_CONFIGURATION_MONO;
    static final int audioEncoding = AudioFormat.ENCODING_PCM_16BIT;
    boolean isPlaying;
    int playBufSize;
    Socket socket;
    AudioTrack audioTrack;

    playBufSize=AudioTrack.getMinBufferSize(frequency, channelConfiguration, audioEncoding);
    audioTrack = new AudioTrack(AudioManager.STREAM_MUSIC, frequency, channelConfiguration, audioEncoding, playBufSize, AudioTrack.MODE_STREAM);

    new Thread() {
        byte[] buffer = new byte[4096];
        public void run() {
            try { 
                socket = new Socket(ip, port); 
            }
            catch (Exception e) {
                e.printStackTrace();
            }
            audioTrack.play();
            isPlaying = true;
            while (isPlaying) {
                int readSize = 0;
                try { readSize = socket.getInputStream().read(buffer); }
                catch (Exception e) {
                    e.printStackTrace();
                }
                short[] sbuffer = new short[1024];
                for(int i = 0; i < buffer.length; i++)
                {

                    int asInt = 0;
                    asInt = ((buffer[i] & 0xFF) << 0) 
                            | ((buffer[i+1] & 0xFF) << 8) 
                            | ((buffer[i+2] & 0xFF) << 16) 
                            | ((buffer[i+3] & 0xFF) << 24);
                    float asFloat = 0;
                    asFloat = Float.intBitsToFloat(asInt);
                    int k=0;
                    try{k = i/4;}catch(Exception e){}
                    sbuffer[k] = (short)(asFloat * Short.MAX_VALUE);

                    i=i+3;
                }
                audioTrack.write(sbuffer, 0, sbuffer.length);
            }  
            audioTrack.stop();
            try { socket.close(); }
            catch (Exception e) { e.printStackTrace(); }
        }
    }.start();

答案 2

摆脱所有,所有,测试。只需在以下语句中设置代码块即可。无论如何,您都没有更好的事情可做,您甚至试图通过避免阻塞来消耗可能有价值的CPU周期。available()read()

编辑具体来说:

    try {
        socket.connect(address, timeout);
    } catch (IOException e2) {
        e2.printStackTrace();
    }

捕获此异常并允许以下代码继续执行,就好像它没有发生一样。这是一种不好的做法。应允许异常传播到调用方。

    try {
        is = socket.getInputStream();
    } catch (IOException e) {
        e.printStackTrace();
    }

同上。

    try {
        if(dis.available()>0)Log.d("PCMSocket", "receiving");

删除。无论如何,您正在接收。

        music = new byte[4];
        while (dis.available() > 0)

毫无 意义。删除。以下读取将阻塞。

        {
            music[i]=0;

毫无 意义。删除。

            music[i] = dis.readByte(); 

            if(i==3)
            {
                int asInt = 0;
                asInt = ((music[0] & 0xFF) << 0) 
                        | ((music[1] & 0xFF) << 8) 
                        | ((music[2] & 0xFF) << 16) 
                        | ((music[3] & 0xFF) << 24);

这一切都是毫无意义的。将其全部替换为 。short asInt = dis.readInt();

                float asFloat = 0;
                asFloat = Float.intBitsToFloat(asInt);

假设原始转换为 via,则此转换应为 。shortfloatValue * Short.MAX_VALUEasFloat = (float)asInt/Short.MAX_VALUE

            if(i==4)

如果之前是3,那么现在将是4,所以这个测试也是毫无意义的。i

                music = new byte[4]; 

您无需重新分配 。删除。music

    } catch (IOException e) {
        e.printStackTrace();
    }

见上文。毫无 意义。应允许异常传播到调用方。

    try {
        dis.close();
    } catch (IOException e) {
        e.printStackTrace();
    }  

所有这些都应该在一个块中。finally

    }
};

        while(true){
        while(!doStop)

您不需要这两个循环。

            try{
                writeSamples(fmusic);
            }catch(Exception e)
            {
                e.printStackTrace();
            }

见上文。毫无 意义。在这种情况下,异常应终止循环,因为对套接字的任何写入对连接都是致命的。if( buffer.length < samples.length ) buffer = new short[samples.length];IOException

为什么还没有合适的尺寸?或者,如果 ?bufferbuffer.length > samples.length


推荐