齿轮减速时客户端发送大型有效负载

2022-08-30 18:37:05

我在使用Gearman时遇到了一个问题,当我通过Gearman PHP扩展向它发送大型有效负载时,将任务转移给工人的速度很慢。事实上,我们并不认为有效载荷那么大(它是30MB)。所有东西(PHP,Gearman,node)现在都在本地运行,因此网络访问不是瓶颈。

PHP 脚本

这是PHP客户端:

ini_set('memory_limit', '1G');

$client= new GearmanClient();
$client->addServer('127.0.0.1', '4730');

$schema = file_get_contents('schema.json');
$data = file_get_contents('data.json');

$gearmanData = [
    'schema' => $schema,
    'data' => $data
];

echo "Encoding in JSON the payload\n";

$gearmanDataString = json_encode($gearmanData, JSON_FORCE_OBJECT);

echo "Sending job to Gearman\n";

// This line takes long to execute...
$result = $client->doNormal("validateJsonSchema", $gearmanDataString);

echo "Job finished\n";

var_dump($result);

这是我的nodejs工作线程,它最终会做一些事情,但是它是空的,以证明工作线程代码不是问题:

var gearmanode = require('gearmanode');

var worker = gearmanode.worker({host: '127.0.0.1' port: 4730});

worker.addFunction('validateJsonSchema', function (job) {
    console.log('I will do something');

    job.workComplete('Toasty!');
});

我在后台启动我的 worker,然后运行我的客户端,它在执行操作时冻结 30 秒左右(就在将 Send job 输出到 Gearman 之后),并通过 PHP 的var_dump输出来完成。所以它有效,但它只是很长的处理时间。$client->doNormalstring(7) "Toasty!"

此外,如果我减小有效负载(data.json)的大小,则花费的时间更少,因此有效负载大小似乎很重要。

我试图用PHP编写相同的工作线程,结果相同:

$worker= new GearmanWorker();
$worker->addServer('127.0.0.1', '4730');
$worker->addFunction("validateJsonSchema", "validateJsonSchema");
while ($worker->work());

function validateJsonSchema($job)
{
  return 'ToastyPHP!';
}

更新

使用node.js客户端,执行与PHP几乎相同的操作,它的执行速度要快得多(约3.5秒)。我是否在PHP版本中做错了什么,或者我缺少一些配置以使其更快?

我的节点.js客户端:

var gearmanode = require('gearmanode');
var fs = require('fs');

var start = Date.now(); 

var client = gearmanode.client();

schema = fs.readFileSync('schema.json', 'utf8');
data = fs.readFileSync('data.json', 'utf8');

var submitData = JSON.stringify({ "data": data, "schema": schema });

// Runs much faster than PHP
var job = client.submitJob('validateJsonSchema', submitData, {background: false});

job.on('complete', function() {
    console.log('RESULT >>> ' + job.response);
    client.close();

    var end = Date.now(); 

    console.log(end-start + ' milliseconds'); // Always shows around 3500 milliseconds
});

任何线索为什么会发生这种情况?Gearman是为处理这种大小的有效载荷而制造的吗?30MB在我的书中并不大。


答案 1

检查此代码是否适合您,花了很少的时间来完成这项工作。

工人.php

echo "Starting\n";
$gmworker = new GearmanWorker();

# Add default server (localhost).
$gmworker->addServer('127.0.0.1', '4730');
$gmworker->addFunction("jsonValid", "jsonValid");



print "Waiting for job...\n";
while ($gmworker->work()) {
    if ($gmworker->returnCode() != GEARMAN_SUCCESS) {
        echo "return_code: " . $gmworker->returnCode() . "\n";
        break;
    }
}

function jsonValid($job)
{
    return 'ToastyPHP!';
}

客户.php

ini_set('memory_limit', '1G');

$client = new GearmanClient();
$client->addServer('127.0.0.1', '4730');
$client->setCompleteCallback("complete");
$time = time();

echo "<pre>Sending job..." . "\n";


$schema = file_get_contents('AllSets.json');
$data = file_get_contents('AllSets.json');


$gearmanData = Array(
    'schema' => $schema,
    'data' => $data
);

$gearmanDataString = json_encode($gearmanData, JSON_FORCE_OBJECT);

$client->addTask("jsonValid", $gearmanDataString, null, 'Json');
$client->runTasks();

echo "Job finished\n";

$endtime = time();
print "Completed in " . ($endtime - $time) . ' seconds' . "\n";

function complete($task)
{
    print "Unique : " . $task->unique() . "\n";
    print "Data : " . $task->data() . "\n";
}

对于要发送的json数据,我使用了大约30Mb大小(总负载)的allSets.json文件 http://mtgjson.com/,作业在1秒内完成,在尝试了大约200Mb的文件后,它花了4秒。


答案 2

推荐