Swoole中使用task进程异步的处理耗时任务
我们知道,swoole中有两大进程,分别是 master 主进程和 manager 管理进程。
其中 master 主进程中会有一个主 reactor 线程和多个 reactor 线程,主要的作用就是用来维护TCP连接,处理网络IO,收发数据。
而 manager 管理进程,作用则是 fork 和管理 worker 和 task 进程。
worker 进程的作用是接收 reactor 线程传递的数据,并处理数据,返回处理结果给 reactor 线程。
task 进程的作用是处理一些相对耗时的任务,task 与 worker 进程是独立的,不会影响 worker 进程处理客户端的请求。
一、task 进程的应用场景:
1、相对耗时的邮件群发,比如某某活动,需要给100W用户发送活动邮件。
2、推送某些大V的动态,比如某大V发了条新消息,粉丝需要及时获取到该动态。
二、worker 与 task 的相互关系:
1、worker 进程中能过调用 task() 来投递任务,task 进程中 通过 onTask 事件来响应投递来的任务。
2、task 进程中 通过 直接返回 或 调用 finish() 来告诉 worker 进程任务处理完毕,worker 进程中 通过 onFinish 事件响应任务完成。
三、使用 task 的前题:
1、在 Server 中 配置 task_worker_num 数量。
2、设置 Server 的 onTask 和 onFinish 事件回调函数。
四、简单的使用task进行累加和的计算例子
<?php
$server = new swoole_server('0.0.0.0', 6666);
$server->set([
'worker_num' => 2,
'task_worker_num' => 16,
]);
$server->on('WorkerStart', function ($server, $worker_id) {
//注意这里,我们通过taskworker来判断是task进程还是worker进程
//需要在worker进程中调用task(),不然会报出警告
//这里会执行两遍,因为我们设置了worker_num数为2
if (!$server->taskworker) {
echo '投递任务开始...', PHP_EOL;
//投递32个累加计算任务给16个task进程
for ($ix = 0; $ix < 32; $ix++) {
//注意这里的投递是异步的
$server->task([mt_rand(1, 100), mt_rand(1000, 9999)]);
}
echo '投递任务结束...', PHP_EOL;
}
});
//server服务必须要有onReceive回调
$server->on('Receive', function ($server, $fd, $reactor_id, $data) {
});
//注意,task进程完全是同步阻塞模式的
$server->on('Task', function ($server, $task_id, $src_worker_id, $data) {
echo "task {$task_id} 进程正在工作...", PHP_EOL;
$start = $data[0];
$end = $data[1];
$total = 0;
for (; $start <= $end; $start++) {
$total += $start;
}
echo "task {$task_id} 进程完成工作...", PHP_EOL;
return $total;
});
$server->on('Finish', function ($server, $task_id, $data) {
echo "task {$task_id} 进程处理完成, 结果为 {$data}", PHP_EOL;
});
$server->start();
注意,我们通过调用 task() 往任务池中投递任务,swoole 底层会轮询的投递任务到各个 task 进程。
当你投递任务的数量超过 onTask 的处理速度,这会导致任务池被塞满,进而导致 worker 进程发生阻塞,所以需合理设置 task_worker_num 数量和处理速度之间的关系。
当然,我们也可以人为的把任务投递到指定的 task 进程。task() 函数的第二个参数可以指定要投递的 task 进程ID,ID范围为 0 到 (task_worker_num - 1)。
五、对任务进行切分,人为控制投递到 task 进程
<?php
$server = new swoole_server('0.0.0.0', 6666);
$server->set([
'worker_num' => 1,
'task_worker_num' => 10,
]);
$server->on('WorkerStart', function ($server, $worker_id) {
//为了方便演示,把worker_num设置为1,这里只会执行一次
if (!$server->taskworker) {
//通过swoole_table共享内存,在不同进程中共享数据
$server->result = new swoole_table(10240);
//用于保存task进程完成数量
$server->result->column('finish_nums', swoole_table::TYPE_INT);
//用于保存最终计算结果
$server->result->column('result', swoole_table::TYPE_INT);
$server->result->create();
//计算1000的累加和,并把计算任务分配到10个task进程上
$num = 1000;
$step = $num / $server->setting['task_worker_num'];
for ($ix = 0; $ix < $server->setting['task_worker_num']; $ix++) {
$start = $ix * $step;
$server->task([$start, $start + $step], $ix);
}
}
});
$server->on('Receive', function ($server, $fd, $reactor_id, $data) {
});
//注意,task进程完全是同步阻塞模式的
$server->on('Task', function ($server, $task_id, $src_worker_id, $data) {
echo "task {$task_id} 进程正在工作... 计算 {$data[0]} - {$data[1]} ", PHP_EOL;
$start = ++$data[0];
$end = $data[1];
$total = 0;
for (; $start <= $end; $start++) {
$total += $start;
}
echo "task {$task_id} 进程完成工作...", PHP_EOL;
return $total;
});
$server->on('Finish', function ($server, $task_id, $data) {
echo "task {$task_id} 进程处理完成, 结果为 {$data}", PHP_EOL;
$server->result->incr('finish_nums', 'finish_nums');
$server->result->set('result', ['result' => $data + $server->result->get('result', 'result')]);
if ($server->result->get('finish_nums', 'finish_nums') == $server->setting['task_worker_num']) {
echo "最终计算结果:{$server->result->get('result', 'result')}", PHP_EOL;
}
});
$server->start();
0 条评论