热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PHP的Web運行原理(4)-Reactor的實現之Swoole

本篇文章,咱們將要在說明另一個在php實現reactor模式的東西本篇文章分為以下幾個章節:swoole官網寫到:

本篇文章,咱們將要在說明另一個在 php 實現 reactor 模式的東西 swoole

本篇文章分為以下幾個章節 :

  • Swoole 的架構
  • Swoole 非阻塞 I/O 的處理
  • Swoole 的 Coroutine
  • Swoole 實際使用的注意事項

swoole 的架構

swoole 官網寫到 :

event-driven asynchronous & coroutine-based concurrency networking communication engine with high performance written in C and C++ for PHP.

swoole 它是一個用 c++ 所寫的 php extension,一個非常高效能的通訊引擎,而它能達到高效能的基礎在於以下幾個重點 :

  • event-drivent
  • coroutine

一句話來說他可以幹麻。

它可以讓我們建立一個高效能的網路服務

下面就是它實現非阻塞 I/O 的架構圖。

當它建立一個 http server 以後,你會看到產生出下圖這些 process 與 thread,基本上可以分為幾個部份 :

PHP 的 Web 運行原理 ( 4 ) - Reactor 的實現之 Swoole
  • Master Process : 用來管理 reactor thread,主要就是當 client 發送一個 http 請求後,由它來決定那個 reactor thread 來接客。
  • Reactor Thread : 每個 thead 中都有使用 I/O 多路復用的技術來監聽多個 socket,當有事件(讀或寫資料)進來時,會發送給某個 worker process 來處理。
  • Manager Process : 用來管理 worker process,也是用來決定那個 worker process 來接客。
  • Worker Process : 實際運行 php 代碼的地方,它這裡也有使用 I/O 多路復用技術來監聽 socket。這裡提供同步阻塞或是異步非阻塞操作。
  • Task Process : 一樣 php 代碼運行的地方,它會接受由 worker 丟過來的任務(開發者自已撰寫),通常都是一些 cpu 密集的運算。這裡只能同步阻塞操作。

上面是主要的架構,然後我們來理一下所謂的阻塞 I/O 會在那幾個地方,而 swoole 又是如何解決。

Swoole 非阻塞 I/O 的處理

這裡基本上可以分成兩個地方來看。

高併發建立連線的地方

swoole 這裡是在 reactor thread 實作 reactor 模式來解決,而 reactor 最主要透過的技術為 I/O 多路復用技術來做到大量 socket I/O 監控,並且在將事情丟給 worker process 處理。

順到說一下,與 nodejs 或 reactPHP 相比,swoole 這裡勝在它開啟多個 thread 來監控多條連線,理論上它這樣應該可以承受的比 nodejs 與 reactPHP 更多的併發量。

Worker process 中大量的 db 或 redis 操作

swoole 有提供幾個機制可以給 worker process 實現非阻塞 I/O 操作。

  • reactor 模式 (網路 I/O)
  • 丟 task worker 處理 (網路、檔案 I/O)
  • 底層使用 aio 處理 (檔案 I/O)

reactor 模式 (網路 I/O)

首先第一個 reactor 模式就與 reactor thread 的機制一樣,都是會使用 I/O 多路復用來監聽 socket,當有事件進來時,就執行 handler (callback)。

下面為範例,當在 worker 執行了這段程式碼以後,會將連 redis 的這條 socket 丟到 reactor 來進行監控,當有事件進來時,會執行 callback。

而這就是所謂的 異步非阻塞 。( 異步: callback 非阻塞: 不會卡住 process )

connect('127.0.0.1', 6379, function (swoole_redis $client, $result) {
    // callback function
    if ($result === false) {
        echo "connect to redis server failed.\n";
        return;
    }
    $client->set('key', 'swoole', function (swoole_redis $client, $result) {
        var_dump($result);
    });
});

而所謂的 同步阻塞 的範例如下,假設你在 worker 中直接使用 predis 來操作 redis,那這就是所謂的同步阻塞。

同步就是依順序走,而阻塞就是指會在 $cient->get("foo") 那會卡住整個 process。

set('foo', 'bar');
$value = $client->get('foo');

丟 task worker 處理 (網路、檔案 I/O)

而下面為處理 file 的範例,但這裡要注意,這種處理檔案的方式受限於 task process 的數量,假設我們 task 的數量為二,那當如果開啟三個 task 來處理檔案時,第三個就會無法處理。

set(array(
    'worker_num' => 1,
    'task_worker_num' => 2
));

$server->on('request', function ($request, $response) use ($server) {

    // ----------------------------------------------------
    var_dump('wait...');
    $server->task("hi", 0);
    var_dump('done !...');
    // ----------------------------------------------------

    $response->header("Content-Type", "text/html; charset=utf-8");
    $response->end("

Hello Swoole. #".rand(1000, 9999)."

"); }); $server->on('task', function($server, $task_id, $from_id, $data){ $request = file_get_contents('file 位置'); }); $server->on('Finish', function (swoole_server $serv, $task_id, $data) { echo "Task#$task_id finished, data_len=".strlen($data).PHP_EOL; }); $server->start();

底層使用 aio 處理 (檔案 I/O)

這裡注意要將 runtime 的 coroutine 開啟,才能讓 file_get_contents 使用底層 aio 來完成同步非阻塞操作。

 
 

Q&A 為什麼 Reactor 的機制無法處理 filesystem 的東西呢 ?

目前筆者只知道,如果你將檔案的 file descriptor 註冊到 I/O 多路復用(epoll) 中,會發生以下的錯誤:

EPERM The target file fd does not support epoll.

這也是為什麼需要使用其它 process 來處理,而在 nodejs 中碰到這種檔案類型的操作,則是開啟 thread 來進行處理,詳細可看此篇文章。

Nodejs 之運行機制原理 - 馬克筆

Swoole 中的 Coroutine

swoole 中有提供一個 coroutine 的功能,那它是做什麼呢 ?

它可以讓 worker 做到同步非阻塞的操作

剛剛上面有說 worker 可以提供以下兩種 I/O 操作型式 :

  • 同步阻塞 ( 同步:程式碼順序走 阻塞: 會卡住整個 process )
  • 異步非阻塞 ( 異步: callback 機制 非阻塞: 不會卡住整個 process )

但實際上它還有提供第三種 :

  • 同步非阻塞 ( 同步: 程式碼順序走 非阻塞: 不會卡住整個 process )

而實現的方法就是使用 coroutine 也就是協程。

coroutine 使用範例

使用情景如下程式碼,那在 go 裡面的這段程式碼就會開一個被稱為 coroutine 協程的東西來處理這一段,這樣就可以做到 同步非阻塞 操作。

go(function () {
    $redis = new Swoole\Coroutine\Redis();
    $redis->connect('127.0.0.1', 6379);
    $val = $redis->get('key');
});

而如果沒有用 coroutine 的話,那就只能做到 異步非阻塞操作 ,如下程式碼,也就是一堆 callback。

$client = new swoole_redis;
$client->connect('127.0.0.1', 6379, function (swoole_redis $client, $result) {
    $client->GET('key', 'swoole', function (swoole_redis $client, $result) {
        var_dump($result);
    });
});

Q&A - Coroutine 是實現非阻塞 I/O 的技術嗎 ?

不是。

coroutine 很多人會說它是一個比 thread 還較更小單位的操作單位,所以就會想,那我每一個阻塞 I/O 就開一個協程來處理,那這樣不就可以實現非阻塞 I/O 操作了嗎 ? 就像 multi thread 原理一樣,而且我協程更省資源。

NoNoNo ~

process 為操作系統的最小資源管理單位,而 thread 為操作系統最小操作單位。

而 coroutine 是一個比 thread 更小的操作單位,但是它的操作是 用戶 (application) 所操作,而不是像 thread 一樣是操作系統所操作。

而 I/O 的操作是指操作系統的操作,當一個阻塞 I/O 執行時,讓 process 阻塞的是操作系統,所以如果你在一個協程內開啟一個阻塞 I/O 它仍然會卡住整個 process。

coroutine 嚴格來說只能幫你做到 同步非阻塞 ,非阻塞還是需要有 reactor 機制來實現。

備註: go 語言的 coroutine 就比較特殊了,這之後會另開篇章討論。

Swoole 的實際使用注意

與 reactPHP 的範例一樣,我們一樣使用 swoole 來建立一個 http server。

set(array(
    'worker_num' => 1,
    'task_worker_num' => 0
));

$server->on('request', function ($request, $response) {

    // ----------------------------------------------------
    var_dump('wait...');
    $request = file_get_contents('http://127.0.0.1:3000');
    var_dump('done !...');
    // ----------------------------------------------------

    $response->header("Content-Type", "text/html; charset=utf-8");
    $response->end("

Hello Swoole. #".rand(1000, 9999)."

"); }); $server->on('task', function($server, $task_id, $from_id, $data){ }); $server->start();

如果這時發兩條 http 請求會如何呢 ?

答案: 1 次 wait ( 因為第一次就卡住 process )

主要的原因基本上在於,你沒將這 I/O 操作丟到這個 worker 的 reactor 機制中,所以這個 I/O 操作仍然會是阻塞的。

然後有些人在測試時可能會收到二次 wait,但是有一點你要注意,那就是 worker_num 你設多少,如果你設 2 ,它當然可以收到二次,因為是由不同的 process 接受,但是接下來的第三次,你絕對收不到。

正確版

首先第一種是官方現在推薦使用 coroutine 的 同步非阻塞 的寫法。

set(array(
    'worker_num' => 2,
    'task_worker_num' => 0
));

$server->on('request', function ($request, $response) {

    // ----------------------------------------------------
    var_dump('wait...');
    $client = new Swoole\Coroutine\Http\Client('127.0.0.1', 3000);
    $client->get('/');
    echo $client->body;
    var_dump('done !...');
    // ----------------------------------------------------
});

$server->start();

而另一種就是使用 callback 的 異步非阻塞 的寫法。

set(array(
    'worker_num' => 2,
    'task_worker_num' => 0
));

$server->on('request', function ($request, $response) {

    // ----------------------------------------------------
    var_dump('wait...');
    $client = new swoole_http_client('127.0.0.1', 3000);
    $client->get('/', function ($client) {
        echo "Length: " . strlen($client->body) . "\n";
        echo $client->body;
    });
    var_dump('done !...');
    // ----------------------------------------------------
});

$server->start();

參考資料


以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持 我们


推荐阅读
  • 本文介绍了如何使用PHP向系统日历中添加事件的方法,通过使用PHP技术可以实现自动添加事件的功能,从而实现全局通知系统和迅速记录工具的自动化。同时还提到了系统exchange自带的日历具有同步感的特点,以及使用web技术实现自动添加事件的优势。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • 知识图谱——机器大脑中的知识库
    本文介绍了知识图谱在机器大脑中的应用,以及搜索引擎在知识图谱方面的发展。以谷歌知识图谱为例,说明了知识图谱的智能化特点。通过搜索引擎用户可以获取更加智能化的答案,如搜索关键词"Marie Curie",会得到居里夫人的详细信息以及与之相关的历史人物。知识图谱的出现引起了搜索引擎行业的变革,不仅美国的微软必应,中国的百度、搜狗等搜索引擎公司也纷纷推出了自己的知识图谱。 ... [详细]
  • http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的,最大不能超过XX ... [详细]
  • 本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例,讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快,性能和稳定性也不错,适合初学者学习和使用。 ... [详细]
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • 关键词:Golang, Cookie, 跟踪位置, net/http/cookiejar, package main, golang.org/x/net/publicsuffix, io/ioutil, log, net/http, net/http/cookiejar ... [详细]
  • CEPH LIO iSCSI Gateway及其使用参考文档
    本文介绍了CEPH LIO iSCSI Gateway以及使用该网关的参考文档,包括Ceph Block Device、CEPH ISCSI GATEWAY、USING AN ISCSI GATEWAY等。同时提供了多个参考链接,详细介绍了CEPH LIO iSCSI Gateway的配置和使用方法。 ... [详细]
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
  • Webmin远程命令执行漏洞复现及防护方法
    本文介绍了Webmin远程命令执行漏洞CVE-2019-15107的漏洞详情和复现方法,同时提供了防护方法。漏洞存在于Webmin的找回密码页面中,攻击者无需权限即可注入命令并执行任意系统命令。文章还提供了相关参考链接和搭建靶场的步骤。此外,还指出了参考链接中的数据包不准确的问题,并解释了漏洞触发的条件。最后,给出了防护方法以避免受到该漏洞的攻击。 ... [详细]
  • 在重复造轮子的情况下用ProxyServlet反向代理来减少工作量
    像不少公司内部不同团队都会自己研发自己工具产品,当各个产品逐渐成熟,到达了一定的发展瓶颈,同时每个产品都有着自己的入口,用户 ... [详细]
  • Windows7 64位系统安装PLSQL Developer的步骤和注意事项
    本文介绍了在Windows7 64位系统上安装PLSQL Developer的步骤和注意事项。首先下载并安装PLSQL Developer,注意不要安装在默认目录下。然后下载Windows 32位的oracle instant client,并解压到指定路径。最后,按照自己的喜好对解压后的文件进行命名和压缩。 ... [详细]
  • 解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法
    本文介绍了解决nginx启动报错epoll_wait() reported that client prematurely closed connection的方法,包括检查location配置是否正确、pass_proxy是否需要加“/”等。同时,还介绍了修改nginx的error.log日志级别为debug,以便查看详细日志信息。 ... [详细]
author-avatar
卟105932097
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有