热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

面试官的swoole协程三连问

swoole4由于是单线程多进程的,同一时间同一个进程只


什么是进程?


进程就是应用程序的启动实例。独立的文件资源,数据资源,内存空间。



什么是线程?


线程属于进程,是程序的执行者。一个进程至少包含一个主线程,也可以有更多的子线程。线程有两种调度策略,一是:分时调度,二是:抢占式调度。



什么是协程?


协程是轻量级线程,协程也是属于线程,协程是在线程里执行的。协程的调度是用户手动切换的,所以又叫用户空间线程。协程的创建、切换、挂起、销毁全部为内存操作,消耗是非常低的。协程的调度策略是:协作式调度。



swoole 协程的原理





  • swoole4 由于是单线程多进程的,同一时间同一个进程只会有一个协程在运行。





  • Swoole server 接收数据在 worker 进程触发 onReceive 回调,产生一个携程。Swoole 为每个请求创建对应携程。协程中也能创建子协程。





  • 协程在底层实现上是单线程的,因此同一时间只有一个协程在工作,协程的执行是串行的。





  • 因此多任务多协程执行时,一个协程正在运行时,其他协程会停止工作。当前协程执行阻塞 IO 操作时会挂起,底层调度器会进入事件循环。当有 IO 完成事件时,底层调度器恢复事件对应的协程的执行。。所以协程不存在 IO 耗时,非常适合高并发 IO 场景。(如下图)









在这里插入图片描述




Swoole 的协程执行流程





  • 协程没有 IO 等待 正常执行 PHP 代码,不会产生执行流程切换





  • 协程遇到 IO 等待 立即将控制权切,待 IO 完成后,重新将执行流切回原来协程切出的点





  • 协程并行协程依次执行,同上一个逻辑





  • 协程嵌套执行流程由外向内逐层进入,直到发生 IO,然后切到外层协程,父协程不会等待子协程结束





协程的执行顺序


先来看看基础的例子:



go(function () { echo "hello go1 \n"; }); echo "hello main \n"; go(function () { echo "hello go2 \n"; });


go()是\Co::create()的缩写, 用来创建一个协程, 接受 callback 作为参数, callback 中的代码, 会在这个新建的协程中执行.


备注:\Swoole\Coroutine可以简写为\Co


上面的代码执行结果:



root@b98940b00a9b /v/w/c/p/swoole# php co.php hello go1
hello main
hello go2


执行结果和我们平时写代码的顺序, 好像没啥区别. 实际执行过程:





  • 运行此段代码, 系统启动一个新进程





  • 遇到go(), 当前进程中生成一个协程, 协程中输出heelo go1, 协程退出





  • 进程继续向下执行代码, 输出hello main





  • 再生成一个协程, 协程中输出heelo go2, 协程退出




运行此段代码, 系统启动一个新进程. 如果不理解这句话, 你可以使用如下代码:



// co.php sleep(100);


执行并使用ps aux查看系统中的进程:



root@b98940b00a9b /v/w/c/p/swoole# php co.php &
root@b98940b00a9b /v/w/c/p/swoole# ps aux PID USER TIME COMMAND 1 root 0:00 php -a 10 root 0:00 sh 19 root 0:01 fish 749 root 0:00 php co.php 760 root 0:00 ps aux


我们来稍微改一改, 体验协程的调度:



use Co; go(function () { Co::sleep(1); // 只新增了一行代码 echo "hello go1 \n"; }); echo "hello main \n"; go(function () { echo "hello go2 \n"; });


\Co::sleep()函数功能和sleep()差不多, 但是它模拟的是 IO等待(IO后面会细讲). 执行的结果如下:



root@b98940b00a9b /v/w/c/p/swoole# php co.php hello main
hello go2
hello go1


怎么不是顺序执行的呢? 实际执行过程:




  • 运行此段代码, 系统启动一个新进程


  • 遇到go(), 当前进程中生成一个协程


  • 协程中遇到 IO阻塞 (这里是Co::sleep()模拟出的 IO等待), 协程让出控制, 进入协程调度队列


  • 进程继续向下执行, 输出hello main


  • 执行下一个协程, 输出hello go2


  • 之前的协程准备就绪, 继续执行, 输出hello go1


到这里, 已经可以看到 swoole 中 协程与进程的关系, 以及 协程的调度, 我们再改一改刚才的程序:



go(function () { Co::sleep(1); echo "hello go1 \n"; }); echo "hello main \n"; go(function () { Co::sleep(1); echo "hello go2 \n"; });


我想你已经知道输出是什么样子了:



root@b98940b00a9b /v/w/c/p/swoole# php co.php hello main
hello go1
hello go2



协程快在哪? 减少IO阻塞导致的性能损失


大家可能听到使用协程的最多的理由, 可能就是 协程快. 那看起来和平时写得差不多的代码, 为什么就要快一些呢? 一个常见的理由是, 可以创建很多个协程来执行任务, 所以快. 这种说法是对的, 不过还停留在表面.


首先, 一般的计算机任务分为 2 种:




  • CPU密集型, 比如加减乘除等科学计算




  • IO 密集型, 比如网络请求, 文件读写等


其次, 高性能相关的 2 个概念:




  • 并行: 同一个时刻, 同一个 CPU 只能执行同一个任务, 要同时执行多个任务, 就需要有多个 CPU 才行




  • 并发: 由于 CPU 切换任务非常快, 快到人类可以感知的极限, 就会有很多任务 同时执行 的错觉


了解了这些, 我们再来看协程, 协程适合的是 IO 密集型 应用, 因为协程在 IO阻塞 时会自动调度, 减少IO阻塞导致的时间损失.


我们可以对比下面三段代码:




  • 普通版: 执行 4 个任务



$n = 4; for ($i = 0; $i < $n; $i++) { sleep(1); echo microtime(true) . ": hello $i \n"; }; echo "hello main \n";



root@b98940b00a9b /v/w/c/p/swoole# time php co.php 1528965075.4608: hello 0 1528965076.461: hello 1 1528965077.4613: hello 2 1528965078.4616: hello 3 hello main
real 0m 4.02s
user 0m 0.01s
sys 0m 0.00s




  • 单个协程版:



$n = 4; go(function () use ($n) { for ($i = 0; $i < $n; $i++) { Co::sleep(1); echo microtime(true) . ": hello $i \n"; }; }); echo "hello main \n";



root@b98940b00a9b /v/w/c/p/swoole# time php co.php hello main 1528965150.4834: hello 0 1528965151.4846: hello 1 1528965152.4859: hello 2 1528965153.4872: hello 3 real 0m 4.03s
user 0m 0.00s
sys 0m 0.02s




  • 多协程版: 见证奇迹的时刻



$n = 4; for ($i = 0; $i < $n; $i++) { go(function () use ($i) { Co::sleep(1); echo microtime(true) . ": hello $i \n"; }); }; echo "hello main \n";



root@b98940b00a9b /v/w/c/p/swoole# time php co.php hello main 1528965245.5491: hello 0 1528965245.5498: hello 3 1528965245.5502: hello 2 1528965245.5506: hello 1 real 0m 1.02s
user 0m 0.01s
sys 0m 0.00s


为什么时间有这么大的差异呢:





  • 普通写法, 会遇到 IO阻塞 导致的性能损失





  • 单协程: 尽管 IO阻塞 引发了协程调度, 但当前只有一个协程, 调度之后还是执行当前协程





  • 多协程: 真正发挥出了协程的优势, 遇到 IO阻塞 时发生调度, IO就绪时恢复运行




我们将多协程版稍微修改一下:




  • 多协程版2: CPU密集型



$n = 4; for ($i = 0; $i < $n; $i++) { go(function () use ($i) { // Co::sleep(1); sleep(1); echo microtime(true) . ": hello $i \n"; }); }; echo "hello main \n";



root@b98940b00a9b /v/w/c/p/swoole# time php co.php 1528965743.4327: hello 0 1528965744.4331: hello 1 1528965745.4337: hello 2 1528965746.4342: hello 3 hello main
real 0m 4.02s
user 0m 0.01s
sys 0m 0.00s


只是将Co::sleep()改成了sleep(), 时间又和普通版差不多了. 因为:





  • sleep()可以看做是 CPU密集型任务, 不会引起协程的调度





  • Co::sleep()模拟的是 IO密集型任务, 会引发协程的调度

    这也是为什么, 协程适合 IO密集型 的应用.




再来一组对比的例子: 使用 redis



// 同步版, redis使用时会有 IO 阻塞 $cnt = 2000; for ($i = 0; $i < $cnt; $i++) { $redis = new \Redis(); $redis->connect('redis'); $redis->auth('123'); $key = $redis->get('key'); } // 单协程版: 只有一个协程, 并没有使用到协程调度减少 IO 阻塞 go(function () use ($cnt) { for ($i = 0; $i < $cnt; $i++) { $redis = new Co\Redis(); $redis->connect('redis', 6379); $redis->auth('123'); $redis->get('key'); } }); // 多协程版, 真正使用到协程调度带来的 IO 阻塞时的调度 for ($i = 0; $i < $cnt; $i++) { go(function () { $redis = new Co\Redis(); $redis->connect('redis', 6379); $redis->auth('123'); $redis->get('key'); }); }


性能对比:



# 多协程版 root@0124f915c976 /v/w/c/p/swoole# time php co.php real 0m 0.54s
user 0m 0.04s
sys 0m 0.23s
# 同步版 root@0124f915c976 /v/w/c/p/swoole# time php co.php real 0m 1.48s
user 0m 0.17s
sys 0m 0.57s



swoole 协程和 go 协程对比: 单进程 vs 多线程


接触过 go 协程的 coder, 初始接触 swoole 的协程会有点 懵, 比如对比下面的代码:



package main
import ( "fmt" "time" ) func main() { go func() { fmt.Println("hello go") }() fmt.Println("hello main") time.Sleep(time.Second) }



> 14:11 src $ go run test.go
hello main
hello go


刚写 go 协程的 coder, 在写这个代码的时候会被告知不要忘了time.Sleep(time.Second), 否则看不到输出hello go, 其次,hello go与hello main的顺序也和 swoole 中的协程不一样.


原因就在于 swoole 和 go 中, 实现协程调度的模型不同.


上面 go 代码的执行过程:




  • 运行 go 代码, 系统启动一个新进程


  • 查找package main, 然后执行其中的func mian()


  • 遇到协程, 交给协程调度器执行


  • 继续向下执行, 输出hello main


  • 如果不添加time.Sleep(time.Second), main 函数执行完, 程序结束, 进程退出, 导致调度中的协程也终止


go 中的协程, 使用的 MPG 模型:




  • M 指的是 Machine, 一个M直接关联了一个内核线程


  • P 指的是 processor, 代表了M所需的上下文环境, 也是处理用户级代码逻辑的处理器


  • G 指的是 Goroutine, 其实本质上也是一种轻量级的线程







MPG 模型




MPG 模型


而 swoole 中的协程调度使用 单进程模型, 所有协程都是在当前进程中进行调度, 单进程的好处也很明显 -- 简单 / 不用加锁 / 性能也高.


无论是 go 的 MPG模型, 还是 swoole 的 单进程模型, 都是对 CSP理论 的实现.



推荐阅读
  • 使用C++编写程序实现增加或删除桌面的右键列表项
    本文介绍了使用C++编写程序实现增加或删除桌面的右键列表项的方法。首先通过操作注册表来实现增加或删除右键列表项的目的,然后使用管理注册表的函数来编写程序。文章详细介绍了使用的五种函数:RegCreateKey、RegSetValueEx、RegOpenKeyEx、RegDeleteKey和RegCloseKey,并给出了增加一项的函数写法。通过本文的方法,可以方便地自定义桌面的右键列表项。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • 关键词:Golang, Cookie, 跟踪位置, net/http/cookiejar, package main, golang.org/x/net/publicsuffix, io/ioutil, log, net/http, net/http/cookiejar ... [详细]
  • Go GUIlxn/walk 学习3.菜单栏和工具栏的具体实现
    本文介绍了使用Go语言的GUI库lxn/walk实现菜单栏和工具栏的具体方法,包括消息窗口的产生、文件放置动作响应和提示框的应用。部分代码来自上一篇博客和lxn/walk官方示例。文章提供了学习GUI开发的实际案例和代码示例。 ... [详细]
  • Go Cobra命令行工具入门教程
    本文介绍了Go语言实现的命令行工具Cobra的基本概念、安装方法和入门实践。Cobra被广泛应用于各种项目中,如Kubernetes、Hugo和Github CLI等。通过使用Cobra,我们可以快速创建命令行工具,适用于写测试脚本和各种服务的Admin CLI。文章还通过一个简单的demo演示了Cobra的使用方法。 ... [详细]
  • (三)多表代码生成的实现方法
    本文介绍了一种实现多表代码生成的方法,使用了java代码和org.jeecg框架中的相关类和接口。通过设置主表配置,可以生成父子表的数据模型。 ... [详细]
  • Android系统源码分析Zygote和SystemServer启动过程详解
    本文详细解析了Android系统源码中Zygote和SystemServer的启动过程。首先介绍了系统framework层启动的内容,帮助理解四大组件的启动和管理过程。接着介绍了AMS、PMS等系统服务的作用和调用方式。然后详细分析了Zygote的启动过程,解释了Zygote在Android启动过程中的决定作用。最后通过时序图展示了整个过程。 ... [详细]
  • Java太阳系小游戏分析和源码详解
    本文介绍了一个基于Java的太阳系小游戏的分析和源码详解。通过对面向对象的知识的学习和实践,作者实现了太阳系各行星绕太阳转的效果。文章详细介绍了游戏的设计思路和源码结构,包括工具类、常量、图片加载、面板等。通过这个小游戏的制作,读者可以巩固和应用所学的知识,如类的继承、方法的重载与重写、多态和封装等。 ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • Commit1ced2a7433ea8937a1b260ea65d708f32ca7c95eintroduceda+Clonetraitboundtom ... [详细]
  • 解决.net项目中未注册“microsoft.ACE.oledb.12.0”提供程序的方法
    在开发.net项目中,通过microsoft.ACE.oledb读取excel文件信息时,报错“未在本地计算机上注册“microsoft.ACE.oledb.12.0”提供程序”。本文提供了解决这个问题的方法,包括错误描述和代码示例。通过注册提供程序和修改连接字符串,可以成功读取excel文件信息。 ... [详细]
  • HashMap的相关问题及其底层数据结构和操作流程
    本文介绍了关于HashMap的相关问题,包括其底层数据结构、JDK1.7和JDK1.8的差异、红黑树的使用、扩容和树化的条件、退化为链表的情况、索引的计算方法、hashcode和hash()方法的作用、数组容量的选择、Put方法的流程以及并发问题下的操作。文章还提到了扩容死链和数据错乱的问题,并探讨了key的设计要求。对于对Java面试中的HashMap问题感兴趣的读者,本文将为您提供一些有用的技术和经验。 ... [详细]
  • 本文介绍了pack布局管理器在Perl/Tk中的使用方法及注意事项。通过调用pack()方法,可以控制部件在显示窗口中的位置和大小。同时,本文还提到了在使用pack布局管理器时,应注意将部件分组以便在水平和垂直方向上进行堆放。此外,还介绍了使用Frame部件或Toplevel部件来组织部件在窗口内的方法。最后,本文强调了在使用pack布局管理器时,应避免在中间切换到grid布局管理器,以免造成混乱。 ... [详细]
  • Iamtryingtocreateanarrayofstructinstanceslikethis:我试图创建一个这样的struct实例数组:letinstallers: ... [详细]
  • python3 nmap函数简介及使用方法
    本文介绍了python3 nmap函数的简介及使用方法,python-nmap是一个使用nmap进行端口扫描的python库,它可以生成nmap扫描报告,并帮助系统管理员进行自动化扫描任务和生成报告。同时,它也支持nmap脚本输出。文章详细介绍了python-nmap的几个py文件的功能和用途,包括__init__.py、nmap.py和test.py。__init__.py主要导入基本信息,nmap.py用于调用nmap的功能进行扫描,test.py用于测试是否可以利用nmap的扫描功能。 ... [详细]
author-avatar
灵绾绾
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有