python爬虫 - 最近在用python分布式爬虫,使用的是scrapy框架,采用主从模式?

 会展小控 发布于 2022-10-30 20:05

Master和sleeve之间需要协作通信,而实现协作通信需要用到jsonRPC,在网上看了一些这方面的内容,
一、需要安装jsonrpc-scrapy
二、在程序中导入相应的包
三、协作通信主要是通过http来实现
现在有一个master,多个sleeve,master相当于服务器,而sleeve相当于爬虫的节点,来实现具体的爬虫任务。
分布式实现涉及任务的调度,以及任务的分配,但整体还是不太清楚协作通信是如何实现的

1 个回答
  • 最近也在学习这个,但是还没有做到分布式。

    google搜索了一下,恰巧也用到了redis,之前面试的时候也被问到这个问题。

    参考这两个博文,希望对你有帮助,感觉第一个那个可参考性更强一些。

    使用scrapy,redis,mongodb实现的一个分布式网络爬虫

    如何入门 Python 爬虫?

    2022-11-12 01:49 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有