热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

scrapyd部署

1. pip install scrapyd    验证是否安装成功:    cmd: scrapyd    浏览器: 127.0.0.1:6800    部

1. pip install scrapyd

    验证是否安装成功:

    cmd: scrapyd

    浏览器: 127.0.0.1:6800

    部署爬虫时cmd要一直执行着scrapyd,否则会导致浏览器无法访问和部署时网络拒绝

2. pip install scrapyd-client

    2.1. python\Scripts\   目录下新建scrapyd-deploy.bat文件,内容如下:

    @echo off
    F:\python\python.exe F:\python\Scripts\scrapyd-deploy %*

    验证是否安装成功:

    进入爬虫项目带scrapy.cfg文件的目录,cmd执行scrapyd-deploy,出现:

    Unknown target: default   即代表成功

3. 打开scrapy.cfg,url行解除注释,并设置部署名称:

    [deploy:lagou]
    url = http://localhost:6800/
    project = lagou_spider

    验证是否成功:

    目录下执行:scrapyd-deploy -l ,可以看到设置的名称

4 .把scrapy项目打包上传部署到scrapyd服务端:

    命令: scrapyd-deploy 部署名称 -p 项目名称

    scrapyd-deploy lagou -p lagou_spider   提示如下代表成功,如网络拒绝访问,是没开scrapyd,cmd执行即可

Packing version 1538714880
Deploying to project "lagou_spider" in http://localhost:6800/addversion.json
Server response (200):
{"node_name": "DESKTOP-KT5UTV0", "status": "ok", "project": "lagou_spider", "version": "1538714880", "spiders": 1}

5 .安装curl,开始爬取:

    5.1 https://curl.haxx.se/download.html 下载最新的即可

    5.2 下载后解压到一个目录中

    5.3 把该目录添加到环境变量path中

    验证是否成功:

    cmd中执行: curl --help

6. curl命令:

    开始爬取:curl http://localhost:6800/schedule.json -d project=项目名称 -d spider=爬虫名称

    curl http://localhost:6800/schedule.json -d project=lagou_spider -d spider=lagou     提示如下代表成功:

{"node_name": "DESKTOP-KT5UTV0", "status": "ok","jobid":"dcb0a8ccc85411e891fd201a06947bdb"}

    停止爬取:

    curl http://localhost:6800/cancel.json -d project=项目名称 -d job=jobid

    删除爬虫:

    curl http://localhost:6800/delproject.json-d project=项目名称

    scrapyd中有多少项目:

    curl http://localhost:6800/listprojects.json

    显示指定scrapy项目中有多少爬虫:

    curl http://localhost:6800/listspiders.json?project=项目名称


推荐阅读
  • Sftp和scp总览让我们把注意力集中到sftp和scp上。第一个(sftp安全文件传输)是一个类ftp的客户端程序,它能够被用来在网络中 ... [详细]
  • 利用python怎么对抖音视频进行爬取
    本篇文章为大家展示了利用python怎么对抖音视频进行爬取,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收 ... [详细]
  • Nginx常用屏蔽规则,让你的网站更安全
    http:www.cjzzc.comarticle635.htmlNginx(引擎x)是一个高性能的HTTP和反向代理服务,目前很大一部分网站均使用了Nginx作为WEB服务器,N ... [详细]
  • 众所周知,HTTP(超文本传输协议)是一个客户端(用户)和服务端(网站)之间请求和应答的标准,通常使用TCP协议。,由李博士于1989发明,通过使用网页浏览器、网络爬虫或者其它的工 ... [详细]
  • MySQL用户管理、 常用sql语句、MySQL数据库备份恢复
    为什么80%的码农都做不了架构师?MySQL用户管理▲MySQL创建一个普通用户并授权说明默认有一个root是超级管理员,不可能是所有的开发人员或 ... [详细]
  • 当我运行npmrunbuild:ssr命令时,它会成功返回应用程序URL。请参见下文 ... [详细]
  • 想玩爬虫?你需要知道一些简单的知识(一)(http)
    一、http基本原理: URI:统一资源标识符URL:统一资源定位符简单来说就是网址,https:www.douban.co ... [详细]
  • 不太理解nestat统计的的结果中关于localaddress和foreignaddress部分用127.0.0.10.0.0.0::-bash-3.2$netstat-tl&#x ... [详细]
  • 上传IEnumeratorUpLoadTexture(byte[]bytes){WWWFormformnewWWWForm();stringidPhoto_DateTime.N ... [详细]
  • HAproxy七层负载均衡——环境搭建及实现过程详解
    实验环境 主机名IP服务虚拟机server1172.25.6.1haproxy,httpd,服务端虚拟机server2172.25.6.2httpd,phpÿ ... [详细]
  • Spring通过<import>标签导入外部配置文件
    之前文章里我们讲到Spring加载Xml配置文件的细节,那么加载完了我们肯定要解析这个配置文件中定义的元素。这篇我们首先来分析下Spring是如何通过标签 ... [详细]
  • php折腾记(php笔记)
    php折腾记(php笔记) ... [详细]
  • 关于css选择器选择具体某一元素的疑问【HTML】
    web前端|html教程【求教】关于css选择器选择具体某一元素的疑问web前端-html教程有一段页面布局如下:单页面商城源码,vscode中汉字乱码,ubuntu网页无声,to ... [详细]
  • SpringBoot整合Mybatisplus案例及用法实例_java
    mybatis-plus是一个 Mybatis 的增强工具,在 Mybatis 的基础上只做增强不做改变,为简化开发、提高效率而生,下面这篇文章主要给大家介绍了关于SpringBo ... [详细]
  • Scrapy库
    一、Scrapy爬虫框架1、‘5+2’结构:5个模块+2个中间键5个模块1)Spider【用户配置】:框架入口,获取初始爬取请求提供要爬取的url链接,同时解析页面上的内容解析Do ... [详细]
author-avatar
贾章鱼_977
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有