热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

运维学python之爬虫中级篇(四)网络编程

网络编程,对所有开发语言来说都是一样的,python也不例外。使用python进行网络编程时,其实是在python程序本身的进程内

网络编程,对所有开发语言来说都是一样的,python也不例外。使用python进行网络编程时,其实是在python程序本身的进程内,连接到指定服务器进程通信端口进行通信,所以网络通信也可以称作进程间通信。

1 socket

提到网络编程,我们就不得不提socket(套接字),打开一个socket需要知道目标ip和端口,再指定协议类型即可,应用程序通常通过"套接字"向网络发出请求或者应答网络请求,使主机间或者一台计算机上的进程间可以通讯。python提供了两个socket模块:

  • 低级别的网络服务支持基本的 Socket,它提供了标准的 BSD Sockets API,可以访问底层操作系统Socket接口的全部方法。
  • 高级别的网络服务模块 SocketServer, 它提供了服务器中心类,可以简化网络服务器的开发。

1.1 socket类型

创建socket格式:socket([family[, type[, proto]]])

  • family: 套接字家族可以使AF_UNIX或者AF_INET
  • type: 套接字类型可以根据是面向连接的还是非连接分为SOCK_STREAM或SOCK_DGRAM
  • protocol: 一般不填默认为0.
Socket类型说明
socket.AF_UNIX只能够用于单一的Unix系统进程间通信
socket.AF_INET服务器之间网络通信指定使用IPv4协议
socket.AF_INET6服务器之间网络通信指定使用IPv6协议
socket.SOCK_STAEAM流式socket,用于TCP
socket.SOCK_DGRAM数据报式socket,用于UDP
socket.SOCK_RAW原始套接字,普通的套接字无法处理ICMP\IGMP等网络报文,而此套接字可以,其次,此套接字也可以处理特殊的ipv4报文,此外,利用原始套接字,可以通过IP_HDRINCL套接字选项,由用户构造ip头。
socket.SOCK_SEQPACKET可靠的连续数据包服务
创建TCP sockets = socket.socket(socket.AF_INET, socket.SOCK_STAEAM)
创建UDP sockets = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

1.2 socket对象内建方法

运维学python之爬虫中级篇(四)网络编程
图片来源

2 编程流程

2.1 TCP编程

网络编程包括服务端和客户端两部分,主动发起连接的是客户端,被动响应的叫服务端。
TCP服务端创建和运行步骤如下:

  • 创建socket,绑定本地ip和端口;
  • 开始监听;
  • 不断接收客户端请求;
  • 接收数据后,发送给对方数据;
  • 传输完毕,关闭socket

# -*- coding: utf-8 -*-import time
import socket
import threadingdef dealtcp(sock, addr):"""接收传来的数据,并发送给对方数据"""print('Accept new connection from %s:%s' % addr)# 发送数据sock.send(b'Hello, I am server')# 循环接收数据while True:# 每次接收1024字节data = sock.recv(1024)# 等待1stime.sleep(1)# 如果data为空或客户端发送过来exit循环中断if not data or data.decode('utf-8') == 'exit':breakprint('客户端发来的数据:%s' % data.decode('utf-8'))sock.send(('Hello, %s!' % data.decode('utf-8')).encode('utf-8'))# 关闭socketsock.close()print('Connection from %s:%s closed.' % addr)if __name__ == '__main__':# 创建一个基于IPv4和TCP协议的Socket:s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 绑定本地ip和端口s.bind(('127.0.0.1', 8000))# 监听端口,传入的参数表示等待连接的最大连接数s.listen(10)print('Waiting for connection...')# 等待连接while True:# accept等待连接进入,返回新的socket和ip:端口sock, addr = s.accept()# 创建线程执行t = threading.Thread(target=dealtcp, args=(sock, addr))# 启动线程t.start()

TCP客户端创建和运行步骤如下:

  • 创建socket
  • 连接服务端接收发送数据
  • 传输完毕,关闭socket

# -*- coding: utf-8 -*-
import socket# 创建基于tcp和ipv4协议的socket
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 与服务端建立连接
s.connect(('127.0.0.1', 8000))
print('接收到的服务端数据:%s' % s.recv(1024).decode('utf-8'))
# 分别发送三个数据
for data in [b'client1', b'client2', b'client3']:s.send(data)print('服务端又返回来的数据:%s ' % s.recv(1024).decode('utf-8'))
s.send(b'exit')
# 关闭socket
s.close()

运行结果如下:
服务端

Waiting for connection...
Accept new connection from 127.0.0.1:61544
客户端发来的数据:client1
客户端发来的数据:client2
客户端发来的数据:client3
Connection from 127.0.0.1:61544 closed.

客户端

接收到的服务端数据:Hello, I am server
服务端又返回来的数据:Hello, client1!
服务端又返回来的数据:Hello, client2!
服务端又返回来的数据:Hello, client3!

2.2 UDP编程

TCP通讯是可靠连接的过程,而UDP则是面向无连接的协议,不需要建立连接,只需要知道对方ip和端口,就直接发送数据,也不关心是否到达,也正是如此,UDP速度比TCP快。使用UDP也有客户端和服务端。
服务端创建和运行:

  • 创建socket,绑定ip和端口
  • 直接发送和接收数据
  • 关闭socket

# -*- coding: utf-8 -*-import socket# 创建基于ipv4和UDP协议的socket
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 绑定IP和端口
s.bind(('127.0.0.1', 9000))
print('Bind udp on 9000...')
while True:# recvfrom为接收UDP数据,接收到数据和客户端ip:端口data, addr = s.recvfrom(1024)print('Received from %s:%s' % addr)# sendto发送UDP数据,注意sendto发送格式为将数据发送到套接字,address是形式为(ipaddr,port)的元组s.sendto(b'Hello, %s' % data, addr)

客户端:

# -*- coding: utf-8 -*-import socket
# 创建基于ipv4和UDP协议的socket
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 直接发送和接收数据
for data in [b'client1', b'client2']:s.sendto(data, ('127.0.0.1', 9000))print('Received %s' % s.recv(1024).decode('utf-8'))
s.close()

返回结果
服务端:

Bind udp on 9000...
Received from 127.0.0.1:65008
Received from 127.0.0.1:65008

客户端:

Received Hello, client1
Received Hello, client2

转:https://blog.51cto.com/linuxliu/2058544



推荐阅读
  • UML 包图
    什么是包包可直接理解为命名空间,文件夹,是用来组织图形的封装,包图可以用来表述功能组命名空间的组织层次。•在面向对象软件开发的视角中&#x ... [详细]
  • python图书管理系统类_Python标准库socketserver使用线程混入实现异步TCP服务器
    推荐图书:《Python程序设计开发宝典》,ISBN:978-7-302-47210-0,董付国,清华大学出版 ... [详细]
  • SpringBoot使用Netty实现远程调用的示例
    这篇文章主要介绍了SpringBoot使用Netty实现远程调用的示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着 ... [详细]
  • 本文介绍了解决Netty拆包粘包问题的一种方法——使用特殊结束符。在通讯过程中,客户端和服务器协商定义一个特殊的分隔符号,只要没有发送分隔符号,就代表一条数据没有结束。文章还提供了服务端的示例代码。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • Python瓦片图下载、合并、绘图、标记的代码示例
    本文提供了Python瓦片图下载、合并、绘图、标记的代码示例,包括下载代码、多线程下载、图像处理等功能。通过参考geoserver,使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法,供读者参考使用。 ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • 本文介绍了在mac环境下使用nginx配置nodejs代理服务器的步骤,包括安装nginx、创建目录和文件、配置代理的域名和日志记录等。 ... [详细]
  • 本文介绍了Python爬虫技术基础篇面向对象高级编程(中)中的多重继承概念。通过继承,子类可以扩展父类的功能。文章以动物类层次的设计为例,讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例,以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 第七课主要内容:多进程多线程FIFO,LIFO,优先队列线程局部变量进程与线程的选择线程池异步IO概念及twisted案例股票数据抓取 ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
author-avatar
DYongLi
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有