day26学习总结与作业

作者：梦魇心芽_932 | 来源：互联网 | 2023-10-12 13:07

day学习总结与作业importcsvimportrequestsfrombs4importBeautifulSoupimportreheaders{user-agent:

day学习总结与作业

import csvimport requests from bs4 import BeautifulSoup import re headers &＃61; {&＃39;user-agent&＃39;: &＃39;Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36&＃39; } url &＃61; &＃39;https://mapi.guazi.com/car-source/carList/pcList?minor&＃61;benz&sourceType&＃61;&ec_buy_car_list_ab&＃61;&location_city&＃61;&district_id&＃61;&tag&＃61;-1&license_date&＃61;&auto_type&＃61;&driving_type&＃61;&gearbox&＃61;&road_haul&＃61;&air_displacement&＃61;&emission&＃61;&car_color&＃61;&guobie&＃61;&bright_spot_config&＃61;&seat&＃61;&fuel_type&＃61;&order&＃61;&priceRange&＃61;0,-1&tag_types&＃61;&diff_city&＃61;&intention_options&＃61;&initialPriceRange&＃61;&monthlyPriceRange&＃61;&transfer_num&＃61;&car_year&＃61;&carid_qigangshu&＃61;&carid_jinqixingshi&＃61;&cheliangjibie&＃61;&page&＃61;1&pageSize&＃61;20&city_filter&＃61;12&city&＃61;12&guazi_city&＃61;12&qpres&＃61;&versionId&＃61;0.0.0.0&osv&＃61;Unknown&platfromSource&＃61;wap&＃39; response &＃61; requests.get(url, headers&＃61;headers) result0&＃61;response.json()[&＃39;data&＃39;][&＃39;postList&＃39;] red&＃61;[] table &＃61; {&＃39;0xe1d0&＃39;: &＃39;7&＃39;, &＃39;0xe325&＃39;: &＃39;4&＃39;, &＃39;0xe41d&＃39;: &＃39;1&＃39;, &＃39;0xe52e&＃39;: &＃39;9&＃39;, &＃39;0xe630&＃39;: &＃39;2&＃39;, &＃39;0xe76e&＃39;: &＃39;8&＃39;,&＃39;0xe891&＃39;: &＃39;5&＃39;, &＃39;0xe9ce&＃39;: &＃39;0&＃39;, &＃39;0xeaf2&＃39;: &＃39;3&＃39;, &＃39;0xec4c&＃39;: &＃39;6&＃39;, &＃39;0xf88a&＃39;: &＃39;7&＃39; } for x in result0:title&＃61;x[&＃39;title&＃39;]license_date&＃61;x[&＃39;license_date&＃39;]road_haul&＃61;x[&＃39;road_haul&＃39;].split(&＃39;;&＃39;)new_road_haul &＃61; &＃39;&＃39;for g in road_haul:if g.startswith(&＃39;&＃&＃39;):new_road_haul &＃43;&＃61; table[hex(int(g[2:]))]elif g.startswith(&＃39;.&＃&＃39;):new_road_haul &＃43;&＃61; &＃39;.&＃39; &＃43; table[hex(int(g[3:]))]else:new_road_haul &＃43;&＃61; gfirst_pay&＃61;x[&＃39;first_pay&＃39;].split(&＃39;;&＃39;)new_first_pay &＃61; &＃39;&＃39;for h in first_pay:if h.startswith(&＃39;&＃&＃39;):new_first_pay &＃43;&＃61; table[hex(int(h[2:]))]elif h.startswith(&＃39;.&＃&＃39;):new_first_pay &＃43;&＃61; &＃39;.&＃39; &＃43; table[hex(int(h[3:]))]else:new_first_pay &＃43;&＃61; hif not new_first_pay:new_first_pay&＃61;&＃39;不支持首付&＃39;buy_out_price&＃61;x[&＃39;price&＃39;].split(&＃39;;&＃39;)new_buy_out_price &＃61; &＃39;&＃39;for h in buy_out_price:if h.startswith(&＃39;&＃&＃39;):new_buy_out_price&＃43;&＃61; table[hex(int(h[2:]))]elif h.startswith(&＃39;.&＃&＃39;):new_buy_out_price &＃43;&＃61; &＃39;.&＃39; &＃43; table[hex(int(h[3:]))]else:new_buy_out_price &＃43;&＃61; hred.append([title,license_date,new_road_haul,new_first_pay,new_buy_out_price]) result1&＃61;csv.writer(open(&＃39;files/ershouche.csv&＃39;,&＃39;w&＃39;,encoding&＃61;&＃39;utf-8&＃39;,newline&＃61;&＃39;&＃39;)) result1.writerow([&＃39;标题&＃39;,&＃39;年限&＃39;,&＃39;里程&＃39;,&＃39;首付&＃39;,&＃39;一次付&＃39;]) result1.writerows(red)

学习总结

import requestsdef get_html(url):headers &＃61; {&＃39;user-agent&＃39;: &＃39;Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36&＃39;}# 1. 使用代理: 给参数proxies赋值# {&＃39;https&＃39;: &＃39;ip:端口&＃39;}# 1&＃xff09;使用固定的代理ipresponse &＃61; requests.get(url, headers&＃61;headers, proxies&＃61;{&＃39;https&＃39;: &＃39;36.25.226.139:4513&＃39;})# 2&＃xff09;通过请求获取代理ip的地址动态获取最新的代理# ip &＃61; requests.get(&＃39;http://d.jghttp.alicloudecs.com/getip?num&＃61;1&type&＃61;1&pro&＃61;&city&＃61;0&yys&＃61;0&port&＃61;11&time&＃61;4&ts&＃61;0&ys&＃61;0&cs&＃61;0&lb&＃61;1&sb&＃61;0&pb&＃61;4&mr&＃61;1®ions&＃61;&＃39;).text.strip()# response &＃61; requests.get(url, headers&＃61;headers, proxies&＃61;{&＃39;https&＃39;: ip})# response &＃61; requests.get(url, headers&＃61;headers)print(response.text)return response.textif __name__ &＃61;&＃61; &＃39;__main__&＃39;:url &＃61; &＃39;https://movie.douban.com/top250&＃39;get_html(url)# while True:# url &＃61; &＃39;https://movie.douban.com/top250&＃39;# get_html(url) from selenium.webdriver import Chrome, ChromeOptionsoptions &＃61; ChromeOptions() options.add_experimental_option(&＃39;excludeSwitches&＃39;, [&＃39;enable-automation&＃39;]) options.add_experimental_option("prefs", {"profile.managed_default_content_settings.images": 2})# 1. 使用代理 # --proxy-server&＃61;http://IP:端口号 &＃xff08;ip端口是https的ip&＃xff09; options.add_argument(&＃39;--proxy-server&＃61;http://122.6.202.214:4510&＃39;)b &＃61; Chrome(options&＃61;options)b.get(&＃39;https://movie.douban.com/top250&＃39;) import requests# requests完成自动登录的步骤: """ 第1步&＃xff1a;在谷歌浏览器中打开网页完成登录操作&＃xff0c;然后刷新页面第2步&＃xff1a;打开当前页面的检查&＃xff0c;在network的All选项下&＃xff0c;找到当前页面的请求&＃xff0c;获取Request Headers中的COOKIE值第3步&＃xff1a;在用requests发送请求的时候给headers赋值&＃xff0c;在headers中添加 COOKIE对应的键值对 """ headers &＃61; {&＃39;COOKIE&＃39;: &＃39;_zap&＃61;b7912ec1-8e24-4d72-81cd-8fa2a2b5f78f; d_c0&＃61;"AECfz77blxSPTv9pswdcr3xSHE0eCEMj0Dc&＃61;|1646568427"; _xsrf&＃61;qy8EtuCtpOGgIUmA3g0qSi2edFqOUIBw; __snaker__id&＃61;kvuiOSuliPGkosHY; _9755xjdesxxd_&＃61;32; YD00517437729195%3AWM_TID&＃61;pJYUp8Detk5AUUUUFFc6upRtNshfmnQX; q_c1&＃61;51a6e1898c4d46a594865b3db1dd3e95|1647227093000|1647227093000; NOT_UNREGISTER_WAITING&＃61;1; gdxidpyhxdE&＃61;q6eDxuI%5CS11auZ9%2Be%5C%2BxIx%2F2cg96ULLZchHGSiL8EQvgYs9OmbeiyhhCXoa%5C%2BblJQfD%5CayzzA8oosyB%2FhPPMm7%2Fkd8W5prCdSYuppYUL5qdoyPdjsHcgA8pZgBquceXtX6di5Mu46C7dEKcHakVA7mxxjMZh%2Bre5j%2F4AQta4bulZ39y%5C%3A1647834647437; YD00517437729195%3AWM_NI&＃61;oe9bRvHOQTEjCNug5CHPzre%2BCdBGZr6dru1M9KaaTCyY5hZsiM2d%2FSXjfLKsl91VYoTN6x%2Fvc%2FWYtZWgHtA%2BkNpQdcQgt86C%2F1Vffl9dc8gqk08aF1%2Bp0LL%2BSZzsecFXbUI%3D; YD00517437729195%3AWM_NIKE&＃61;9ca17ae2e6ffcda170e2e6ee99e96f86e9ada5f97cbaac8aa3c84f878a9a85aa7afbeeac8cc97e8c989f8bb32af0fea7c3b92aadbbf783d17e8c919fb5c8628192bb88b8498c90b693e82181bc8ea8d97af6bcbe96b447fb95af82d749bb87fb89d979ab93fe85ae599cb6aaadca79b0e7ffb7dc659892fa99ae7ea1f199baf75295b98895c421a992c0b2e76993b9bcd9b549edef9a87e568fbbcadd9e67ba9f0f882c53be9b000adcf219186b694e8698688aeb6cc37e2a3; captcha_session_v2&＃61;2|1:0|10:1647833755|18:captcha_session_v2|88:Q0FUYjlIemk4MklmZlA5ZlVOWDczbGlhYjRabzMxME1Fc0N6Szl4aGVTQU5JQkdGUklNWFRBVVZtU0hYQUVvLw&＃61;&＃61;|cf267f149c0b9509d0e424579194d94fc6ec1f57567afd34050dc2a47f14bacc; captcha_ticket_v2&＃61;2|1:0|10:1647833769|17:captcha_ticket_v2|704:eyJ2YWxpZGF0ZSI6IkNOMzFfZ2pLT21aR2FUbHdXWFo2SG9wTUY1OWRZTG0tcG1vcGlfNUtrUkpzUThJSmNlV2VJdVVzdEhWNks4TVNBcVhobEZPUkZMcjUuc3N1QXpmUzBHbnIuSUNIdjlnb04tdjdoMlBydUtGSmdmV2FYUUZ2SE10dUl0RU40TzRFQS14dEhtMXJRLWg3UHdRblRMVkt1VG1kX09oekdab0pzUGxUWGFmUVF1NzRfYjc4di1QUmlQVUJMR0s5TEhvTGpDX2JUMF9jNFllNlM1SVFYSGgtMHAwV1ZMR2IwMWVqMS5FdEg1ZzZHRUZNZWMwLU8uMXk3YnY2dzlHdGNmNEE1a3E2Ry5EOWJSVlN4QjRWWmZodU1Gdk54N2lvNkZNUjJCdmw4Q254R1NUeUhtLXI1Yl9xeEZPS00wLnJONjkweW14cTQ5MHNjUzBKeHBwUE9lY05BSDZyNV9Vb3ZxZkFkR191aEQwOGc5ZUkwR3k5X005QVkub3gxOS5QdE1GanQwc1dtNERVbVZwQ3ZJV3R4V21nUS5Nd0tVTk92U3N1ZFlmcXJGMmhIWjUyTXZZUzFLc1RQaGlTNTRQWDRETElCdXQuNmU0ZUpzUFUyUzBWeUJZUXE5WFZSOEUwYzE5MEVYX2x5cEJ2MVdManBzVXJlV0t3d19GcGhTLnguVnlGMyJ9|22db975942e5d8c1799fa7c70120378eed6a34bb8bdd00afa3c5eccf92436296; z_c0&＃61;2|1:0|10:1647833781|4:z_c0|92:Mi4xaW5CWUdRQUFBQUFBUUpfUHZ0dVhGQ1lBQUFCZ0FsVk50VUFsWXdEWFYyXzVOZVRzbGJmbVg4Mk1GNF95bUYtLWd3|9d5f40b82ca91b89a903d5d50df74ed66850c2b3ecf03d86510300f5eb729d96; tst&＃61;r; SESSIONID&＃61;hbQ6zfAEKL3cjwOoewSAbkpnJKR4GtTVNCDhhjrorQ2; KLBRSID&＃61;0a401b23e8a71b70de2f4b37f5b4e379|1647833814|1647833734&＃39;,&＃39;user-agent&＃39;: &＃39;Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4844.51 Safari/537.36&＃39; } response &＃61; requests.get(&＃39;https://www.zhihu.com/&＃39;, headers&＃61;headers)print(response.text) from selenium.webdriver import Chrome from selenium.webdriver.common.keys import Keys# 1. 创建浏览器对象打开网页 b &＃61; Chrome() b.get(&＃39;https://www.taobao.com/&＃39;)# 2. 添加本地保存的COOKIE信息 COOKIE_list &＃61; eval(open(&＃39;files/taobao.txt&＃39;, encoding&＃61;&＃39;utf-8&＃39;).read()) for COOKIE in COOKIE_list:b.add_COOKIE(COOKIE)# 3.重新打开网页 b.get(&＃39;https://www.taobao.com/&＃39;)# 4. 进行后续其他操作 search &＃61; b.find_element_by_id(&＃39;q&＃39;) search.send_keys(&＃39;雪糕&＃39;) search.send_keys(Keys.ENTER) from selenium.webdriver import Chrome# 1. 获取COOKIE保存到本地 # 第一步&＃xff1a;创建浏览器对象&＃xff0c;打开需要自动登录的网站 b &＃61; Chrome() b.get(&＃39;https://www.taobao.com/&＃39;)# 2. 手动完成登录操作 input(&＃39;是否完成:&＃39;)# 3. 获取COOKIE数据并且保存到本地文件中 COOKIEs &＃61; b.get_COOKIEs() open(&＃39;files/taobao.txt&＃39;, &＃39;w&＃39;, encoding&＃61;&＃39;utf-8&＃39;).write(str(COOKIEs))

推荐阅读

int
词向量计算文本相似度,通过词向量求文本相似度

基于词向量计算文本相似度1.测试数据：链接：https:pan.baidu.coms1fXJjcujAmAwTfsuTg2CbWA提取码：f4vx2.实验代码：imp ... [详细]

蜡笔小新 2023-10-17 12:10:15
int
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
int
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
int
使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例

本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤，可以获取到网站首页的新闻数据。代码示例使用Python编写，并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]

蜡笔小新 2023-12-12 19:16:21
int
.NetCoreWebApi生成Swagger接口文档的使用方法

本文介绍了使用.NetCoreWebApi生成Swagger接口文档的方法，并详细说明了Swagger的定义和功能。通过使用Swagger，可以实现接口和服务的可视化，方便测试人员进行接口测试。同时，还提供了Github链接和具体的步骤，包括创建WebApi工程、引入swagger的包、配置XML文档文件和跨域处理。通过本文，读者可以了解到如何使用Swagger生成接口文档，并加深对Swagger的理解。 ... [详细]

蜡笔小新 2023-12-09 19:33:41
int
树莓派小车3——安卓客户端

项目地址https:github.comffmydreamWiCar界面做的很难看，美工方面实在不在行。重点是按钮触摸事件的处理，这里搬了RepeatListener项目代码，例 ... [详细]

蜡笔小新 2023-10-17 15:08:33
int
Python爬取豆瓣数据实现过程解析

这篇文章主要介绍了Python爬取豆瓣数据实现过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值, ... [详细]

蜡笔小新 2023-10-16 12:46:01
int
使用nodejs爬取b站番剧数据，计算最佳追番推荐

本文介绍了如何使用nodejs爬取b站番剧数据，并通过计算得出最佳追番推荐。通过调用相关接口获取番剧数据和评分数据，以及使用相应的算法进行计算。该方法可以帮助用户找到适合自己的番剧进行观看。 ... [详细]

蜡笔小新 2023-12-14 20:44:52
int
如何从列表中删除所有零？

本文介绍了如何使用python从列表中删除所有的零，并将结果以列表形式输出，同时提供了示例格式。 ... [详细]

蜡笔小新 2023-12-13 13:02:00
int
欢乐的票圈重构之旅——RecyclerView的头尾布局增加

项目重构的Git地址：https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集：http:www.jianshu.comno ... [详细]

蜡笔小新 2023-12-11 19:09:56
install
Pandas 基础(3) - 生成 Dataframe 的几种方式总结

本文总结了使用不同方式生成 Dataframe 的方法，包括通过CSV文件、Excel文件、python dictionary、List of tuples和List of dictionary。同时介绍了一些注意事项，如使用绝对路径引入文件和安装xlrd包来读取Excel文件。 ... [详细]

蜡笔小新 2023-12-10 12:59:34
int
ppurl

Allegro总结:1.防焊层(SolderMask):又称绿油层,PCB非布线层,用于制成丝网印板,将不需要焊接的地方涂上防焊剂.在防焊层上预留的焊盘大小要比实际的焊盘大一些,其差值一般 ... [详细]

蜡笔小新 2023-10-17 18:30:39
int
csv转为矩阵 python_Python可视化 | Seaborn5分钟入门(六)——heatmap热力图

Seaborn是基于matplotlib的Python可视化库。它提供了一个高级界面来绘制有吸引力的统计图形。Seaborn其实是在matplotlib的基础上进行了更高级的API ... [详细]

蜡笔小新 2023-10-16 17:07:31
int
python机器学习之数据探索

🐱今天我们来讲解数据建模之前需要处理的工作，也就是数据探索的过程，很多同学会说，不就是处理缺失值，异常值&# ... [详细]

蜡笔小新 2023-10-16 17:06:54
int
Tensorflow 训练自己的cnn模型行人识别

代码如下：#coding:utf-8importstring,os,sysimportnumpyasnpimportmatplotlib.py ... [详细]

蜡笔小新 2023-10-16 16:57:06

梦魇心芽_932

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章