我的意图是登录到站点,然后从python脚本访问受保护的图像。我可以从浏览器获得合法和正常访问权限。
这就是我现在所拥有的。
import requests s = requests.Session() s.get('*domain*') r_login =s.post('*domain*/user.php', headers={'cmd': 'login', 'loginname': '***', 'password': '***' }) print (s.cookies) print (r_login.status_code) r_img = s.get('*domain*/*protectedimage*.jpg') print (r_img.status_code) print (r.cookies) print (s.cookies['PHPSESSID'])
输出:
<[ ]> 200 403 < []> 664b0842085b847a04d415a22e013ad8
我确定我可以成功登录,因为这样做后我已经下载了html文件,并且它是以一种登录的形式。但是我的问题是,在我看来,我的PHPSESSID
cookie没有通过,所以我得到了一个403
错误回来。但是我在会议中显然拥有它。我也尝试过将Cookie手动添加到我的"r_img"
行中,这没有什么区别,我仍然会得到一个空CookieJar
的403
错误。仅对请求进行模块化就不可能吗?我有事吗 对不起,我对HTTP
请求不太熟悉。
我使用Python 3.4只是为了清楚起见。
您将表单数据作为HTTP标头传递。POST登录表单应该发送表单元素作为data
参数:
r_login = s.post('*domain*/user.php', data={'cmd': 'login', 'loginname': '***', 'password': '***' })
不要检查返回的身体,而不仅仅是状态码。您的POST请求已被服务器(200 OK
)接受,但由于未发布任何登录信息,因此该正文很可能会告诉您类似“登录不正确,请重试”的信息。
当您请求图像时,服务器很可能再次清除了cookie,因为它不是有效的登录会话。403响应中可能包含带有清除日期的过去的Set-Cookie
标头PHPSESSID
。