php - 爬虫获取AJax数据问题

 浪迹天涯沃热尔_441 发布于 2022-11-30 11:41

想写一个爬取花瓣网图片的爬虫。遇到了Ajax获取数据的问题

图片中的请求的URL,Response的文本类型是json
可当我单独访问这个url的时候却是html

求教,怎么获取json数据

3 个回答
  • 这个是用header来控制的

    你把对应的请求头加上就好了。附上我的代码

    #coding=utf-8
    
    import requests as RQ
    
    hburl = "http://huaban.com/boards/28195582/?ipva9fpx&max=759391397&limit=20&wfl=1"
    heads = {
    'Host':"huaban.com",
    'Referer':"{http://huaban.com/boards/28195582/",
    'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.84 Safari/537.36",
    'X-Request':"JSON",
    'X-Requested-With':"XMLHttpRequest"
    }
    
    
    print RQ.get(hburl, headers=heads).content
    2022-11-30 11:58 回答
  • 关注这个博客很久了,写的爬虫教程很多,关键是教程好细致,推荐给你看看

    youmumzcs的专栏
    http://blog.csdn.net/youmumzc...

    2022-11-30 11:58 回答
  • Rerferer是一个常见的用来防止网页被本站之外获取的Header,做爬虫时一定要确保Referer的设置

    2022-11-30 11:58 回答
撰写答案
今天,你开发时遇到什么问题呢?
立即提问
热门标签
PHP1.CN | 中国最专业的PHP中文社区 | PNG素材下载 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有