热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

不同工具(jsoup、httpclient)获取多个同路径下同名Cookie的问题

不同工具(jsoup、httpclient)获取多个同路径下同名Cookie的问题这两天在iteye的问答中有一个【java中使用jsou

不同工具(jsoup、httpclient)获取多个同路径下同名COOKIE的问题

 

这两天在iteye的问答中有一个【java中使用jsoup获取COOKIEs】问题, 地址:http://www.iteye.com/problems/87415。

 

不知大家遇到类似的问题吗,希望一起探讨。


1、首先第一次访问http://www.17sct.com/city.php?ename=CHANGZHOU,我们可以看到如下请求:


我们看到 设置了两个 99a0_city COOKIE, 值分别为1 和 269;如chrome、firefox、ie8将选择最后一个作为COOKIE值。

 

好像没什么问题,接下来继续看两个工具:

1、jsoup

 

Java代码   收藏代码
  1.    Connection conn = Jsoup.connect("http://www.17sct.com/city.php?name=CHANGZHOU");  
  2. conn.method(Method.GET);  
  3. conn.followRedirects(false);  
  4. Response response = conn.execute();  
  5. System.out.println(response.COOKIEs());  
  6. //{referer=deleted, 99a0_city=1, PHPSESSID=b5rjkoq2s2qmukjf9n2ffvjvn5}  
  7. //立即过期的也显示出了,即从服务器传过来的都显示  

 

  99a0_city竟然为1,即选择了第一个作为COOKIE的值。

 

查看并修改org.jsoup.helper.HttpConnection中获取COOKIE的代码:

 

Java代码   收藏代码
  1. // headers into map  
  2. Map> resHeaders = conn.getHeaderFields();  
  3.   
  4. for (Map.Entry> entry : resHeaders.entrySet()) {  
  5.     String name = entry.getKey();  
  6.     if (name == null)  
  7.         continue// http/1.1 line  
  8.   
  9.     List values = entry.getValue();  
  10.   
  11.     if (name.equalsIgnoreCase("Set-COOKIE")) {  
  12.         for (String value : values) {  
  13.             TokenQueue cd = new TokenQueue(value);  
  14.             String COOKIEName = cd.chompTo("=").trim();  
  15.             String COOKIEVal = cd.consumeTo(";").trim();  
  16.             // ignores path, date, domain, secure et al. req'd?  
  17.             System.out.println(COOKIEName+"="+COOKIEVal);  
  18.             COOKIE(COOKIEName, COOKIEVal);  
  19.         }  
  20.     } else { // only take the first instance of each header  
  21.         if (!values.isEmpty())  
  22.             header(name, values.get(0));  
  23.     }  
  24. }  

 

 

conn是java.net.HttpURLConnection,也就是说如果使用HttpURLConnection时 有多个同名的COOKIE 将获取第一个作为COOKIE的值。

 

2、HttpClient,和浏览器行为一样获取最后一个COOKIE:

 

Java代码   收藏代码
  1. HttpClient client = new HttpClient();  
  2. GetMethod get = new GetMethod("http://www.17sct.com/city.php?ename=CHANGZHOU");  
  3. get.setFollowRedirects(false);  
  4. client.executeMethod(get);  
  5. System.out.println(Arrays.toString(client.getState().getCOOKIEs()));  
  6. //[PHPSESSID=cn74fv516879pv26h5lbaf9gd0, 99a0_city=269]  
  7. //立即过期的不显示出来  
 

 

 

因此总结:

1、使用java.net.HttpURLConnection的工具/框架,如果多个同路径下同名的COOKIE将获取第一个

2、使用apache HttpClient,和浏览器行为一样获取最后一个。

 

 

因此,当我们在使用COOKIE时,尽量保证服务器设置一个COOKIE。

 

 

还要注意:

 

1、使用java.net.HttpURLConnection的工具/框架,可能获取到过期的COOKIE,如之前的referer[过期时间是2011年,即立即过期];

2、使用apache HttpClient,不会获取到过期的COOKIE。


推荐阅读
  • 本文介绍了Web学习历程记录中关于Tomcat的基本概念和配置。首先解释了Web静态Web资源和动态Web资源的概念,以及C/S架构和B/S架构的区别。然后介绍了常见的Web服务器,包括Weblogic、WebSphere和Tomcat。接着详细讲解了Tomcat的虚拟主机、web应用和虚拟路径映射的概念和配置过程。最后简要介绍了http协议的作用。本文内容详实,适合初学者了解Tomcat的基础知识。 ... [详细]
  • http:my.oschina.netleejun2005blog136820刚看到群里又有同学在说HTTP协议下的Get请求参数长度是有大小限制的,最大不能超过XX ... [详细]
  • 如何提高PHP编程技能及推荐高级教程
    本文介绍了如何提高PHP编程技能的方法,推荐了一些高级教程。学习任何一种编程语言都需要长期的坚持和不懈的努力,本文提醒读者要有足够的耐心和时间投入。通过实践操作学习,可以更好地理解和掌握PHP语言的特异性,特别是单引号和双引号的用法。同时,本文也指出了只走马观花看整体而不深入学习的学习方式无法真正掌握这门语言,建议读者要从整体来考虑局部,培养大局观。最后,本文提醒读者完成一个像模像样的网站需要付出更多的努力和实践。 ... [详细]
  • 本文介绍了在MFC下利用C++和MFC的特性动态创建窗口的方法,包括继承现有的MFC类并加以改造、插入工具栏和状态栏对象的声明等。同时还提到了窗口销毁的处理方法。本文详细介绍了实现方法并给出了相关注意事项。 ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • Android实战——jsoup实现网络爬虫,糗事百科项目的起步
    本文介绍了Android实战中使用jsoup实现网络爬虫的方法,以糗事百科项目为例。对于初学者来说,数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据,并以糗事百科作为练手项目。同时,提到了使用jsoup需要结合前端基础知识,以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]
  • 上图是InnoDB存储引擎的结构。1、缓冲池InnoDB存储引擎是基于磁盘存储的,并将其中的记录按照页的方式进行管理。因此可以看作是基于磁盘的数据库系统。在数据库系统中,由于CPU速度 ... [详细]
  • Netty源代码分析服务器端启动ServerBootstrap初始化
    本文主要分析了Netty源代码中服务器端启动的过程,包括ServerBootstrap的初始化和相关参数的设置。通过分析NioEventLoopGroup、NioServerSocketChannel、ChannelOption.SO_BACKLOG等关键组件和选项的作用,深入理解Netty服务器端的启动过程。同时,还介绍了LoggingHandler的作用和使用方法,帮助读者更好地理解Netty源代码。 ... [详细]
  • GetWindowLong函数
    今天在看一个代码里头写了GetWindowLong(hwnd,0),我当时就有点费解,靠,上网搜索函数原型说明,死活找不到第 ... [详细]
  • 本文介绍了在rhel5.5操作系统下搭建网关+LAMP+postfix+dhcp的步骤和配置方法。通过配置dhcp自动分配ip、实现外网访问公司网站、内网收发邮件、内网上网以及SNAT转换等功能。详细介绍了安装dhcp和配置相关文件的步骤,并提供了相关的命令和配置示例。 ... [详细]
  • 搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的详细步骤
    本文详细介绍了搭建Windows Server 2012 R2 IIS8.5+PHP(FastCGI)+MySQL环境的步骤,包括环境说明、相关软件下载的地址以及所需的插件下载地址。 ... [详细]
  • Echarts图表重复加载、axis重复多次请求问题解决记录
    文章目录1.需求描述2.问题描述正常状态:问题状态:3.解决方法1.需求描述使用Echats实现了一个中国地图:通过选择查询周期&#x ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • 阿,里,云,物,联网,net,core,客户端,czgl,aliiotclient, ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
author-avatar
核能裸麦_536
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有