热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

thinkphp微信开发获取课表

thinkphp微信开发获取课表
小编刚刚接触微信开发,一直想做一个自己能查询课表和成绩的微信功能,在研究了些许时间,故在这里和大家一起分享一下。因为平常小编课程比较多,这篇文章可能写的很仓促,代码写的肯定不是很规范,还希望大家多交流指点。


设计思路:先登录页面获取COOKIES,然后拿着COOKIEs找服务器要验证码。最后提供服务器需要的全部信息。其实通俗的讲就是我们模拟浏览器访问界面,我们用COOKIEs去代替人工去登录教务系统。


1、CURL的PHP请求跟你游览器发出的PHP属于两个不同的线程,所以,我们采用CURL这个库来进行我们功能的实现。

2、sessionID的本质

客户端用COOKIE保存了sessionID

客户端用COOKIE保存了sessionID,当我们请求服务器的时候,会把这个sessionID一起发给服务器,服务器会到内存中搜索对应的sessionID,如果找到了对应的 sessionID,说明我们处于登录状态,有相应的权限;如果没有找到对应的sessionID,这说明:要么是我们把浏览器关掉了(后面会说明为什 么),要么session超时了(没有请求服务器超过20分钟),session被服务器清除了,则服务器会给你分配一个新的sessionID。你得重 新登录并把这个新的sessionID保存在COOKIE中。

在没有把浏览器关掉的时候(这个时候假如已经把sessionID保存在COOKIE中了)这个sessionID会一直保存在浏览器中,每次请求的时候都会把这个sessionID提交到服务器,所以服务器认为我们是登录的;当然,如果太长时间没有请求服务器,服务器会认为我们已经所以把浏览器关掉了,这个时候服务器会把该sessionID从内存中清除掉,这个时候如果我们再去请求服务器,sessionID已经不存在了,所以服务器并没有在内存中找到对应的 sessionID,所以会再产生一个新的sessionID,这个时候一般我们又要再登录一次。

客户端没有用COOKIE保存sessionID

客户端没有用COOKIE保存sessionID这个时候如果我们请求服务器,因为没有提交sessionID上来,服务器会认为你是一个全新的请求,服务器会给你分配一个新的sessionID,这就是为什么我们每次打开一个新的浏览器的时候(无论之前我们有没有登录过)都会产生一个新的sessionID(或者是会让我们重新登录)。

当我们一旦把浏览器关掉后,再打开浏览器再请求该页面,它会让我们登录,这是为什么?我们明明已经登录了,而且还没有超时,sessionID肯定还在服 务器上的,为什么现在我们又要再一次登录呢?这是因为我们关掉浏览再请求的时候,我们提交的信息没有把刚才的sessionID一起提交到服务器,所以服务器不知道我们是同一个人,所以这时服务器又为我们分配一个新的sessionID,打个比方:浏览器就好像一个要去银行开户的人,而服务器就好比银行, 这个要去银行开户的人这个时候显然没有帐号(sessionID),所以到银行后,银行工作人员问有没有帐号,他说没有,这个时候银行就会为他开通一个帐号。所以可以这么说,每次打开一个新的浏览器去请求的一个页面的时候,服务器都会认为,这是一个新的请求,他为你分配一个新的sessionID。


get_headers() 是PHP系统级函数,他返回一个包含有服务器响应一个 HTTP 请求所发送的标头的数组。如果失败则返回 FALSE 并发出一条 E_WARNING 级别的错误信息(可用来判断远程文件是否存在)。

函数定义

array get_headers ( string $url [, int $format = 0 ] )

参数

url 目标 URL

format 如果将可选的 format 参数设为 1,则 get_headers() 会解析相应的信息并设定数组的键名。


废话不多说上代码:

class TestController extends Controller {

public function index() {

$url = 'http://教务处登录地址';

$u = get_headers ( $url, 1 );

$login_url = 'http://教务处登录地址' . dirname ( $u ['Location'] ) . '/default2.aspx';

$hiden = $this->getView ( $login_url );

$post_fields = array (

'txtUserName' => '学号',

'TextBox2' => '密码',

'RadioButtonList1' => '学生',

'__VIEWSTATE' => $hiden,

"Button1" => " 登录 "

);

$COOKIE_file = tempnam ( 'Public', 'COOKIE' );

$ch = curl_init ( $login_url );

curl_setopt ( $ch, CURLOPT_HEADER, 0 ); // 显示头部

curl_setopt ( $ch, CURLOPT_POST, 1 ); // post传递

$header [] = 'User-Agent:Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/34.0.1847.116 Safari/537.36';

curl_setopt ( $ch, CURLOPT_HTTPHEADER, $header ); // 模拟客户端

curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 0 ); // 显示页面

curl_setopt ( $ch, CURLOPT_POSTFIELDS, $post_fields ); // post传递值

curl_setopt ( $ch, CURLOPT_COOKIEJAR, $COOKIE_file ); // 存入COOKIE

curl_setopt ( $ch, CURLOPT_FOLLOWLOCATION, 1 ); // 允许重定向

curl_exec ( $ch );

curl_close ( $ch );

// 获取课表

$class_url = '教务处登录地址' . dirname ( $u ['Location'] ) . '/xskbcx.aspx?xh=' . '学号';

$main_url = '教务处登录地址' . dirname ( $u ['Location'] ) . '/xs_main.aspx?xh=' . '学号';

$this->getClass ( $class_url, $main_url );

}

// 登陆页面的隐藏字段

private function getView($url) {

$result = curl_request ( $url );

$pattern = '//is';preg_match_all ( $pattern, $result, $matches );

$res [0] = $matches [1] [0];

return $res [0];

}

// 查询课表

public function getClass($url, $main_url) {

$COOKIE_file = tempnam ( 'Public', 'COOKIEs' );

$ch = curl_init ( $url );

curl_setopt ( $ch, CURLOPT_TIMEOUT, 60 );

curl_setopt ( $ch, CURLOPT_RETURNTRANSFER, 1 );

curl_setopt ( $ch, CURLOPT_REFERER, $main_url );

curl_setopt ( $ch, CURLOPT_COOKIEJAR, $COOKIE_file ); // 存入COOKIE

$str = curl_exec ( $ch );

$this->classResult ( $str );

}

// 返回课表字符串

private function classResult($result) {

preg_match_all ( '/([\\w\\W]*?)<\\/table>/', $result, $out );

$table = $out [0] [0];

// 获取整个课表

//print_r($table);

preg_match_all ( '/([\\w\\W]*?)<\\/td>/', $table, $out );$td = $out [1];$length = count ( $td ); //print_r($td) ;

// 获得课程列表

for($i = 0; $i <$length; $i ++) {

$td [$i] = str_replace ( "", "", $td [$i] );

$reg = "/{(.*)}/";

if (! preg_match_all ( $reg, $td [$i], $matches )) {

unset ( $td [$i] );}

}

$td = array_values($td); //将课程列表数组重新索引$tdLength = count($td);$this->converttoTable ( $td );

}

}

推荐阅读
  • 文章目录简介HTTP请求过程HTTP状态码含义HTTP头部信息Cookie状态管理HTTP请求方式简介HTTP协议(超文本传输协议)是用于从WWW服务 ... [详细]
  • Python瓦片图下载、合并、绘图、标记的代码示例
    本文提供了Python瓦片图下载、合并、绘图、标记的代码示例,包括下载代码、多线程下载、图像处理等功能。通过参考geoserver,使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法,供读者参考使用。 ... [详细]
  • ECMA262规定typeof操作符的返回值和instanceof的使用方法
    本文介绍了ECMA262规定的typeof操作符对不同类型的变量的返回值,以及instanceof操作符的使用方法。同时还提到了在不同浏览器中对正则表达式应用typeof操作符的返回值的差异。 ... [详细]
  • 最近在学Python,看了不少资料、视频,对爬虫比较感兴趣,爬过了网页文字、图片、视频。文字就不说了直接从网页上去根据标签分离出来就好了。图片和视频则需要在获取到相应的链接之后取做下载。以下是图片和视 ... [详细]
  • Scrapy 爬取图片
    1.创建Scrapy项目scrapystartprojectCrawlMeiziTuscrapygenspiderMeiziTuSpiderhttps:movie.douban.c ... [详细]
  • 目录爬虫06scrapy框架1.scrapy概述安装2.基本使用3.全栈数据的爬取4.五大核心组件对象5.适当提升scrapy爬取数据的效率6.请求传参爬虫06scrapy框架1. ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 使用正则表达式爬取36Kr网站首页新闻的操作步骤和代码示例
    本文介绍了使用正则表达式来爬取36Kr网站首页所有新闻的操作步骤和代码示例。通过访问网站、查找关键词、编写代码等步骤,可以获取到网站首页的新闻数据。代码示例使用Python编写,并使用正则表达式来提取所需的数据。详细的操作步骤和代码示例可以参考本文内容。 ... [详细]
  • 分享css中提升优先级属性!important的用法总结
    web前端|css教程css!importantweb前端-css教程本文分享css中提升优先级属性!important的用法总结微信门店展示源码,vscode如何管理站点,ubu ... [详细]
  • 2016 linux发行版排行_灵越7590 安装 linux (manjarognome)
    RT之前做了一次灵越7590黑苹果炒作业的文章,希望能够分享给更多不想折腾的人。kawauso:教你如何给灵越7590黑苹果抄作业​zhuanlan.z ... [详细]
  • 使用chrome编辑器实现网页截图功能的方法
    本文介绍了在chrome浏览器中使用编辑器实现网页截图功能的方法。通过在地址栏中输入特定命令,打开控制台并调用命令面板,用户可以方便地进行网页截图操作。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • Windows7企业版怎样存储安全新功能详解
    本文介绍了电脑公司发布的GHOST WIN7 SP1 X64 通用特别版 V2019.12,软件大小为5.71 GB,支持简体中文,属于国产软件,免费使用。文章还提到了用户评分和软件分类为Win7系统,运行环境为Windows。同时,文章还介绍了平台检测结果,无插件,通过了360、腾讯、金山和瑞星的检测。此外,文章还提到了本地下载文件大小为5.71 GB,需要先下载高速下载器才能进行高速下载。最后,文章详细解释了Windows7企业版的存储安全新功能。 ... [详细]
  • css元素可拖动,如何使用CSS禁止元素拖拽?
    一、用户行为三剑客以下3个CSS属性:user-select属性可以设置是否允许用户选择页面中的图文内容;user-modify属性可以设置是否允许输入 ... [详细]
  • 博主使用代理IP来自于网上免费提供高匿IP的这个网站用到的库frombs4importBeautifulSoupimportrandomimporturllib.re ... [详细]
author-avatar
mobiledu2502878157
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有