热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

使用Python模拟登录教务系统抓取成绩并分析存储

本文详细介绍如何使用Python编程语言模拟登录学校教务系统,抓取学生的成绩信息,并进行数据分析和可视化处理,最终将数据存储到MySQL数据库中。

本文旨在指导读者如何利用Python编程技术,实现对学校教务系统的成绩数据抓取、分析及存储。具体来说,我们将通过模拟登录的方式,从教务系统中抓取成绩信息,包括学期、课程名称、总成绩、课程性质和学分等关键数据,接着使用Matplotlib库绘制成绩分布图,并将这些数据导入MySQL数据库中进行持久化存储。


一、准备工作


在开始之前,确保你已经安装了必要的Python库,如Selenium、BeautifulSoup、Matplotlib和PyMySQL。此外,了解基本的HTML、CSS和Javascript知识对于调试和理解代码逻辑非常有帮助。


二、模拟登录教务系统


1. 首先,定义教务系统的登录页面URL和成绩查询页面URL。


# 定义URL
url_login = '你学校的教务系统登录页面URL'
url_score_query = '成绩查询页面URL'

2. 使用Selenium打开Chrome浏览器,设置不加载图片以加快页面加载速度,并最大化窗口。


# 设置Chrome选项
optiOns= webdriver.ChromeOptions()
options.add_argument('blink-settings=imagesEnabled=false')
driver = webdriver.Chrome(optiOns=options)
driver.maximize_window()
print("正在访问登录页面...")
driver.get(url_login)

3. 模拟输入用户名和密码,点击登录按钮完成登录操作。


# 输入用户名和密码
driver.find_element_by_id('username').send_keys('你的学号')
driver.find_element_by_id('password').send_keys('你的密码')
# 点击登录按钮
login_btn = driver.find_element_by_id('login_btn')
login_btn.click()

三、抓取成绩信息


1. 登录成功后,切换到成绩查询页面。


# 跳转到成绩查询页面
driver.get(url_score_query)

2. 由于成绩查询页面可能加载较慢,设置适当的等待时间以确保页面完全加载。


# 等待页面加载
time.sleep(10)

3. 选择每页显示50条记录,以便一次性抓取所有成绩数据。


# 选择每页显示50条记录
driver.find_element_by_class_name('bh-pull-right.jqx-widget').click()
time.sleep(0.5)
driver.find_element_by_xpath('//span[text()="50"]').click()
time.sleep(1)

4. 使用BeautifulSoup解析页面源码,提取成绩数据。


# 解析页面源码
html = driver.page_source
soup = BeautifulSoup(html, 'lxml')
trs = soup.find_all('tr')
# 存储成绩数据
scores = []
subjects = []
for tr in trs:
row = [td.text.strip() for td in tr.find_all('td')]
if len(row) > 1:
scores.append(row[5]) # 假设成绩在第6列
subjects.append(row[1]) # 假设科目名称在第2列

四、绘制成绩分布图


使用Matplotlib绘制成绩分布图,直观展示成绩情况。


# 绘制成绩分布图
plt.plot(range(len(scores)), scores)
plt.xlabel('科目编号')
plt.ylabel('成绩')
plt.title('成绩分布图')
plt.show()

五、将数据存储到MySQL数据库


最后,将抓取的成绩数据存储到MySQL数据库中,以便后续查询和分析。


# 连接MySQL数据库
cOnn= pymysql.connect(host='localhost', user='root', password='你的密码', database='score_db')
cursor = conn.cursor()
print("数据库连接成功!")
# 插入数据
insert_sql = "INSERT INTO scores (semester, subject, score, nature, credit) VALUES (%s, %s, %s, %s, %s)"
for i in range(len(scores)):
data = (trs[i+1].find_all('td')[0].text, trs[i+1].find_all('td')[1].text, scores[i], trs[i+1].find_all('td')[8].text, trs[i+1].find_all('td')[10].text)
cursor.execute(insert_sql, data)
conn.commit()
print("数据插入成功!")
# 关闭数据库连接
cursor.close()
conn.close()
print("数据库连接已关闭!")

推荐阅读
  • Python与MySQL交互指南:从基础到进阶
    本文深入探讨了Python与MySQL数据库的集成方法,包括数据库连接、数据表创建、索引管理、数据操作以及如何防止SQL注入等关键内容。适合初学者及希望提升数据库操作技能的开发者。 ... [详细]
  • SonarQube配置与使用指南
    本文档详细介绍了SonarQube的配置方法及使用流程,包括环境准备、样本分析、数据库配置、项目属性文件解析以及插件安装等内容,适用于具有Linux基础操作能力的用户。 ... [详细]
  • scrapyredis分布式爬虫 ... [详细]
  • 深入解析Pytest Fixture与Conftest的高级应用
    本文详细探讨了Pytest中的Fixture机制及其在conftest.py文件中的全局配置应用,涵盖Fixture的基本概念、定义、多种使用场景以及作用域等内容,适合希望深入了解Pytest测试框架的开发者。 ... [详细]
  • 1.选择一个翻译页面,我选择的是有道词典(http:dict.youdao.com)2.随便输入一个英语单词进行翻译,然后查看源文件,找到 ... [详细]
  • 提升接口测试效率的关键:用例与工具的综合应用
    本文将探讨如何通过有效的接口测试用例设计和工具选择,显著提高接口测试的效率和质量。 ... [详细]
  • 本文详细介绍了MySQL中关于员工数据库的基础知识、操作技巧以及常见问题的解决方案,适合初学者和有一定基础的用户阅读。 ... [详细]
  • Flutter 高德地图插件使用指南
    本文档详细介绍了如何在Flutter项目中集成和使用高德地图插件,包括安装、配置及基本使用方法。 ... [详细]
  • Smali代码动态调试指南
    本文介绍了如何通过一系列具体步骤实现Smali代码的动态调试,包括环境搭建、工具安装及调试过程中的关键操作。 ... [详细]
  • 本文探讨了如何利用自定义URI方案和注册表编辑,在Windows操作系统中实现从Web浏览器启动本地应用程序的方法,同时强调了这一过程中的安全考虑。 ... [详细]
  • 本文深入探讨了SSH隧道技术,详细介绍了如何利用SSH协议构建安全的通信通道,实现跨网络的数据传输。通过实例分析,分别阐述了动态SSH隧道、本地SSH隧道和远程SSH隧道的配置方法及应用场景。 ... [详细]
  • [转] JavaScript中in操作符(for..in)、Object.keys()和Object.getOwnPropertyNames()的区别
    ECMAScript将对象的属性分为两种:数据属性和访问器属性。每一种属性内部都有一些特性,这里我们只关注对象属性的[[Enumerable]]特征,它表示是否通过for-in循环 ... [详细]
  • Windows 系统中 Flutter 与 IntelliJ IDEA 的环境配置指南
    本指南详细介绍了如何在 Windows 操作系统上设置 Flutter 开发环境,并集成至 IntelliJ IDEA 中,适合初学者及专业人士参考。 ... [详细]
  • 本文探讨了在使用 ClickOnce 部署方式时遇到的自动更新失败问题,包括本地安装与服务器安装的不同表现,并提供了详细的解决方案。 ... [详细]
  • 本文旨在探讨计算机机房的有效管理与维护方法,包括合理的机房布局设计、高效的操作系统安装与恢复技术以及数据保护措施。随着信息技术教育的发展,计算机机房作为教学的重要组成部分,其稳定性和安全性直接影响到教学质量。文章分析了当前机房管理中存在的问题,并提出了针对性的解决方案。 ... [详细]
author-avatar
7777-丿M
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有