当前位置: 开发笔记 > 编程语言 > 正文

【爬虫训练场】：分页爬虫案例设计Demo，PythonFlask与MySQL的完美连接

作者：100斤的重口味_866 | 来源：互联网 | 2023-10-17 16:00

网站类应用，一定离不开MySQL，所以本案例将带着大家学习一下，通过Flask调用MySQL数据，并实现分页呈现。类被称作蓝图，它是一个存储操作方法的容器，Flask可以通过Blu

文章目录

Python Flask 调用 MySQL 数据

建立新的控制器目录

爬虫训练场引入 MySQL 之间的逻辑关系

搭建案例前端页面

本篇博客为大家继续补充一款简易爬虫&＃xff0c;主要涉及如下知识点。

Python Flask 调用 MySQL 数据

分页数据呈现

Python Flask 调用 MySQL 数据

网站类应用&＃xff0c;一定离不开 MySQL &＃xff0c;所以本案例将带着大家学习一下&＃xff0c;通过 Flask 调用 MySQL 数据&＃xff0c;并实现分页呈现。

正式开始前&＃xff0c;我们需要提前在 MySQL 中准备一张表&＃xff0c;命名为 school_list&＃xff0c;其数据通过采集获取&＃xff0c;具体可参考博客《【Python 实战】高校数据采集&＃xff0c;爬虫训练场项目数据储备》。

安装 MySQL 操作相关模块。

pip install flask-sqlalchemy

使用 Pycharm 安装&＃xff0c;可直接在包管理中进行检索。

9. 爬虫训练场&＃xff0c;分页爬虫案例设计Demo&＃xff0c;打通 Python Flask 和 MySQL

新建 config.py 文件&＃xff0c;并输入如下代码

class BaseConfig(object): DIALECT &＃061; &＃039;mysql&＃039; DRIVER &＃061; &＃039;pymysql&＃039; USERNAME &＃061; &＃039;root&＃039; PASSWORD &＃061; &＃039;root&＃039; # 注意不要泄露服务器密码&＃xff0c;这里仅供测试使用 HOST &＃061; &＃039;127.0.0.1&＃039; PORT &＃061; &＃039;3306&＃039; DATABASE &＃061; &＃039;playground&＃039; SQLALCHEMY_DATABASE_URI &＃061; "{}&＃043;{}://{}:{}&＃064;{}:{}/{}?charset&＃061;utf8".format(DIALECT, DRIVER, USERNAME, PASSWORD, HOST, PORT, DATABASE) SQLALCHEMY_TRACK_MODIFICATIONS &＃061; False SQLALCHEMY_ECHO &＃061; True

可以看到用户名和密码都在该文件中进行配置&＃xff0c;接下来在 app/__init__.py 文件中导入对应模块。

from flask_sqlalchemy import SQLAlchemy db &＃061; SQLAlchemy()

接下来我们先补充一些小知识点&＃xff0c;罗列如下所示。

app.config.from_object() 方法&＃xff0c;它用来加载配置文件&＃xff0c;稍后将用该方法导入数据库相关配置。

下面继续看一段代码。

db &＃061; SQLAlchemy() db.init_app(app) # 初始化数据库

db &＃061; SQLAlchemy() 用于创建 SQLAlchemy 对象&＃xff0c;db.init_app() 初始化链接对象。

建立新的控制器目录

在 app 目录下建立 school 文件夹&＃xff0c;然后内部新增两个文件&＃xff0c;分别是 __init__.py 和 index.py&＃xff0c;然后在 index.py 文件中&＃xff0c;输入如下代码。

import sys from flask import Blueprint, jsonify from ..model import School # 导入上级模块 ss &＃061; Blueprint(&＃039;school&＃039;, __name__) &＃064;school.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() print(schools)

先不要运行项目&＃xff0c;我们先说明一下其中涉及的知识点&＃xff0c;第一个是 Blueprint 类。

Blueprint 类被称作蓝图&＃xff0c;它是一个存储操作方法的容器&＃xff0c;Flask 可以通过 Blueprint 来组织 URL 及处理请求。

蓝图对象和 Flask 对象使用类似&＃xff0c;但需要将其注册到应用对象上才可以生效。

使用蓝图的三个步骤。

创建一个蓝图对象

s &＃061; Blueprint(&＃039;school&＃039;, __name__,url_prifix&＃061;&＃039;/ss&＃039;)

在蓝图对象上进行操作&＃xff0c;例如注册路由&＃xff0c;指定静态文件&＃xff0c;指定过滤器

&＃064;ss.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() print(schools) return "学校数据"

在应用对象注册蓝图对象
返回到 app/__init__.py 文件中&＃xff0c;注册蓝图对象。

from .school.index import * app.register_blueprint(s)

在应用对象上注册一个蓝图时&＃xff0c;可以指定 url_prefix 关键字参数&＃xff08;该参数默认是 /&＃xff09;&＃xff0c;此时启动项目&＃xff0c;就可以通过 /ss/ 配合路由&＃xff0c;访问指定方法。

在前文代码中&＃xff0c;我们还导入了一个 model 模型模块&＃xff0c;在 app 目录中建立 model.py 文件&＃xff0c;然后输入如下代码。

from app import db class EntityBase(object): def to_json(self): fields &＃061; self.__dict__ if "_sa_instance_state" in fields: del fields["_sa_instance_state"] return fields class School(db.Model, EntityBase): """ 表名&＃xff0c;字段名 """ __tablename__ &＃061; "school_list" id &＃061; db.Column(db.Integer, primary_key&＃061;True) name &＃061; db.Column(db.String(255)) province &＃061; db.Column(db.String(255)) city &＃061; db.Column(db.String(255)) feature &＃061; db.Column(db.String(255)) hotValue &＃061; db.Column(db.String(255)) pic &＃061; db.Column(db.String(255)) category &＃061; db.Column(db.String(255)) batchTimes &＃061; db.Column(db.String(255))

其中 School 类继承自 db.Model 和 EntityBase&＃xff0c;其中的字段与数据库表字段一致。

接下来再总结一下目前的项目结构&＃xff0c;然后橡皮擦会带着大家再次梳理一下各文件之间的引用关系。

9. 爬虫训练场&＃xff0c;分页爬虫案例设计Demo&＃xff0c;打通 Python Flask 和 MySQL

爬虫训练场引入 MySQL 之间的逻辑关系

playground.py 文件为程序主入口&＃xff0c;其内部导入 app 模块&＃xff0c;由于 Python 模块导入关系&＃xff0c;app 目录中的 __init__.py 文件默认执行。

__init__.py 文件中包含如下内容&＃xff1a;

flask 主类初始化&＃xff1b;

app 配置文件初始化&＃xff1b;

SQLAlchemy 类初始化&＃xff1b;

各路由导入&＃043;蓝图注册。

由于需要导入 app 配置&＃xff0c;所以这里需要导入 config.py 文件&＃xff0c;由于需要导入路由控制器和注册蓝图&＃xff0c;所以需要编写下述代码。

from app import routes from app import general from .school.index import * app.register_blueprint(s)

为了便于项目管理&＃xff0c;在 app 目录中新建立了一个 school 文件夹&＃xff0c;并且创建了一个 index.py 文件&＃xff0c;用于实现路由函数逻辑&＃xff0c;由于该文件需要使用模型 model 相关配置&＃xff0c;所以在 app 目录新增一个 model.py 文件&＃xff0c;并且实现了第一个模型类 School。

搭建案例前端页面

本篇博客的最后一个步骤&＃xff0c;用来实现前端页面渲染&＃xff0c;在 templates 目录建立一个 school 文件夹&＃xff0c;并新建 index.html 文件&＃xff0c;其中先输入一个 Bootstrap 基本内容即可。

打开 app/school/index.py 文件&＃xff0c;修改 list_school() 函数。

&＃064;s.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() school_output &＃061; [] for s_item in schools: school_output.append(s_item.to_json()) return render_template(&＃039;school/index.html&＃039;)

运行代码&＃xff0c;页面成功渲染。

9. 爬虫训练场&＃xff0c;分页爬虫案例设计Demo&＃xff0c;打通 Python Flask 和 MySQL

下面选择数据库中的一条数据&＃xff0c;传递到前台。

&＃064;s.route(&＃039;/list&＃039;) def list_school(): schools &＃061; School.query.all() school_output &＃061; [] for s_item in schools: school_output.append(s_item.to_json()) one_school &＃061; school_output[0] return render_template(&＃039;school/index.html&＃039;,item &＃061; one_school)

前台 HTML 页面增加数据输出代码。


  {{item.name}}

本案例完成。

&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;&＃x1f4e2;
&＃x1f497; 你正在阅读 【梦想橡皮擦】 的博客
&＃x1f44d; 阅读完毕&＃xff0c;可以点点小手赞一下
&＃x1f33b; 发现错误&＃xff0c;直接评论区中指正吧
&＃x1f4c6; 橡皮擦的第 805 篇原创博客

从订购之日起&＃xff0c;案例 5 年内保证更新

⭐️ Python 爬虫 120&＃xff0c;点击订购 ⭐️

⭐️ 爬虫 100 例教程&＃xff0c;点击订购 ⭐️

推荐阅读

object
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
php
Oracle中tnsnames.ora的作用和配置方法

本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取，用于解析LOCAL_LISTENER，并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例，并展示了listener.ora文件的内容。 ... [详细]

蜡笔小新 2023-12-14 07:44:06
php
mysql升级（从5.6.15升级到5.7.15的步骤）

本文介绍了将mysql从5.6.15升级到5.7.15的详细步骤，包括关闭访问、备份旧库、备份权限、配置文件备份、关闭旧数据库、安装二进制、替换配置文件以及启动新数据库等操作。 ... [详细]

蜡笔小新 2023-12-12 14:45:04
format
使用pymysql的Python无法向mysql数据库中的表添加字段

WhenIusepythontoapplythepymysqlmoduletoaddafieldtoatableinthemysqldatabase,itdo ... [详细]

蜡笔小新 2023-12-12 13:45:10
stream
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
string
Java String与StringBuffer的区别及其应用场景

本文主要介绍了Java中String和StringBuffer的区别，String是不可变的，而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象，内存使用上要优于String类。因此，在需要频繁对字符串进行修改的情况下，使用StringBuffer更加适合。同时，文章还介绍了String和StringBuffer的应用场景。 ... [详细]

蜡笔小新 2023-12-13 19:21:06
client
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
match
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
object
SpringJdbcTemplate的使用详解

本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]

蜡笔小新 2023-12-13 14:27:11
filter
关于Linq to sql 实现模糊查询 string数组

前景：当UI一个查询条件为多项选择，或录入多个条件的时候，比如查询所有名称里面包含以下动态条件，需要模糊查询里面每一项时比如是这样一个数组条件：newstring[]{兴业银行, ... [详细]

蜡笔小新 2023-12-13 09:34:59
filter
Oracle10g备份导入的方法及注意事项

本文介绍了使用Oracle10g进行备份导入的方法及相关注意事项，同时还介绍了2019年独角兽企业重金招聘Python工程师的标准。内容包括导出exp命令、删用户、创建数据库、授权等操作，以及导入imp命令的使用。详细介绍了导入时的参数设置，如full、ignore、buffer、commit、feedback等。转载来源于https://my.oschina.net/u/1767754/blog/377593。 ... [详细]

蜡笔小新 2023-12-13 09:26:23
utf-8
web.py开发web 第八章 Formalchemy 服务端验证方法

本文介绍了在web.py开发中使用Formalchemy进行服务端表单数据验证的方法。以User表单为例，详细说明了对各字段的验证要求，包括必填、长度限制、唯一性等。同时介绍了如何自定义验证方法来实现验证唯一性和两个密码是否相等的功能。该文提供了相关代码示例。 ... [详细]

蜡笔小新 2023-12-12 16:36:00
object
Python爬虫技术基础篇面向对象高级编程（中）的多重继承

本文介绍了Python爬虫技术基础篇面向对象高级编程（中）中的多重继承概念。通过继承，子类可以扩展父类的功能。文章以动物类层次的设计为例，讨论了按照不同分类方式设计类层次的复杂性和多重继承的优势。最后给出了哺乳动物和鸟类的设计示例，以及能跑、能飞、宠物类和非宠物类的增加对类数量的影响。 ... [详细]

蜡笔小新 2023-12-12 16:19:02
php
PDO MySQL

PDOMySQL如果文章有成千上万篇，该怎样保存？数据保存有多种方式，比如单机文件、单机数据库（SQLite）、网络数据库（MySQL、MariaDB）等等。根据项目来选择，做We ... [详细]

蜡笔小新 2023-12-12 10:25:39
testing
Oracle 11g物理Active Data Guard实时查询（Realtime query）特性

在Oracle11g以前版本中的的DataGuard物理备用数据库，可以以只读的方式打开数据库，但此时MediaRecovery利用日志进行数据同步的过 ... [详细]

蜡笔小新 2023-12-11 15:49:10

100斤的重口味_866

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章