热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PHP数据库常见问题小结

揭露PHP应用程序中出现的五个常见数据库问题——包括数据库模式设计、数据库访问和使用数据库的业务逻辑代码——以及它们的解决方案。
揭露 PHP 应用程序中出现的五个常见数据库问题 —— 包括数据库模式设计、数据库访问和使用数据库的业务逻辑代码 —— 以及它们的解决方案。

如果只有一种 方式使用数据库是正确的……

您可以用很多的方式创建数据库设计、数据库访问和基于数据库的 PHP 业务逻辑代码,但最终一般以错误告终。本文说明了数据库设计和访问数据库的 PHP 代码中出现的五个常见问题,以及在遇到这些问题时如何修复它们。

问题 1:直接使用 MySQL

一个常见问题是较老的 PHP 代码直接使用 mysql_ 函数来访问数据库。清单 1 展示了如何直接访问数据库。

清单 1. Access/get.php

注意使用了 mysql_connect 函数来访问数据库。还要注意查询,其中使用字符串连接来向查询添加 $name 参数。

该技术有两个很好的替代方案:PEAR DB 模块和 PHP Data Objects (PDO) 类。两者都从特定数据库选择提供抽象。因此,您的代码无需太多调整就可以在 IBM® DB2®、MySQL、PostgreSQL 或者您想要连接到的任何其他数据库上运行。

使用 PEAR DB 模块和 PDO 抽象层的另一个价值在于您可以在 SQL 语句中使用 ? 操作符。这样做可使 SQL 更加易于维护,且可使您的应用程序免受 SQL 注入攻击。

使用 PEAR DB 的替代代码如下所示。

getMessage()); }
  $res = $db->query( 'SELECT id FROM users WHERE login=?',
    array( $name ) );
  $id = null;
  while( $res->fetchInto( $row ) ) { $id = $row[0]; }
  return $id;
}
var_dump( get_user_id( 'jack' ) );
?>

清单 2. Access/get_good.php

注意,所有直接用到 MySQL 的地方都消除了,只有 $dsn 中的数据库连接字符串除外。此外,我们通过 ? 操作符在 SQL 中使用 $name 变量。然后,查询的数据通过 query() 方法末尾的 array 被发送进来。

问题 2:不使用自动增量功能

与大多数现代数据库一样,MySQL 能够在每记录的基础上创建自动增量惟一标识符。除此之外,我们仍然会看到这样的代码,即首先运行一个 SELECT 语句来找到最大的 id,然后将该 id 增 1,并找到一个新记录。清单 3 展示了一个示例坏模式。

DROP TABLE IF EXISTS users; 
CREATE TABLE users ( 
id MEDIUMINT, 
login TEXT, 
password TEXT 
); 
INSERT INTO users VALUES ( 1, 'jack', 'pass' ); 
INSERT INTO users VALUES ( 2, 'joan', 'pass' ); 
INSERT INTO users VALUES ( 1, 'jane', 'pass' );

清单 3. Badid.sql
这里的 id 字段被简单地指定为整数。所以,尽管它应该是惟一的,我们还是可以添加任何值,如 CREATE 语句后面的几个 INSERT 语句中所示。清单 4 展示了将用户添加到这种类型的模式的 PHP 代码。

getMessage()); } 
$res = $db->query( "SELECT max(id) FROM users" ); 
$id = null; 
while( $res->fetchInto( $row ) ) { $id = $row[0]; } 
$id += 1; 
$sth = $db->prepare( "INSERT INTO users VALUES(?,?,?)" ); 
$db->execute( $sth, array( $id, $name, $pass ) ); 
return $id; 
} 
$id = add_user( 'jerry', 'pass' ); 
var_dump( $id ); 
?>


清单 4. Add_user.php

add_user.php 中的代码首先执行一个查询以找到 id 的最大值。然后文件以 id 值加 1 运行一个 INSERT 语句。该代码在负载很重的服务器上会在竞态条件中失败。另外,它也效率低下。

那么替代方案是什么呢?使用 MySQL 中的自动增量特性来自动地为每个插入创建惟一的 ID。更新后的模式如下所示。

DROP TABLE IF EXISTS users; 
CREATE TABLE users ( 
id MEDIUMINT NOT NULL AUTO_INCREMENT, 
login TEXT NOT NULL, 
password TEXT NOT NULL, 
PRIMARY KEY( id ) 
); 
INSERT INTO users VALUES ( null, 'jack', 'pass' ); 
INSERT INTO users VALUES ( null, 'joan', 'pass' ); 
INSERT INTO users VALUES ( null, 'jane', 'pass' );


清单 5. Goodid.php

我们添加了 NOT NULL 标志来指示字段必须不能为空。我们还添加了 AUTO_INCREMENT 标志来指示字段是自动增量的,添加 PRIMARY KEY 标志来指示那个字段是一个 id。这些更改加快了速度。清单 6 展示了更新后的 PHP 代码,即将用户插入表中。

getMessage()); } 
$sth = $db->prepare( "INSERT INTO users VALUES(null,?,?)" ); 
$db->execute( $sth, array( $name, $pass ) ); 
$res = $db->query( "SELECT last_insert_id()" ); 
$id = null; 
while( $res->fetchInto( $row ) ) { $id = $row[0]; } 
return $id; 
} 
$id = add_user( 'jerry', 'pass' ); 
var_dump( $id ); 
?>


清单 6. Add_user_good.php

现在我不是获得最大的 id 值,而是直接使用 INSERT 语句来插入数据,然后使用 SELECT 语句来检索最后插入的记录的 id。该代码比最初的版本及其相关模式要简单得多,且效率更高。

问题 3:使用多个数据库

偶尔,我们会看到一个应用程序中,每个表都在一个单独的数据库中。在非常大的数据库中这样做是合理的,但是对于一般的应用程序,则不需要这种级别的分割。此外,不能跨数据库执行关系查询,这会影响使用关系数据库的整体思想,更不用说跨多个数据库管理表会更困难了。

那么,多个数据库应该是什么样的呢?首先,您需要一些数据。清单 7 展示了分成 4 个文件的这样的数据。

Files.sql:

CREATE TABLE files ( 
id MEDIUMINT, 
user_id MEDIUMINT, 
name TEXT, 
path TEXT 
);

Load_files.sql:

INSERT INTO files VALUES ( 1, 1, 'test1.jpg', 'files/test1.jpg' ); 
INSERT INTO files VALUES ( 2, 1, 'test2.jpg', 'files/test2.jpg' );

Users.sql:

DROP TABLE IF EXISTS users; 
CREATE TABLE users ( 
id MEDIUMINT, 
login TEXT, 
password TEXT 
);

Load_users.sql:

INSERT INTO users VALUES ( 1, 'jack', 'pass' ); 
INSERT INTO users VALUES ( 2, 'jon', 'pass' );

清单 7. 数据库文件
在这些文件的多数据库版本中,您应该将 SQL 语句加载到一个数据库中,然后将 users SQL 语句加载到另一个数据库中。用于在数据库中查询与某个特定用户相关联的文件的 PHP 代码如下所示。

getMessage()); } 
$res = $db->query( "SELECT id FROM users WHERE login=?", 
array( $name ) ); 
$uid = null; 
while( $res->fetchInto( $row ) ) { $uid = $row[0]; } 
return $uid; 
} 
function get_files( $name ) 
{ 
$uid = get_user( $name ); 
$rows = array(); 
$dsn = 'mysql://root:password@localhost/bad_multi2'; 
$db =& DB::Connect( $dsn, array() ); 
if (PEAR::isError($db)) { die($db->getMessage()); } 
$res = $db->query( "SELECT * FROM files WHERE user_id=?", 
array( $uid ) ); 
while( $res->fetchInto( $row ) ) { $rows[] = $row; } 
return $rows; 
} 
$files = get_files( 'jack' ); 
var_dump( $files ); 
?>

清单 8. Getfiles.php
get_user 函数连接到包含用户表的数据库并检索给定用户的 ID。get_files 函数连接到文件表并检索与给定用户相关联的文件行。

做所有这些事情的一个更好办法是将数据加载到一个数据库中,然后执行查询,比如下面的查询。

getMessage()); } 
$res = $db->query( 
"SELECT files.* FROM users, files WHERE 
users.login=? AND users.id=files.user_id", 
array( $name ) ); 
while( $res->fetchInto( $row ) ) { $rows[] = $row; } 
return $rows; 
} 
$files = get_files( 'jack' ); 
var_dump( $files ); 
?>

清单 9. Getfiles_good.php

该代码不仅更短,而且也更容易理解和高效。我们不是执行两个查询,而是执行一个查询。
尽管该问题听起来有些牵强,但是在实践中我们通常总结出所有的表应该在同一个数据库中,除非有非常迫不得已的理由。
问题 4:不使用关系
关系数据库不同于编程语言,它们不具有数组类型。相反,它们使用表之间的关系来创建对象之间的一到多结构,这与数组具有相同的效果。我在应用程序中看到的一个问题是,工程师试图将数据库当作编程语言来使用,即通过使用具有逗号分隔的标识符的文本字符串来创建数组。请看下面的模式。

DROP TABLE IF EXISTS files; 
CREATE TABLE files ( 
id MEDIUMINT, 
name TEXT, 
path TEXT 
); 
DROP TABLE IF EXISTS users; 
CREATE TABLE users ( 
id MEDIUMINT, 
login TEXT, 
password TEXT, 
files TEXT 
); 
INSERT INTO files VALUES ( 1, 'test1.jpg', 'media/test1.jpg' ); 
INSERT INTO files VALUES ( 2, 'test1.jpg', 'media/test1.jpg' ); 
INSERT INTO users VALUES ( 1, 'jack', 'pass', '1,2' );

清单 10. Bad.sql
系统中的一个用户可以具有多个文件。在编程语言中,应该使用数组来表示与一个用户相关联的文件。在本例中,程序员选择创建一个 files 字段,其中包含一个由逗号分隔的文件 id 列表。要得到一个特定用户的所有文件的列表,程序员必须首先从用户表中读取行,然后解析文件的文本,并为每个文件运行一个单独的 SELECT 语句。该代码如下所示。

getMessage()); } 
$res = $db->query( "SELECT files FROM users WHERE login=?", 
array( $name ) ); 
$files = null; 
while( $res->fetchInto( $row ) ) { $files = $row[0]; } 
$rows = array(); 
foreach( split( ',',$files ) as $file ) 
{ 
$res = $db->query( "SELECT * FROM files WHERE id=?", 
array( $file ) ); 
while( $res->fetchInto( $row ) ) { $rows[] = $row; } 
} 
return $rows; 
} 
$files = get_files( 'jack' ); 
var_dump( $files ); 
?>

清单 11. Get.php
该技术很慢,难以维护,且没有很好地利用数据库。惟一的解决方案是重新架构模式,以将其转换回到传统的关系形式,如下所示。

DROP TABLE IF EXISTS files; 
CREATE TABLE files ( 
id MEDIUMINT, 
user_id MEDIUMINT, 
name TEXT, 
path TEXT 
); 
DROP TABLE IF EXISTS users; 
CREATE TABLE users ( 
id MEDIUMINT, 
login TEXT, 
password TEXT 
); 
INSERT INTO users VALUES ( 1, 'jack', 'pass' ); 
INSERT INTO files VALUES ( 1, 1, 'test1.jpg', 'media/test1.jpg' ); 
INSERT INTO files VALUES ( 2, 1, 'test1.jpg', 'media/test1.jpg' );

清单 12. Good.sql
这里,每个文件都通过 user_id 函数与文件表中的用户相关。这可能与任何将多个文件看成数组的人的思想相反。当然,数组不引用其包含的对象 —— 事实上,反之亦然。但是在关系数据库中,工作原理就是这样的,并且查询也因此要快速且简单得多。清单 13 展示了相应的 PHP 代码。

getMessage()); } 
$rows = array(); 
$res = $db->query( 
"SELECT files.* FROM users,files WHERE users.login=? 
AND users.id=files.user_id", 
array( $name ) ); 
while( $res->fetchInto( $row ) ) { $rows[] = $row; } 
return $rows; 
} 
$files = get_files( 'jack' ); 
var_dump( $files ); 
?>

清单 13. Get_good.php
这里,我们对数据库进行一次查询,以获得所有的行。代码不复杂,并且它将数据库作为其原有的用途使用。
问题 5:n+1 模式
我真不知有多少次看到过这样的大型应用程序,其中的代码首先检索一些实体(比如说客户),然后来回地一个一个地检索它们,以得到每个实体的详细信息。我们将其称为 n+1 模式,因为查询要执行这么多次 —— 一次查询检索所有实体的列表,然后对于 n 个实体中的每一个执行一次查询。当 n=10 时这还不成其为问题,但是当 n=100 或 n=1000 时呢?然后肯定会出现低效率问题。清单 14 展示了这种模式的一个例子。

DROP TABLE IF EXISTS authors; 
CREATE TABLE authors ( 
id MEDIUMINT NOT NULL AUTO_INCREMENT, 
name TEXT NOT NULL, 
PRIMARY KEY ( id ) 
); 
DROP TABLE IF EXISTS books; 
CREATE TABLE books ( 
id MEDIUMINT NOT NULL AUTO_INCREMENT, 
author_id MEDIUMINT NOT NULL, 
name TEXT NOT NULL, 
PRIMARY KEY ( id ) 
); 
INSERT INTO authors VALUES ( null, 'Jack Herrington' ); 
INSERT INTO authors VALUES ( null, 'Dave Thomas' ); 
INSERT INTO books VALUES ( null, 1, 'Code Generation in Action' ); 
INSERT INTO books VALUES ( null, 1, 'Podcasting Hacks' ); 
INSERT INTO books VALUES ( null, 1, 'PHP Hacks' ); 
INSERT INTO books VALUES ( null, 2, 'Pragmatic Programmer' ); 
INSERT INTO books VALUES ( null, 2, 'Ruby on Rails' ); 
INSERT INTO books VALUES ( null, 2, 'Programming Ruby' );


清单 14. Schema.sql
该模式是可靠的,其中没有任何错误。问题在于访问数据库以找到一个给定作者的所有书籍的代码中,如下所示。

getMessage()); } 
function get_author_id( $name ) 
{ 
global $db; 
$res = $db->query( "SELECT id FROM authors WHERE name=?", 
array( $name ) ); 
$id = null; 
while( $res->fetchInto( $row ) ) { $id = $row[0]; } 
return $id; 
} 
function get_books( $id ) 
{ 
global $db; 
$res = $db->query( "SELECT id FROM books WHERE author_id=?", 
array( $id ) ); 
$ids = array(); 
while( $res->fetchInto( $row ) ) { $ids []= $row[0]; } 
return $ids; 
} 
function get_book( $id ) 
{ 
global $db; 
$res = $db->query( "SELECT * FROM books WHERE id=?", array( $id ) ); 
while( $res->fetchInto( $row ) ) { return $row; } 
return null; 
} 
$author_id = get_author_id( 'Jack Herrington' ); 
$books = get_books( $author_id ); 
foreach( $books as $book_id ) { 
$book = get_book( $book_id ); 
var_dump( $book ); 
} 
?>

清单 15. Get.php
如果您看看下面的代码,您可能会想,“嘿,这才是真正的清楚明了。” 首先,得到作者 id,然后得到书籍列表,然后得到有关每本书的信息。的确,它很清楚明了,但是其高效吗?回答是否定的。看看只是检索 Jack Herrington 的书籍时要执行多少次查询。一次获得 id,另一次获得书籍列表,然后每本书执行一次查询。三本书要执行五次查询!
解决方案是用一个函数来执行大量的查询,如下所示。

getMessage()); } 
function get_books( $name ) 
{ 
global $db; 
$res = $db->query( 
"SELECT books.* FROM authors,books WHERE 
books.author_id=authors.id AND authors.name=?", 
array( $name ) ); 
$rows = array(); 
while( $res->fetchInto( $row ) ) { $rows []= $row; } 
return $rows; 
} 
$books = get_books( 'Jack Herrington' ); 
var_dump( $books ); 
?>

清单 16. Get_good.php
现在检索列表需要一个快速、单个的查询。这意味着我将很可能必须具有几个这些类型的具有不同参数的方法,但是实在是没有选择。如果您想要具有一个扩展的 PHP 应用程序,那么必须有效地使用数据库,这意味着更智能的查询。

本例的问题是它有点太清晰了。通常来说,这些类型的 n+1 或 n*n 问题要微妙得多。并且它们只有在数据库管理员在系统具有性能问题时在系统上运行查询剖析器时才会出现。

结束语

数据库是强大的工具,就跟所有强大的工具一样,如果您不知道如何正确地使用就会滥用它们。识别和解决这些问题的诀窍是更好地理解底层技术。长期以来,我老听到业务逻辑编写人员抱怨,他们不想要必须理解数据库或 SQL 代码。他们把数据库当成对象使用,并疑惑性能为什么如此之差。

他们没有认识到,理解 SQL 对于将数据库从一个困难的必需品转换成强大的联盟是多么重要。如果您每天使用数据库,但是不熟悉 SQL,那么请阅读 The Art of SQL,这本书写得很好,实践性也很强,可以指导您基本了解数据库。

推荐阅读
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目,以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数,以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]
  • MySQL中的MVVC多版本并发控制机制的应用及实现
    本文介绍了MySQL中MVCC的应用及实现机制。MVCC是一种提高并发性能的技术,通过对事务内读取的内存进行处理,避免写操作堵塞读操作的并发问题。与其他数据库系统的MVCC实现机制不尽相同,MySQL的MVCC是在undolog中实现的。通过undolog可以找回数据的历史版本,提供给用户读取或在回滚时覆盖数据页上的数据。MySQL的大多数事务型存储引擎都实现了MVCC,但各自的实现机制有所不同。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • Allegro总结:1.防焊层(SolderMask):又称绿油层,PCB非布线层,用于制成丝网印板,将不需要焊接的地方涂上防焊剂.在防焊层上预留的焊盘大小要比实际的焊盘大一些,其差值一般 ... [详细]
  • 浅解XXE与Portswigger Web Sec
    XXE与PortswiggerWebSec​相关链接:​博客园​安全脉搏​FreeBuf​XML的全称为XML外部实体注入,在学习的过程中发现有回显的XXE并不多,而 ... [详细]
  • 在说Hibernate映射前,我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象,以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]
  • 本文介绍了RPC框架Thrift的安装环境变量配置与第一个实例,讲解了RPC的概念以及如何解决跨语言、c++客户端、web服务端、远程调用等需求。Thrift开发方便上手快,性能和稳定性也不错,适合初学者学习和使用。 ... [详细]
  • 延迟注入工具(python)的SQL脚本
    本文介绍了一个延迟注入工具(python)的SQL脚本,包括使用urllib2、time、socket、threading、requests等模块实现延迟注入的方法。该工具可以通过构造特定的URL来进行注入测试,并通过延迟时间来判断注入是否成功。 ... [详细]
  • svnWebUI:一款现代化的svn服务端管理软件
    svnWebUI是一款图形化管理服务端Subversion的配置工具,适用于非程序员使用。它解决了svn用户和权限配置繁琐且不便的问题,提供了现代化的web界面,让svn服务端管理变得轻松。演示地址:http://svn.nginxwebui.cn:6060。 ... [详细]
  • 本文介绍了一个免费的asp.net控件,该控件具备数据显示、录入、更新、删除等功能。它比datagrid更易用、更实用,同时具备多种功能,例如属性设置、数据排序、字段类型格式化显示、密码字段支持、图像字段上传和生成缩略图等。此外,它还提供了数据验证、日期选择器、数字选择器等功能,以及防止注入攻击、非本页提交和自动分页技术等安全性和性能优化功能。最后,该控件还支持字段值合计和数据导出功能。总之,该控件功能强大且免费,适用于asp.net开发。 ... [详细]
  • 本文介绍了互联网思维中的三个段子,涵盖了餐饮行业、淘品牌和创业企业的案例。通过这些案例,探讨了互联网思维的九大分类和十九条法则。其中包括雕爷牛腩餐厅的成功经验,三只松鼠淘品牌的包装策略以及一家创业企业的销售额增长情况。这些案例展示了互联网思维在不同领域的应用和成功之道。 ... [详细]
  • 从壹开始前后端分离【 .NET Core2.0 +Vue2.0 】框架之六 || API项目整体搭建 6.1 仓储模式
    代码已上传Github+Gitee,文末有地址  书接上文:前几回文章中,我们花了三天的时间简单了解了下接口文档Swagger框架,已经完全解放了我们的以前的Word说明文档,并且可以在线进行调 ... [详细]
  • 导读:在编程的世界里,语言纷繁多样,而大部分真正广泛流行的语言并不是那些学术界的产物,而是在通过自由发挥设计出来的。和那些 ... [详细]
  • 后台自动化测试与持续部署实践
    后台自动化测试与持续部署实践https:mp.weixin.qq.comslqwGUCKZM0AvEw_xh-7BDA后台自动化测试与持续部署实践原创 腾讯程序员 腾讯技术工程 2 ... [详细]
author-avatar
手机用户2502892543
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有