当前位置: 开发笔记 > 后端 > 正文

思考mysql内核之初级系列5---information_schema不是innodb数据字典

作者：hahah | 来源：互联网 | 2013-05-20 17:22

上次谈到了innodb缓冲区里面有些页被使用了，这些中有些被数据字典用了。那么什么是数据字典呢？bingxi和alex继续思考。

1) information_schema不是innodb数据字典

bingxi：“alex，我觉得information_schema这个里面存储的不是数据字典，为了准确起见，换个说法，information_schema不是innodb数据字典。”

alex：“是的，innodb一直有数据字典的概念，而information_schema是在mysql5之后才出现的。因此，information_schema不是innodb数据字典。”

bingxi：“alex，这样说有点牵强。我们首先举个例子吧。在手册里面，有这么一段话：

23.4. The INFORMATION_SCHEMA STATISTICS Table

The STATISTICS table provides information about table indexes.

这段话表达的意思是：information_schema. statistics存储的是表索引信息。我们在test数据库下面建立一个表t1，并且在c1上有一个索引，语句如下：

create table test.t1

(

idint,

namevarchar(20),

key it1id(id)

)engine=innodb;

接着我们查询statistics表中t1的索引信息：

mysql>select*frominformation_schema.statisticswheretable_name='t1'/G;

*************************** 1. row ***************************

TABLE_CATALOG:NULL

TABLE_SCHEMA: test

TABLE_NAME: t1

NON_UNIQUE: 1

INDEX_SCHEMA: test

INDEX_NAME: it1id

SEQ_IN_INDEX: 1

COLUMN_NAME: id

COLLATION: A

CARDINALITY: 0

SUB_PART:NULL

PACKED:NULL

NULLABLE: YES

INDEX_TYPE: BTREE

COMMENT:

1 rowinset(0.02 sec)

ERROR:

Noquery specified

从中我们可以查到索引的信息，t1表真正只有一个索引么？呵呵，这里先卖个关子，在讲innodb数据字典的时候再说这个。现在我们聚焦在it1c1索引上，这些信息确实可以看到一些索引的信息，但是这个不是数据字典表，而仅仅只能供用户从外部查看使用，不能供mysql内核使用。比如，该索引在数据文件里面存储在什么地方？不知道根页信息，就没法去使用索引。我们再看看真正的innodb数据字典中包含的内容。（见文件D:/mysql-5.1.7-beta/storage/innobase/include/dict0mem.h）

/* Data structure for an index */

struct dict_index_struct{

……

dict_table_t* table; //指向所属的table字典

ulint space; //索引所在的space

……

dict_tree_t* tree; //索引数结构

……

};

/* Data structure for an index tree */

struct dict_tree_struct{

……

ulint space; //索引所在的space

ulint page; //索引的根结点页号

……

};

通过space,page我们就可以实实在在地在访问该索引。

”

alex：“顶你，是这样的。通过show create我们还可以看出这些表是临时表。

mysql> showcreatetableinformation_schema.tables /G;

*************************** 1. row ***************************

Table: TABLES

CreateTable:CREATETEMPORARYTABLE`TABLES` (

`TABLE_CATALOG`varchar(512)defaultNULL,

……

) ENGINE=MEMORYDEFAULTCHARSET=utf8

1 rowinset(0.00 sec)

ERROR:

Noquery specified

”

bingxi：“是的”

2）information_schema内容分析

alex：“bingxi，尽管information_schema不是innodb的数据字典，我们还是来摸索下information_schema对应的代码吧。主要的代码目录如下：

D:/mysql-5.1.7-beta/sql/sql_show.h

D:/mysql-5.1.7-beta/sql/sql_show.cpp

”

bingxi：“alex，从文件名我们可以看到show，是不是show status,show variables,show processlist等也是在这个文件里面执行。”

alex：“是的，没错。我们开始吧，先从两个数据结构开始。先看schema_tables数组。

ST_SCHEMA_TABLE schema_tables[]=

{

{"CHARACTER_SETS", charsets_fields_info, create_schema_table,

fill_schema_charsets, make_character_sets_old_format, 0, -1, -1, 0},

……

{"STATUS", variables_fields_info, create_schema_table, fill_status,

make_old_format, 0, -1, -1, 1},

{"TABLES", tables_fields_info, create_schema_table,

get_all_tables, make_old_format, get_schema_tables_record, 1, 2, 0},

{"TABLE_CONSTRAINTS", table_constraints_fields_info, create_schema_table,

get_all_tables, 0, get_schema_constraints_record, 3, 4, 0},

……

};

数组有26个成员，而information_schema的5.1.7版本中只有22个表。这是可以理解的，比如该数组里面有status、variable，而这个在information_schema下是没有。我们通过show status，show variables来执行。我们接着说这个数组的成员，每个成员是一个数组结构的取值，见下面的定义：

typedef struct st_schema_table

{

constchar* table_name;

ST_FIELD_INFO *fields_info;

TABLE *(*create_table) (THD *thd, struct st_table_list *table_list);

int(*fill_table) (THD *thd, struct st_table_list *tables, COND *cond);

int(*old_format) (THD *thd, struct st_schema_table *schema_table);

int(*process_table) (THD *thd, struct st_table_list *tables,

TABLE *table, bool res,constchar *base_name,

constchar *file_name);

intidx_field1, idx_field2;

bool hidden;

} ST_SCHEMA_TABLE;

我们以tables这样表为例

{"TABLES", tables_fields_info, create_schema_table,

get_all_tables, make_old_format, get_schema_tables_record,1,2,0},

tables_fields_info表示的就是。

ST_FIELD_INFO tables_fields_info[]=

{

{"TABLE_CATALOG", FN_REFLEN, MYSQL_TYPE_STRING,0,1,0},

{"TABLE_SCHEMA",NAME_LEN, MYSQL_TYPE_STRING,0,0,0},

{"TABLE_NAME", NAME_LEN, MYSQL_TYPE_STRING,0,0,"Name"},

{"TABLE_TYPE", NAME_LEN, MYSQL_TYPE_STRING,0,0,0},

{"ENGINE", NAME_LEN, MYSQL_TYPE_STRING,0,1,"Engine"},

{"VERSION",21, MYSQL_TYPE_LONG,0,1,"Version"},

{"ROW_FORMAT",10, MYSQL_TYPE_STRING,0,1,"Row_format"},

{"TABLE_ROWS",21, MYSQL_TYPE_LONG,0,1,"Rows"},

{"AVG_ROW_LENGTH",21, MYSQL_TYPE_LONG,0,1,"Avg_row_length"},

{"DATA_LENGTH",21, MYSQL_TYPE_LONG,0,1,"Data_length"},

{"MAX_DATA_LENGTH",21, MYSQL_TYPE_LONG,0,1,"Max_data_length"},

{"INDEX_LENGTH",21, MYSQL_TYPE_LONG,0,1,"Index_length"},

{"DATA_FREE",21, MYSQL_TYPE_LONG,0,1,"Data_free"},

{"AUTO_INCREMENT",21, MYSQL_TYPE_LONG,0,1,"Auto_increment"},

{"CREATE_TIME",0, MYSQL_TYPE_TIMESTAMP,0,1,"Create_time"},

{"UPDATE_TIME",0, MYSQL_TYPE_TIMESTAMP,0,1,"Update_time"},

{"CHECK_TIME",0, MYSQL_TYPE_TIMESTAMP,0,1,"Check_time"},

{"TABLE_COLLATION",64, MYSQL_TYPE_STRING,0,1,"Collation"},

{"CHECKSUM",21, MYSQL_TYPE_LONG,0,1,"Checksum"},

{"CREATE_OPTIONS",255, MYSQL_TYPE_STRING,0,1,"Create_options"},

{"TABLE_COMMENT",80, MYSQL_TYPE_STRING,0,0,"Comment"},

{0,0, MYSQL_TYPE_STRING,0,0,0}

};

这个表示的就是tables表的字段，不考虑这行’ {0, 0, MYSQL_TYPE_STRING, 0, 0, 0}’，对比下desc tables;两边是一样的。

”

Bingxi：“我顶你，我们通过一个例子来看吧，以show status为例。

{"STATUS", variables_fields_info, create_schema_table, fill_status,

make_old_format, 0, -1, -1, 1},

//根据对比，我们可以知道：

// create_schema_table的功能是：TABLE*(*create_table)

// fill_status的功能是：int(*fill_table)

// make_old_format的功能是：int(*old_format)，这个可以暂时不调试

首先我们查看函数mysql_schema_table，在其中调用了函数create_schema_table。

intmysql_schema_table(THD *thd, LEX *lex, TABLE_LIST *table_list)

{

……

// table_list->schema_table对应的结构就是st_schema_table

//对应的值为：{"STATUS", variables_fields_info, create_schema_table, fill_status,

// make_old_format, 0, -1, -1, 1},

//因此这里的create_table等于访问create_schema_table

if (!(table= table_list->schema_table->create_table(thd, table_list)))

{

DBUG_RETURN(1);

}

……

}

create_schema_table函数作用是什么呢？从名字我们可以看出，就是创建表，创建status的临时表。表的字段有两个：Variable_name、Value。见下面的代码。

TABLE*create_schema_table(THD *thd, TABLE_LIST *table_list)

{

……

List field_list;

ST_SCHEMA_TABLE *schema_table= table_list->schema_table;

ST_FIELD_INFO *fields_info= schema_table->fields_info;

……

//fields_info就是schema_table->fields_info，里面记录了查询字段

//第一个fields_info->field_name的值是'Variable_name'

//根据这个值创建了一个item实例，然后丢到field_list这个list里面

//第二个fields_info->field_name的值是'Value'

//同样根据这个值，再创一个item，同样丢到field_list这个list里面

//这样field_list就描述了临时表的列信息

for(; fields_info->field_name; fields_info++)

{

……

//屏蔽调ields_info->field_type的差异性

item->max_length= fields_info->field_length * cs->mbmaxlen;

item->set_name(fields_info->field_name,

strlen(fields_info->field_name), cs);

……

field_list.push_back(item);

item->maybe_null= fields_info->maybe_null;

field_count++;

}

TMP_TABLE_PARAM *tmp_table_param =

(TMP_TABLE_PARAM*) (thd->calloc(sizeof(TMP_TABLE_PARAM)));

tmp_table_param->init();

tmp_table_param->table_charset= cs;

tmp_table_param->field_count= field_count;

tmp_table_param->schema_table= 1;

SELECT_LEX *select_lex= thd->lex->current_select;

//调用函数create_tmp_table

//可以看到参数中有field_list，也就是字段列表有了

//table_list->alias的值是STATUS

//于是就是创建了临时表

if (!(table= create_tmp_table(thd, tmp_table_param,

field_list, (ORDER*) 0, 0, 0,

(select_lex->options | thd->options |

TMP_TABLE_ALL_COLUMNS),

HA_POS_ERROR, table_list->alias)))

……

}

创建了临时表，但是光有临时表是不够的，因此在查询执行时，需要将值进行填充

void

JOIN::exec()

{

……

if ((curr_join->select_lex->options & OPTION_SCHEMA_TABLE) &&

get_schema_tables_result(curr_join))

{

DBUG_VOID_RETURN;

}

……

｝

get_schema_tables_result函数就是调用fill_status的地方，见函数。

bool get_schema_tables_result(JOIN*join)

{

……

for(JOIN_TAB *tab=join->join_tab; tab

{

……

// table_list->schema_table对应的结构就是st_schema_table

//对应的值为：{"STATUS", variables_fields_info, create_schema_table, fill_status,

// make_old_format, 0, -1, -1, 1},

//因此这里的fill_table等于访问fill_status

if (table_list->schema_table->fill_table(thd, table_list,

tab->select_cond))

result= 1;

table_list->is_schema_table_processed=TRUE;

……

}

……

}

于是执行fill_status进行填充数据的操作。

intfill_status(THD *thd, TABLE_LIST *tables, COND *cond)

{

DBUG_ENTER("fill_status");

LEX *lex= thd->lex;

constchar*wild= lex->wild ? lex->wild->ptr() : NullS;

intres= 0;

STATUS_VAR tmp;

pthread_mutex_lock(&LOCK_status);

//如果是showglobal，则需要执行calc_sum_of_all_status进行累加。

if (lex->option_type == OPT_GLOBAL)

calc_sum_of_all_status(&tmp);

//进行数据插入操作

res= show_status_array(thd, wild,

(SHOW_VAR *)all_status_vars.buffer,

OPT_GLOBAL,

(lex->option_type == OPT_GLOBAL ?

&tmp: &thd->status_var),"",tables->table);

pthread_mutex_unlock(&LOCK_status);

DBUG_RETURN(res);

}

为了了解得更清楚，我们再看下show_status_array函数。

staticbool show_status_array(THD *thd, constchar*wild,

SHOW_VAR *variables,

enum enum_var_type value_type,

struct system_status_var *status_var,

constchar*prefix,TABLE*table)

{

//传递过来的variables是全局变量：(SHOW_VAR *)all_status_vars.buffer

//因此对于变量执行循环操作

for(; variables->name; variables++)

{

……

restore_record(table, s->default_values);

table->field[0]->store(name_buffer, strlen(name_buffer),

system_charset_info);

table->field[1]->store(pos, (uint32) (end- pos), system_charset_info);

//将记录插入表

if (schema_table_store_record(thd,table))

DBUG_RETURN(TRUE);

……

}

……

}

执行到这里，status表里面已经有了所有的数据。然后继续执行，显示出来就行了。

”

Alex：“我明白了。其它的也是类似的，差异性也是有的，比如tables需要进行数据文件夹的扫描，呵呵。”

Bingxi：“是的，都差不多的。”

Alex：“我的建议是，将该cpp文件里面的函数都设置断点，然后每个语句执行一下。比如select * from information_schema.tables /G，用这样的方法把该模式下的22个表测试一边，并测试下show语句，show processlist，show variable,show ceate table test.t1等”

Bingxi：“是的”

Alex：“已经0点了，早点休息吧。晚安”

Bingxi：“晚安”

mysql
sql

推荐阅读

sql
如何在MySQL中将零值替换为先前的非零值？

本文介绍了如何在MySQL中将零值替换为先前的非零值的方法，包括使用内联查询和更新查询。同时还提供了选择正确值的方法。 ... [详细]

蜡笔小新 2023-12-14 16:59:24
sql
mysql分组排序_在MySQL中实现分组排序功能

在数据分析工作中，我们通常会遇到这样的问题，一个业务部门由若干业务组构成，需要筛选出每个业务组里业绩前N名的业务员。这其实是一个分组排序的 ... [详细]

蜡笔小新 2023-12-14 14:41:26
session
如何限制php数据库链接数和连接超时时间？

本文介绍了如何使用php限制数据库插入的条数并显示每次插入数据库之间的数据数目，以及避免重复提交的方法。同时还介绍了如何限制某一个数据库用户的并发连接数，以及设置数据库的连接数和连接超时时间的方法。最后提供了一些关于浏览器在线用户数和数据库连接数量比例的参考值。 ... [详细]

蜡笔小新 2023-12-14 14:06:10
http
Oracle Database 10g许可授予信息及高级功能详解

本文介绍了Oracle Database 10g许可授予信息及其中的高级功能，包括数据库优化数据包、SQL访问指导、SQL优化指导、SQL优化集和重组对象。同时提供了详细说明，指导用户在Oracle Database 10g中如何使用这些功能。 ... [详细]

蜡笔小新 2023-12-14 13:12:10
php
Hibernate基础映射

在说Hibernate映射前，我们先来了解下对象关系映射ORM。ORM的实现思想就是将关系数据库中表的数据映射成对象，以对象的形式展现。这样开发人员就可以把对数据库的操作转化为对 ... [详细]

蜡笔小新 2023-12-14 10:57:47
php
MysqlDump_mysqldump全库备份相关知识详解

本文详细介绍了MysqlDump和mysqldump进行全库备份的相关知识，包括备份命令的使用方法、my.cnf配置文件的设置、binlog日志的位置指定、增量恢复的方式以及适用于innodb引擎和myisam引擎的备份方法。对于需要进行数据库备份的用户来说，本文提供了一些有价值的参考内容。 ... [详细]

蜡笔小新 2023-12-14 10:03:27
php
PHP中的MySQL函数库及其常用函数介绍

本文由编程笔记小编整理，介绍了PHP中的MySQL函数库及其常用函数，包括mysql_connect、mysql_error、mysql_select_db、mysql_query、mysql_affected_row、mysql_close等。希望对读者有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 08:19:53
php
Spring特性实现接口多类的动态调用详解

本文详细介绍了如何使用Spring特性实现接口多类的动态调用。通过对Spring IoC容器的基础类BeanFactory和ApplicationContext的介绍，以及getBeansOfType方法的应用，解决了在实际工作中遇到的接口及多个实现类的问题。同时，文章还提到了SPI使用的不便之处，并介绍了借助ApplicationContext实现需求的方法。阅读本文，你将了解到Spring特性的实现原理和实际应用方式。 ... [详细]

蜡笔小新 2023-12-14 03:24:19
php
Metasploit攻击渗透实践

本文介绍了Metasploit攻击渗透实践的内容和要求，包括主动攻击、针对浏览器和客户端的攻击，以及成功应用辅助模块的实践过程。其中涉及使用Hydra在不知道密码的情况下攻击metsploit2靶机获取密码，以及攻击浏览器中的tomcat服务的具体步骤。同时还讲解了爆破密码的方法和设置攻击目标主机的相关参数。 ... [详细]

蜡笔小新 2023-12-14 12:14:09
http
postman测试登录后的接口_使用postman进行接口测试的方法(测试用户管理模块)

本文介绍了使用postman进行接口测试的方法，以测试用户管理模块为例。首先需要下载并安装postman，然后创建基本的请求并填写用户名密码进行登录测试。接下来可以进行用户查询和新增的测试。在新增时，可以进行异常测试，包括用户名超长和输入特殊字符的情况。通过测试发现后台没有对参数长度和特殊字符进行检查和过滤。 ... [详细]

蜡笔小新 2023-12-14 10:29:45
php
Oracle中tnsnames.ora的作用和配置方法

本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取，用于解析LOCAL_LISTENER，并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例，并展示了listener.ora文件的内容。 ... [详细]

蜡笔小新 2023-12-14 07:44:06
php
Java String与StringBuffer的区别及其应用场景

本文主要介绍了Java中String和StringBuffer的区别，String是不可变的，而StringBuffer是可变的。StringBuffer在进行字符串处理时不生成新的对象，内存使用上要优于String类。因此，在需要频繁对字符串进行修改的情况下，使用StringBuffer更加适合。同时，文章还介绍了String和StringBuffer的应用场景。 ... [详细]

蜡笔小新 2023-12-13 19:21:06
php
Oracle分析函数first_value()和last_value()的用法及原理

本文介绍了Oracle分析函数first_value()和last_value()的用法和原理，以及在查询销售记录日期和部门中的应用。通过示例和解释，详细说明了first_value()和last_value()的功能和不同之处。同时，对于last_value()的结果出现不一样的情况进行了解释，并提供了理解last_value()默认统计范围的方法。该文对于使用Oracle分析函数的开发人员和数据库管理员具有参考价值。 ... [详细]

蜡笔小新 2023-12-13 19:07:23
session
MyBatis错题分析解析及注意事项

本文对MyBatis的错题进行了分析和解析，同时介绍了使用MyBatis时需要注意的一些事项，如resultMap的使用、SqlSession和SqlSessionFactory的获取方式、动态SQL中的else元素和when元素的使用、resource属性和url属性的配置方式、typeAliases的使用方法等。同时还指出了在属性名与查询字段名不一致时需要使用resultMap进行结果映射，而不能使用resultType。 ... [详细]

蜡笔小新 2023-12-13 18:40:17
asp.net
ASP.NET Tips: 获取插入记录的ID的方法详解

本文详细介绍了在ASP.NET中获取插入记录的ID的几种方法，包括使用SCOPE_IDENTITY()和IDENT_CURRENT()函数，以及通过ExecuteReader方法执行SQL语句获取ID的步骤。同时，还提供了使用这些方法的示例代码和注意事项。对于需要获取表中最后一个插入操作所产生的ID或马上使用刚插入的新记录ID的开发者来说，本文提供了一些有用的技巧和建议。 ... [详细]

蜡笔小新 2023-12-13 17:03:18

hahah

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章