数据处理上 a) 分表后,数据都是存放在分表里,总表只是一个外壳,存取数据发生在一个一个的分表里面。看下面的例子: select * from alluser where id='12'表面上看,是对表alluser进行操作的,其实不是的。是对alluser里面的分表进行了操作。
b) 分区呢,不存在分表的概念,分区只不过把存放数据的文件分成了许多小块,分区后的表呢,还是一张表。数据处理还是由自己来完成。
提高性能上 a) 分表后,单表的并发能力提高了,磁盘I/O性能也提高了。并发能力为什么提高了呢,因为查寻一次所花的时间变短了,如果出现高并发的话,总表可以根据不同的查询,将并发压力分到不同的小表里面。磁盘I/O性能怎么搞高了呢,本来一个非常大的.MYD文件现在也分摊到各个小表的.MYD中去了。
b) mysql提出了分区的概念,我觉得就想突破磁盘I/O瓶颈,想提高磁盘的读写能力,来增加mysql性能。 在这一点上,分区和分表的测重点不同,分表重点是存取数据时,如何提高mysql并发能力上;而分区呢,如何突破磁盘的读写能力,从而达到提高mysql性能的目的。
实现的难易度上 a) 分表的方法有很多,用merge来分表,是最简单的一种方式。这种方式根分区难易度差不多,并且对程序代码来说可以做到透明的。如果是用其他分表方式就比分区麻烦了。 b) 分区实现是比较简单的,建立分区表,根建平常的表没什么区别,并且对开代码端来说是透明的。
CREATETABLE B(ID INTNOTNULL,NAME VARCHAR(30),JOB VARCHAR(30),TIMEDATENOTNULLDEFAULT'1998-01-01')PARTITIONBY RANGE COLUMNS(TIME)(PARTITION P0 VALUES LESS THAN('1999'),PARTITION P1 VALUES LESS THAN('2000'),PARTITION P2 VALUES LESS THAN('2001'));