您的位置:首页 > 数据库 > 数据库管理 > 正文

SQL Server表分区

更多 时间:2014-4-6 类别:数据库 浏览量:679

SQL Server表分区

SQL Server表分区

一、表分区注意事项


1. 表分区的边界值问题,在使用Left和Right的时候需要注意,特别是在时间分割上需要特别注意,通常情况下,以00:00:00.000是最可靠的,这种分割就需要使用到Right,如果是Left的话就需要设置为23:59:59.997;

2. 对于分区值的第一个值,符合这个值之前的数值都会给分配到第一个分区中,而使用Left和Right的区别就是这个分区值会被分配到第一个分区还是第二个分区而已;

3. 在时间分区上,RANGE RIGHT FOR VALUES ('20001001 00:00:00.000', '20010101 00:00:00.000', '20010401 00:00:00.000', '20010701 00:00:00.000'),更加简便的形式就是RANGE RIGHT FOR VALUES ('20001001', '20010101', '20010401', '20010701'),完全撇开了时分秒的问题了。

4. 通常情况下,我们会以一个表Id(int),并且是自增作为分区字段,这样分区的好处就是很容易区分历史数据了(假如你的历史数据是以插入到表的时间来区别的话),而且对分区的操作隔离也是最明显的。

5. 当以Id作为分区函数值并不能满足你的需求的时候,你可能需要考虑不一样的东西了,因为在创建Id为主键的时候,默认的情况下就是为这个主键创建为聚集索引的,所以以Id为分区字段的话,Id自增,就会顺序的被放到递增的分区文件中。这里假如你想以分类标识ClassId作为分区的话,那么你有几种选择,一个就是把Id+ClassId作为非聚集的主键(PRIMARY KEY NONCLUSTERED),创建ClassId为聚集索引(CLUSTERED),这样就可以以ClassId作为分区字段了;另外一个选择就是:Id+ClassId作为聚集的主键(PRIMARY KEY CLUSTERED),这样就不用另外创建一个索引了。

6. 对聚集索引进行分区时,聚集键必须包含分区依据列。对非唯一的聚集索引进行分区时,如果未在聚集键中明确指定分区依据列,默认情况下 SQL Server 将在聚集索引键列表中添加分区依据列。如果聚集索引是唯一的,则必须明确指定聚集索引键包含分区依据列。对唯一的非聚集索引进行分区时,索引键必须包含分区依据列。对非唯一的非聚集索引进行分区时,默认情况下 SQL Server 将分区依据列添加为索引的非键(包含性)列,以确保索引与基表对齐。如果索引中已经存在分区依据列,SQL Server 将不会向索引中添加分区依据列。

7. 如果你需要在你的分区上创建全文索引,那么你创建分区的时候就需要注意了,因为全文索引需要唯一索引的支持,而且这个唯一索引不能是复合索引,只能是单个字段的唯一索引。这个索引的要求:“unique, single-column, non-nullable index”。

8. 如果我们的分区值是随着时间的变化而增加的话,那么我们在设置表分区之后,系统跑了一段时间之后,那么最后一个分区占用的空间就会越来越大,除非你在创建分区的时候已经确认了这些分区值不会再增加了

 

 

二、分区前需要考虑的事情:

1、虽然分区可以带来众多的好处,但是同时也增加了实现对象的管理费用和复杂性。因此在进行分区之前要首先仔细的考虑以确定是否应为对象进行分区。

2、在确定了为对象进行分区后,下一步就要确定分区键和分区数。要确定分区数据,应先评估您的数据中是否存在逻辑分组和模式。

3、确定是否应使用多个文件分组。为了有助于优化性能和维护,应使用文件组分离数据。文件组是数据库数据文件的逻辑组合,它可以对数据文件进行管理和分配,以便提高数据库文件的并发访问效率。

 

三、SQL Server 2008中为表分区

 

1、操作的顺序:


(1)、先定义文件组
(2)、指定哪些辅助数据库文件属于这个文件组
(3)、将表放入到文件组中

 

2、数据库分文件组(指定磁盘):

数据实际上是依附于表来存在的,我们将表放入到文件组中,而文件组是一个逻辑的概念,其实体是辅助数据库文件(ndr),所以就等于将我们指定 的数据放入到了指定的辅助数据库文件中,然后如果将这些辅助数据库文件放入在不同的磁盘分区中,就可以最终实现有针对性的对相应的数据实现性能的优化。

创建文件组时,定义不同的文件组名称,可以有序地进行下一步表分区的分区映射文件组,如上图(选择数据库,右键查看属性图)。

一个水平分区表中有多个分区,每个分区对应一个文件组,这样就产生了很多文件组,因此性能也会有所提升,包括I/O性能提升,因为所有分区可以 驻扎在一个不同的磁盘上。另一个好处是可以通过备份文件组单独备份一个分区。此外,SQL Server数据库引擎可以智能判断哪个分区上存放了什么数据,如果不止一个分区被访问,那么还可以借助多处理器实现并行数据检索。

 

这种设计也充分利用了 分区表的优势

1、提高可伸缩性和可管理性:在SQL Server 2005中建立分区,改善大型表以及具有各种访问模式的表的可伸缩性和可管理性。

2、提高性能

3、只有将数据分区分到不同的磁盘上,才会有较大的提升。

4、因为在运行涉及表间联接的查询时,多个磁头可以同时读取数据。

 

对SQL Server数据表进行分区的过程分为三个步骤

1) 建立分区函数

2) 建立分区方案

3) 对表格进行分区

 

步骤如下:

a.选中要分区的表(右击)->存储->创建分区->选择分区列(一般采用时间字段分区)->输入分区函数名->输入分区方案名->选择边界值


b.如下图:


 

 

 

 

 

 

 

 

标签:表分区