MySQL 还支持线性散列,它与常规散列的不同之处在于,线性散列使用线性二次幂算法,而常规散列使用散列函数值的模数。
从句法上讲,线性散列分区和常规散列之间的唯一区别是
LINEAR
在子句中添加了关键字PARTITION
BY
,如下所示:
CREATE TABLE employees (
id INT NOT NULL,
fname VARCHAR(30),
lname VARCHAR(30),
hired DATE NOT NULL DEFAULT '1970-01-01',
separated DATE NOT NULL DEFAULT '9999-12-31',
job_code INT,
store_id INT
)
PARTITION BY LINEAR HASH( YEAR(hired) )
PARTITIONS 4;
给定一个表达式expr
,使用线性哈希时存储记录的分区是分区中的分区号N
,num
其中
N
根据以下算法导出:
求下一个大于 的 2 的幂
num
。我们称这个值V
;它可以计算为:V = POWER(2, CEILING(LOG(2, num)))
(假设
num
是 13。然后LOG(2,13)
是 3.7004397181411。CEILING(3.7004397181411)
是 4,并且V
=POWER(2,4)
是 16。)设
N
=F
(column_list
) & (V
- 1)。而
N
>=num
:集
V
=V
/ 2设置
N
=N
& (V
- 1)
假设t1
使用线性散列分区并具有 6 个分区的表是使用以下语句创建的:
CREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE)
PARTITION BY LINEAR HASH( YEAR(col3) )
PARTITIONS 6;
现在假设您要将两条记录插入到
t1
具有col3
列值'2003-04-14'
和
'1998-10-19'
中。其中第一个的分区号确定如下:
V = POWER(2, CEILING( LOG(2,6) )) = 8
N = YEAR('2003-04-14') & (8 - 1)
= 2003 & 7
= 3
(3 >= 6 is FALSE: record stored in partition #3)
存储第二条记录的分区号计算如下:
V = 8
N = YEAR('1998-10-19') & (8 - 1)
= 1998 & 7
= 6
(6 >= 6 is TRUE: additional step required)
N = 6 & ((8 / 2) - 1)
= 6 & 3
= 2
(2 >= 6 is FALSE: record stored in partition #2)
通过线性散列进行分区的优势在于分区的添加、删除、合并和拆分速度更快,这在处理包含极大量(TB)数据的表时非常有用。缺点是与使用常规散列分区获得的分布相比,数据不太可能在分区之间均匀分布。