MySQL 8.0 参考手册  / 第24章分区  / 24.2 分区类型  / 24.2.4 哈希分区  /  24.2.4.1 线性哈希分区

24.2.4.1 线性哈希分区

MySQL 还支持线性散列,它与常规散列的不同之处在于,线性散列使用线性二次幂算法,而常规散列使用散列函数值的模数。

从句法上讲,线性散列分区和常规散列之间的唯一区别是 LINEAR在子句中添加了关键字PARTITION BY,如下所示:

CREATE TABLE employees (
    id INT NOT NULL,
    fname VARCHAR(30),
    lname VARCHAR(30),
    hired DATE NOT NULL DEFAULT '1970-01-01',
    separated DATE NOT NULL DEFAULT '9999-12-31',
    job_code INT,
    store_id INT
)
PARTITION BY LINEAR HASH( YEAR(hired) )
PARTITIONS 4;

给定一个表达式expr,使用线性哈希时存储记录的分区是分区中的分区号Nnum其中 N根据以下算法导出:

  1. 求下一个大于 的 2 的幂 num。我们称这个值 V;它可以计算为:

    V = POWER(2, CEILING(LOG(2, num)))

    (假设num是 13。然后 LOG(2,13)是 3.7004397181411。 CEILING(3.7004397181411)是 4,并且V= POWER(2,4)是 16。)

  2. N= F( column_list) & ( V- 1)。

  3. N>= num

    • V= V/ 2

    • 设置N= N& ( V- 1)

假设t1使用线性散列分区并具有 6 个分区的表是使用以下语句创建的:

CREATE TABLE t1 (col1 INT, col2 CHAR(5), col3 DATE)
    PARTITION BY LINEAR HASH( YEAR(col3) )
    PARTITIONS 6;

现在假设您要将两条记录插入到 t1具有col3 列值'2003-04-14''1998-10-19'中。其中第一个的分区号确定如下:

V = POWER(2, CEILING( LOG(2,6) )) = 8
N = YEAR('2003-04-14') & (8 - 1)
   = 2003 & 7
   = 3

(3 >= 6 is FALSE: record stored in partition #3)

存储第二条记录的分区号计算如下:

V = 8
N = YEAR('1998-10-19') & (8 - 1)
  = 1998 & 7
  = 6

(6 >= 6 is TRUE: additional step required)

N = 6 & ((8 / 2) - 1)
  = 6 & 3
  = 2

(2 >= 6 is FALSE: record stored in partition #2)

通过线性散列进行分区的优势在于分区的添加、删除、合并和拆分速度更快,这在处理包含极大量(TB)数据的表时非常有用。缺点是与使用常规散列分区获得的分布相比,数据不太可能在分区之间均匀分布。