数据库分区

本文最后更新于：2025年3月1日凌晨

数据库分区

在 MySQL 中，分区表是一种将表数据按照某种规则划分为多个独立部分的技术。分区可以显著提高查询性能、简化数据管理并优化存储效率。

分区不改变原表数据，仍然是一张表，不同与分库分表。

一、分区表的基本概念

分区（Partition）：将表数据划分为多个逻辑部分，每个分区可以单独管理和存储。
分区键（Partition Key）：用于决定数据如何分区的列或表达式。
分区类型：MySQL 支持多种分区类型，包括 范围分区（RANGE）、列表分区（LIST）、哈希分区（HASH） 和 键分区（KEY）。

二、创建分区表的语法

CREATE TABLE table_name (
    column1 datatype,
    column2 datatype,
    ...
)
PARTITION BY partition_type (partition_key) (
    PARTITION partition_name1 VALUES LESS THAN (value1),
    PARTITION partition_name2 VALUES LESS THAN (value2),
    ...
);

三、分区类型及示例

(1) 范围分区（RANGE Partitioning）

按某个范围值进行分区，常用于时间序列数据。

CREATE TABLE orders (
    order_id INT,
    order_date DATE,
    amount DECIMAL(10, 2),
    PRIMARY KEY (order_id, order_date)
)
PARTITION BY RANGE (YEAR(order_date)) (
    PARTITION p2021 VALUES LESS THAN (2022),
    PARTITION p2022 VALUES LESS THAN (2023),
    PARTITION p2023 VALUES LESS THAN (2024)
);

数据会根据 order_date 的年份分配到不同的分区。

(2) 列表分区（LIST Partitioning）

按某个离散值列表进行分区。

CREATE TABLE sales (
    sale_id INT,
    region VARCHAR(50),
    amount DECIMAL(10, 2),
    PRIMARY KEY (sale_id, region)
)
PARTITION BY LIST (region) (
    PARTITION p_north VALUES IN ('Beijing', 'Tianjin'),
    PARTITION p_south VALUES IN ('Guangzhou', 'Shenzhen')
);

数据会根据 region 的值分配到不同的分区。

(3) 哈希分区（HASH Partitioning）

通过哈希函数对分区键进行计算，均匀分布数据。

CREATE TABLE users (
    user_id INT,
    username VARCHAR(50),
    PRIMARY KEY (user_id)
)
PARTITION BY HASH(user_id)
PARTITIONS 4;

数据会根据 user_id 的哈希值分配到 4 个分区中。

(4) 键分区（KEY Partitioning）

类似于哈希分区，但使用 MySQL 内部的哈希函数。

CREATE TABLE logs (
    log_id INT,
    log_message TEXT,
    PRIMARY KEY (log_id)
)
PARTITION BY KEY(log_id)
PARTITIONS 4;

四、分区表的注意事项

(1) 分区键的选择

分区键必须是表的主键或唯一键的一部分。
如果分区键选择不当，可能导致数据分布不均匀，影响查询性能。

(2) 分区数量

分区数量过多可能导致元数据管理开销增加，影响性能。
分区数量过少可能导致分区内的数据量过大，无法达到分区的效果。

(3) 分区规则

分区规则必须与业务需求匹配，例如按时间分区适合时间序列数据。
如果分区规则与数据分布不匹配，可能导致查询性能下降。

(4) 分区维护

分区表的数据管理（如备份、恢复、删除）需要针对每个分区进行操作。
例如，删除历史数据时，可以直接删除整个分区。

(5) 查询优化

查询条件应尽量包含分区键，以便利用分区裁剪（Partition Pruning）优化性能。
如果查询条件不包含分区键，可能会导致全表扫描。

(6) 分区表的限制

分区表不支持某些 MySQL 功能，如外键、全文索引等。
分区表的存储引擎必须是 InnoDB 或 MyISAM。

五、分区表的管理

(1) 添加分区

1
2
3

ALTER TABLE orders ADD PARTITION (
    PARTITION p2024 VALUES LESS THAN (2025)
);

(2) 删除分区

1	`ALTER TABLE orders DROP PARTITION p2021;`

(3) 合并分区

1
2
3

ALTER TABLE orders REORGANIZE PARTITION p2021, p2022 INTO (
    PARTITION p2021_2022 VALUES LESS THAN (2023)
);

(4) 查看分区信息

1 2	`SELECT * FROM information_schema.PARTITIONS WHERE TABLE_NAME = 'orders';`

(5) 拆分分区

-- 将other分区数据，拆分出p2019年和p2022年的分区和兜底分区p_others
ALTER TABLE orders REORGANIZE PARTITION p_others INTO (
    PARTITION p2019 VALUES LESS THAN (2020),
    PARTITION p2022 VALUES LESS THAN (2023),
    PARTITION p_others VALUES LESS THAN MAXVALUE
);

六、分区表的适用场景

时间序列数据：例如按日期分区的日志表、订单表等。
大数据量：当表的数据量非常大时，通过分区减少查询和管理的开销。
数据归档：将历史数据存储到单独的分区中，便于快速删除或归档。

七、总结

分区表是一种强大的数据库设计技术，适用于大数据量、时间序列数据等场景。通过合理设计分区键和分区类型，可以显著提高查询性能和数据管理效率。然而，分区表的使用也需要谨慎，避免分区数量过多或分区键选择不当导致的性能问题。在设计和使用分区表时，应结合业务需求和数据特点，进行合理的规划和优化。

数据库

#MySQL

数据库分区

https://superlovelace.top/2025/03/01/数据库分区/

作者

棱境

发布于

2025年3月1日

更新于

2025年3月1日

许可协议

sql优化上一篇

窗口函数下一篇