- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

MySQL中分库分表之后，ID主键的处理

赵KK日常技术记录发表于 2023/07/07 16:30:56 2023/07/07

【摘要】 MySQL中分库分表之后，ID主键的处理在大规模的应用系统中，为了应对数据量的增长和提高系统的可扩展性，通常会采用数据库分库分表的方案。分库分表是将一个数据库或表按照某种规则拆分成多个数据库或表，使得数据可以分布在不同的物理节点上，从而提高系统的性能和并发能力。然而，在进行分库分表后，原本在单一数据库中自增的ID主键就会面临新的问题。因为拆分后的多个库或表分别自增ID，可能导致ID冲突或者...

MySQL中分库分表之后，ID主键的处理

在大规模的应用系统中，为了应对数据量的增长和提高系统的可扩展性，通常会采用数据库分库分表的方案。分库分表是将一个数据库或表按照某种规则拆分成多个数据库或表，使得数据可以分布在不同的物理节点上，从而提高系统的性能和并发能力。

然而，在进行分库分表后，原本在单一数据库中自增的ID主键就会面临新的问题。因为拆分后的多个库或表分别自增ID，可能导致ID冲突或者无法保证全局唯一性。因此，在分库分表的设计中，需要对ID主键进行特殊处理，以确保其唯一性和连续性。

本文将介绍几种常见的ID主键处理方案，并结合Java代码示例来说明其实现方式和使用方法。

1. 使用全局唯一ID（Global Unique Identifier, GUID）

全局唯一ID是一种不依赖于数据库自增机制的主键生成方案。它通常使用128位的数字字符串来表示，具备足够的长度保证全局唯一性。在分库分表中，可以通过使用GUID作为主键来避免ID冲突的问题。

示例代码：

import java.util.UUID;

public class ExampleEntity {
    private String id;
    private String name;

    public ExampleEntity(String name) {
        this.id = UUID.randomUUID().toString();
        this.name = name;
    }

    // 省略 getter 和 setter 方法
}

上述示例代码中，通过Java的UUID.randomUUID().toString()方法生成一个全局唯一的ID，并将其赋值给实体类的ID字段。

使用全局唯一ID的好处是简单可行，不依赖于数据库的自增机制，可以在分布式环境中保证主键的唯一性。然而，GUID作为主键的一个缺点是比较长，会占用较大的存储空间，并且不易于直观地排序。

2. 使用分布式唯一ID生成算法

分布式唯一ID生成算法可以生成具备全局唯一性的ID，并且具备一定的有序性，便于排序和索引。常见的分布式唯一ID生成算法有Snowflake算法和Twitter的分布式ID生成算法。

Snowflake算法示例代码：

public class SnowflakeIdGenerator {
    private static final long EPOCH = 1625097600000L;
    private static final long WORKER_ID_BITS = 5L;
    private static final long DATACENTER_ID_BITS = 5L;
    private static final long SEQUENCE_BITS = 12L;

    private static final long MAX_WORKER_ID = ~(-1L << WORKER_ID_BITS);
    private static final long MAX_DATACENTER_ID = ~(-1L << DATACENTER_ID_BITS);

    private static final long WORKER_ID_SHIFT = SEQUENCE_BITS;
    private static final long DATACENTER_ID_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS;
    private static final long TIMESTAMP_SHIFT = SEQUENCE_BITS + WORKER_ID_BITS + DATACENTER_ID_BITS;

    private long workerId;
    private long datacenterId;
    private long sequence = 0L;
    private long lastTimestamp = -1L;

    public SnowflakeIdGenerator(long workerId, long datacenterId) {
        if (workerId > MAX_WORKER_ID || workerId < 0) {
            throw new IllegalArgumentException("Invalid worker ID");
        }
        if (datacenterId > MAX_DATACENTER_ID || datacenterId < 0) {
            throw new IllegalArgumentException("Invalid datacenter ID");
        }
        this.workerId = workerId;
        this.datacenterId = datacenterId;
    }

    public synchronized long nextId() {
        long timestamp = System.currentTimeMillis();
        if (timestamp < lastTimestamp) {
            throw new RuntimeException("Clock moved backwards. Refusing to generate ID.");
        }

        if (timestamp == lastTimestamp) {
            sequence = (sequence + 1) & ((1 << SEQUENCE_BITS) - 1);
            if (sequence == 0) {
                timestamp = tilNextMillis(lastTimestamp);
            }
        } else {
            sequence = 0L;
        }

        lastTimestamp = timestamp;

        return ((timestamp - EPOCH) << TIMESTAMP_SHIFT)
                | (datacenterId << DATACENTER_ID_SHIFT)
                | (workerId << WORKER_ID_SHIFT)
                | sequence;
    }

    private long tilNextMillis(long lastTimestamp) {
        long timestamp = System.currentTimeMillis();
        while (timestamp <= lastTimestamp) {
            timestamp = System.currentTimeMillis();
        }
        return timestamp;
    }
}

Snowflake算法通过组合时间戳、数据中心ID、工作机器ID和序列号来生成唯一ID。其中，时间戳部分可以保证ID的有序性，数据中心ID和工作机器ID可以用于区分不同的节点，序列号可以用于解决同一毫秒内的并发生成。

示例代码：

public class ExampleEntity {
    private long id;
    private String name;

    public ExampleEntity(String name) {
        this.id = SnowflakeIdGenerator.nextId();
        this.name = name;
    }

    // 省略 getter 和 setter 方法
}

上述示例代码中，通过SnowflakeIdGenerator生成一个全局唯一的ID，并将其赋值给实体类的ID字段。

使用分布式唯一ID生成算法可以在分库分表的场景下保证主键的唯一性和有序性，但需要注意算法的实现和配置，以及在高并发环境下的性能问题。

3. 使用数据库自增ID和分片ID

另一种处理分库分表后ID主键的方案是结合数据库自增ID和分片ID。分片ID是根据拆分规则生成的，用于标识数据在哪个分片中。在每个分片中，仍然可以使用数据库的自增ID来保证主键的唯一性。

示例代码：

public class ExampleEntity {
    private long id;
    private String name;
    private int shardId;

    public ExampleEntity(String name, int shard

Id) {
        this.name = name;
        this.shardId = shardId;
    }

    // 省略 getter 和 setter 方法
}

上述示例代码中，实体类新增了一个shardId字段，用于表示数据所在的分片ID。在每个分片中，使用数据库的自增ID来生成主键。

使用数据库自增ID和分片ID的方案相对简单，但需要保证分片ID的正确性和一致性，并且需要在查询时考虑分片的路由。

总结

在MySQL的分库分表方案中，ID主键的处理是一个重要的问题。本文介绍了几种常见的处理方案，包括使用全局唯一ID、分布式唯一ID生成算法和结合数据库自增ID和分片ID。每种方案都有其优劣和适用场景，开发人员需要根据具体需求选择合适的方案。

在实际应用中，还可以根据业务需求和系统架构的特点进行定制化的ID主键处理方案。无论采用何种方案，都需要保证主键的唯一性、有序性和性能的可扩展性。

参考文献：

分布式ID生成算法的实现和应用
美团点评分布式ID生成系统
全局唯一ID生成方案对比

【声明】本内容来自华为云开发者社区博主，不代表华为云及华为云开发者社区的观点和立场。转载时必须标注文章的来源（华为云社区）、文章链接、文章作者等基本信息，否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容，欢迎发送邮件进行举报，并提供相关证据，一经查实，本社区将立刻删除涉嫌侵权内容，举报邮箱： cloudbbs@huaweicloud.com

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

MySQL中分库分表之后，ID主键的处理

MySQL中分库分表之后，ID主键的处理

1. 使用全局唯一ID（Global Unique Identifier, GUID）

示例代码：

2. 使用分布式唯一ID生成算法

Snowflake算法示例代码：

示例代码：

3. 使用数据库自增ID和分片ID

示例代码：

总结

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

MySQL中分库分表之后，ID主键的处理

MySQL中分库分表之后，ID主键的处理

1. 使用全局唯一ID（Global Unique Identifier, GUID）

示例代码：

2. 使用分布式唯一ID生成算法

Snowflake算法示例代码：

示例代码：

3. 使用数据库自增ID和分片ID

示例代码：

总结

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品