第四节内容，up主要和大家分享一下JDBC——事务，批处理方面的内容。PS : 若大家对事务没有任何认识，先去阅读up之前的MySQL——事务的博文。

注意事项——①代码中的注释也很重要；②不要眼高手低；③点击文章的侧边栏目录或者文章开头的目录可以进行跳转。

良工不示人以朴，所有文章都会适时补充完善。大家如果有问题都可以在评论区进行交流或者私信up。 感谢阅读！

二、事务

1.事务介绍 :

JDBC程序中，当一个Connection(实现类)对象被创建后，默认情况下是自动提交事务；即每次成功执行一个SQL，都会向对应的数据库自动提交，而不能回滚。为了让多个SQL在JDBC中作为一个整体来执行，我们就需要用到“事务”，以保证数据的一致性。

可以使用Connection接口中的setAutoCommit(false)方法（动态绑定后，实际为实现类的方法），传入一个false，可以取消自动提交事务；当所有SQL都成功执行后，可以调用Connection接口的commit方法来提交事务；若中途出现失败或异常，则可以调用Connection接口的rollback方法回滚事务。

2.事务处理 :

Δ准备工作

以“转账”操作为栗。
我们先来建一张账户表accounts，代码如下 :

CREATE TABLE IF NOT EXISTS `accounts`(
		`id` INT PRIMARY KEY AUTO_INCREMENT,
		`name` VARCHAR(64) NOT NULL DEFAULT '',
		`balance` DECIMAL(16,2) NOT NULL DEFAULT 0.0
) CHARACTER SET utf8mb3 COLLATE utf8mb3_bin ENGINE INNODB;

INSERT INTO accounts(`name`,balance)
		VALUES
		('Cyan', 1000),
		('Five', 1900),
		('Alice', 2100);
		
SELECT * FROM accounts;

账户表效果如下 :

编辑

Δ不使用事务的情况

先在不使用事务的情况下进行转账操作，看看会出现什么问题：
令Cyan转给Five 200块，最终Cyan应该是800，Five是2100；但是，假设在Cyan发出转账后，Five收取转账失败了。那会发生什么结果？
up以NoTransaction类为演示类，代码如下 :

package transaction;

import utils.JDBCUtils;

import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.SQLException;

public class NoTransaction {
    public static void main(String[] args) throws ClassNotFoundException {
    //1.注册驱动
        Class.forName("com.mysql.cj.jdbc.Driver");

    //2.获取连接
        Connection connection = null;

    //3.执行SQL
        PreparedStatement preparedStatement = null;
        String sql1 = "UPDATE accounts " +
                            "SET balance = balance - 200 " +
                            "WHERE `name` = ?;";
        String sql2 = "UPDATE accounts " +
                            "SET balance = balance + 200 " +
                            "WHERE `name` = ?;";

        try {
            connection = JDBCUtils.getConnection();

            preparedStatement = connection.prepareStatement(sql1);
            preparedStatement.setString(1,"Cyan");
            /** 若在初始化preparedStatement对象时，已经与要执行的SQL绑定，则执行时不能再传入SQL参数！ */
            preparedStatement.executeUpdate();

            //抛出一个算术异常（ArithmeticException），阻止第二条SQL语句的执行
            int i = 1 / 0;
            preparedStatement = connection.prepareStatement(sql2);
            preparedStatement.setString(1,"Five");
            /** 若在初始化preparedStatement对象时，已经与要执行的SQL绑定，则执行时不能再传入SQL参数！ */
            preparedStatement.executeUpdate();
        } catch (SQLException e) {
            throw new RuntimeException(e);
        } finally {
    //4.释放资源
            JDBCUtils.close(null,preparedStatement,connection);
        }
    }
}

程序如我们所料，在int i = 1/0; 处出现算术异常，如下图所示 :

编辑

此时如果我们查询accounts表，会发现出大问题了！如下图所示 :

编辑

Cyan凭空消失了200块钱😱。原因也很简单：发出转账操作的DML顺利执行，而接收转账操作的DML——由于异常的抛出——没有顺利执行；但是由于JDBC默认是自动提交事务的，因此发出转账的操作对数据库产生了永久的影响（事务的持久性）。

Δ使用事务的情况

使用事务后，我们可以轻松解决以上问题。
up以WithTransaction类为演示类，代码如下 :

package transaction;

import utils.JDBCUtils;

import java.sql.Connection;
import java.sql.PreparedStatement;
import java.sql.SQLException;

public class WithTransaction {
    public static void main(String[] args) throws ClassNotFoundException {
        //1.注册驱动
        Class.forName("com.mysql.cj.jdbc.Driver");

        //2.获取连接
        Connection connection = null;

        //3.执行SQL
        PreparedStatement preparedStatement = null;
        String sql1 = "UPDATE accounts " +
                "SET balance = balance - 200 " +
                "WHERE `name` = ?;";
        String sql2 = "UPDATE accounts " +
                "SET balance = balance + 200 " +
                "WHERE `name` = ?;";

        try {
            connection = JDBCUtils.getConnection();
            /** 开启一个事务 */
            connection.setAutoCommit(false);

            preparedStatement = connection.prepareStatement(sql1);
            preparedStatement.setString(1,"Cyan");
            preparedStatement.executeUpdate();

            //抛出一个算术异常（ArithmeticException），试图阻止第二条SQL语句的执行
            int i = 1 / 0;
            preparedStatement = connection.prepareStatement(sql2);
            preparedStatement.setString(1,"Five");
            preparedStatement.executeUpdate();

            /** 若没有出现异常，则在SQL执行完毕后，提交事务。*/
            connection.commit();
        } catch (SQLException e) {
            /**  若事务执行过程中发生异常，捕获异常后进行回滚，
                默认回滚到事务开启时的状态。 */
            try {
                connection.rollback();
            } catch (SQLException ex) {
                throw new RuntimeException(ex);
            }
            throw new RuntimeException(e);
        } finally {
            //4.释放资源
            JDBCUtils.close(null,preparedStatement,connection);
        }
    }
}

仍然是抛出一个算术异常，如下图所示 :

编辑

这时候如果我们查询accounts表，会发生数据没有发生变化，如下图所示 :

编辑

显然，由于事务机制的加入，我们可以轻松避免错误情况的发生。那么，正确的情况又如何呢？接下来，我们将制造异常的int i = 1/0; 语句给注释掉，如下图所示 :

编辑

再次尝试执行代码 :

编辑

可以看到，无异常抛出。再次查询accounts表，如下 :

编辑

🐂🍺，这下Cyan的💴好歹是“死得其所”了（bushi）。

三、批处理

1.介绍 :

当需要成批地执行DML时，可以采用Java提供的批量更新机制。这一机制允许多条SQL一次性地提交给数据库进行批量处理，通常比单独提交SQL效率更高。

Java批处理机制往往与PreparedStatement一起搭配使用，既可以减少编译次数（预处理），又可以减少运行次数，极大地提高了SQL执行效率。

2.常用方法 :

1° addBatch() : 向集合中添加需要批量处理的SQL或者参数；

2° executeBatch() : 执行批量处理语句；

3° clearBatch() : 清空当前批处理包内的语句；

PS :

ΔJDBC连接MySQL时，如果要使用批处理功能，需要在url 中加入参数?rewriteBatchedStatements=true

3.应用 :

为了明确的看到批处理机制对执行效率的提升，up打算统计大量DML语句的执行时间，对比在未使用批处理机制和使用批处理机制后，DML语句执行时间的差异。PS : 可以使用System类的静态方法currentTimeMillis()。
还是先来建一张表，up以狗表（dogs）为例，代码如下 :

CREATE TABLE IF NOT EXISTS `dogs`(
		`id` MEDIUMINT PRIMARY KEY AUTO_INCREMENT,
		`name` VARCHAR(64) NOT NULL DEFAULT ''
) CHARACTER SET utf8mb3 COLLATE utf8mb3_bin ENGINE INNODB;

SELECT * FROM dogs;

狗表效果如下 :

编辑

现要求向狗表中加入１００００只🐕，看看需要多长时间执行完；
up以NoBatch类为演示类，代码如下 :

package batch;

import utils.JDBCUtils;

import java.sql.Connection;
import java.sql.PreparedStatement;

public class NoBatch {
    public static void main(String[] args) throws ClassNotFoundException {
//JDBC核心四部曲
    //1.注册驱动
        Class.forName("com.mysql.cj.jdbc.Driver");

    //2.获取连接
        Connection connection = null;

    //3.执行SQL
        PreparedStatement preparedStatement = null;
        String sql = "INSERT INTO dogs " +
                        "VALUES " +
                        "(null,?);";

        try {
            connection = JDBCUtils.getConnection();
            preparedStatement = connection.prepareStatement(sql);

            preparedStatement.setString(1, "狗");

            System.out.println("开始执行万🐕SQL！");
            long start = System.currentTimeMillis();
            for (int i = 0; i < 10000; i++) {
                preparedStatement.executeUpdate();
            }
            long end = System.currentTimeMillis();
            System.out.println("万🐕SQL执行完毕，一共用时：" + (end - start) + "ms");
        } catch (Exception e) {
            throw new RuntimeException(e);
        } finally {
    //4.释放资源
            JDBCUtils.close(null, preparedStatement, connection);
        }
    }
}

运行效果 :

编辑

可以看到，用了足足2s多。

我们再来看看用了批处理机制后性能会有多大提升：记住，别忘了在url中加入?rewriteBatchedStatements=true参数，如下图所示 :

编辑

然后，我们清空dogs表中的全部数据 :

TRUNCATE TABLE dogs;

编辑

接下来测试使用批处理机制后，万🐕SQL的执行时间。
up以WithBatch类为演示类，代码如下 :

package batch;

import utils.JDBCUtils;

import java.sql.Connection;
import java.sql.PreparedStatement;

/**
 * @author : Cyan_RA9
 * @version : 21.0
 */
public class WithBatch {
    public static void main(String[] args) throws ClassNotFoundException {
//JDBC核心四部曲
        //1.注册驱动
        Class.forName("com.mysql.cj.jdbc.Driver");

        //2.获取连接
        Connection connection = null;

        //3.执行SQL
        PreparedStatement preparedStatement = null;
        String sql = "INSERT INTO dogs " +
                "VALUES " +
                "(null,?);";

        try {
            connection = JDBCUtils.getConnection();
            preparedStatement = connection.prepareStatement(sql);

            preparedStatement.setString(1, "狗");

            System.out.println("开始执行万🐕SQL！");
            long start = System.currentTimeMillis();
            for (int i = 0; i < 10000; i++) {
                preparedStatement.addBatch();
                //批处理包中每满1000条SQL，就一次性发送给MySQL进行处理。
                if ((i + 1) % 1000 == 0) {
                    preparedStatement.executeBatch();
                    preparedStatement.clearBatch(); //执行后及时清理当前集合内的SQL
                }
            }
            long end = System.currentTimeMillis();
            System.out.println("万🐕SQL执行完毕，一共用时：" + (end - start) + "ms");
        } catch (Exception e) {
            throw new RuntimeException(e);
        } finally {
            //4.释放资源
            JDBCUtils.close(null, preparedStatement, connection);
        }
    }
}

运行结果 :

编辑

可以看到，从2204ms到113ms，性能的提升是肉眼可见的。

4.源码分析(JDK17.0版本） :

如下图所示，在addBatch()方法处下断点 :

编辑

接着，跳入addBatch方法，如下图所示 :

编辑

注意，checkAllParametersSet()方法就是对你通过setXxx传入的参数进行校验（对？的赋值），同时也进行一些预编译的工作。
其实，我们跳入的addBatch方法是位于ClientPreparedStatement类中的，那么，ClientPreparedStatement类又是何方神圣呢？
我们来看一下它的类图就明白了，如下所示 :

编辑

挑重点说，ClientPreparedStatement类直接继承自StatementImpl类，并且间接实现了PreparedStatement接口。
继续，我们可以发现这个addBatch方法并没有涉及到什么集合，但是它最后又调用了一个带参的addBatch方法，如下 :

编辑

我们接着追进去看看，如下 :

编辑

追进去后的addBatch方法位于AbstractQuery类中（该类实现了Query接口），我们还是把重点放在代码本身上，可以看到，这个addBatch方法底层，其实是new了一个ArrayList类的对象，并且将当前的SQL语句加入到了ArrayList集合中。
不难猜出，batchedArgs是一个List类型或者ArrayList类型，看下它的源码 :

编辑

果然如此。
再往下调用的就是ArrayList类的add方法了，这里不再赘述。up之前已经出过一篇专门分析ArrayList源码的文章，非常详细，有兴趣的小伙伴儿可以去看看。

继续，当我们将第一句SQL添加到ArrayList集合中后，便可以发现elementData数组中已经有了一个元素，如下图所示 :

编辑

当然，关于elementData数组的本质及它的扩容问题，还是建议大家去看up的ArrayList类源码分析。这里我们只需要明白——批处理机制的本质，就是将多条SQL打包到了ArrayList集合中，然后统一发送给MySQL，因此减少了执行次数。比如我们这里有10000条SQL，每批执行1000条，只需要执行10次即可；若没有批处理机制，那就是执行10000条，挨个执行，自然网络开销就上来了。

四、总结

🆗，以上就是JDBC系列博文第四节的全部内容了。

总结一下，为了保证进行DML操作时数据的一致性，Java提供了事务机制，只有一组SQL都成功执行才提交事务，否则回滚。而为了提高多条DML的执行效率，Java又提供了批处理机制，通过Debug我们也发现，批处理机制的本质就是将多条SQL打包到集合中，成批成批地发送给MySQL，减少了网络传输的次数，批处理机制与PreparedStatement配合使用，可以极大地提高SQL执行效率。

下一节内容——JDBC 连接池，我们不见不散。感谢阅读！

System.out.println("END-----------------------------------------------------------------------------");

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

JDBC 事务和批处理 详解（通俗易懂）

一、前言