今天这篇文章,是之前很早时候线上的一个案例,重新翻看的时候,觉得挺有意思,就再转发一遍。
线上的一次mysql事务问题记录
上周五进行了一个大表删除的操作,在删除的过程中,出现了一点小问题,白白花费了两个小时,我这里记录了一下大概的过程,废话不多说了,直接看过程吧。
当时想进行删除,先测试了一下删除语句的语法,删了一条试了一下,如下:
mysql 18:04:34>>select min(id) from XXXX_user_login; +---------+ | min(id) | +---------+ | 9009 | +---------+ 1 row in set (0.00 sec) mysql 18:05:43>>delete from XXXX_user_login where id < 9010; Query OK, 1 row affected (0.00 sec) mysql 18:05:47>>select min(id) from XXXX_user_login; +---------+ | min(id) | +---------+ | 9010 | +---------+ 1 row in set (0.00 sec)
这里可以看到,表里面最小的记录id是9009,我们使用delete语句删除id<9010的记录,那么id=9009的记录自然也就应该被删除了。
然后重新使用mysql客户端登录进去,发现了一个奇怪的问题:
[dba_mysql ~]$ /usr/local/mysql/bin/mysql -udba_admin -p -h127.0.0.1 -P4306 Enter password: XXXXXXXXXXXXXXXXXXXXXX Type 'help;' or 'h' for help. Type 'c' to clear the current input statement. mysql 18:15:16>>select min(id) from XXXXX_user_login; +---------+ | min(id) | +---------+ | 9009 | +---------+ 1 row in set (0.00 sec)
也就是刚才删除掉的那一条记录又重新回来了。
想想觉得挺奇怪的,是不是我删除错了,或者说删除之后,业务方又重新插入了数据,这不是出问题了么。。。又重新试了几次,都是一样的效果。
这个现象很奇怪,之前没有遇到过,我首先是检查了一下脚本,确认删除的脚本无误后,又查了好半天,最后终于从事务的这个方向找到了一个突破口,怀疑是事务没有提交导致的,于是看了一眼当前事务的参数,如下:
mysql 18:23:52>>show variables like '%commit%'; +--------------------------------+-------+ | Variable_name | Value | +--------------------------------+-------+ | autocommit | OFF | | innodb_commit_concurrency | 0 | | innodb_flush_log_at_trx_commit | 2 | +--------------------------------+-------+ 3 rows in set (0.00 sec) mysql 18:24:04>>show global variables like '%commit%'; +--------------------------------+-------+ | Variable_name | Value | +--------------------------------+-------+ | autocommit | ON | | innodb_commit_concurrency | 0 | | innodb_flush_log_at_trx_commit | 2 | +--------------------------------+-------+ 3 rows in set (0.00 sec)
看到这个,基本上问题就已经确定了,是因为当前会话中的自动提交被设置成了off,所以删除的时候,貌似已经成功了,重启之后再看,这些事务被回滚了,所以就好像删除操作"失效"一样。
那既然已经定位到了问题,就开始找这个问题的根本原因,最终在配置文件中找到了最根本的原因,如下:
[mysqldump] quick max_allowed_packet = 32M [mysql] no-auto-rehash max_allowed_packet = 32M prompt=mysql--u@h:d R:m:s>> init-command="set interactive_timeout=28800;set wait_timeout=28800;set autocommit=0;"
配置文件中的最后一行,mysql客户端组的配置autocommit被设置成了0,当然就无法自动提交了,于是改了这个参数为1,再次重试脚本,发现问题依旧。。。
看来还是改得不彻底。
我们知道,mysql加载配置文件有一个顺序,我们可以使用mysql --help|grep my.cnf的命令来查看,经过查看,是因为/etc/my.cnf中的配置也是autocommit=0,所以就把当前这个配置文件的参数给覆盖了,最终,改完/etc/my.cnf文件中的autocommit参数内容之后,重新连接mysql服务器,发现问题解决。
总结,下面几个小的知识点需要注意一下:
1、当发现数据无法删除之后,可以先看看事务提交的参数是否设置成了off
2、使用show variables和show global variables可以分别查看当前会话和全局变量的事务参数;
3、my.cnf文件中的mysql组中的参数是用来控制mysql客户端的配置的。
4、my.cnf文件有加载顺序,改动的时候,需要全部都变更。或者保证只存在一个my.cnf文件。