MySQL主从复制的原理:
1、首先,MySQL主库在事务提交时会把数据变更作为时间events记录在二进制日志文件binlog中;MySQL主库上的sync_binlog参数控制Binlog日志以什么样的方式刷新到磁盘上。
2、主库推送二进制日志文件Binlog中的事件到从库的中继日志Relay Log中,之后从库根据中继日志Relay Log重做数据变更操作,通过逻辑复制以此来达到主库和从库的数据一致。
MySQL主从复制的关键点:
MySQL通过3个线程来完成主从库间的数据复制,其中Binlog Dump线程跑在主库上,I/O线程和SQL线程跑在从库上。当在从库上启动复制时,首先创建I/O线程来连接主库,随后主库创建Binlog Dump线程读取数据库事件并发送给I/O线程,I/O线程获取到事件数据后更新到从库的中继日志Relay log中去,之后从库上的SQL线程读取中继日志Relay Log中更新的数据库事件并应用到从库上来。
示意图:
主库端查看线程:
mysql> show processlist\G
*************************** 1. row ***************************
Id: 55
User: chaofeng
Host: ip-172-31-26-133.ec2.internal:35750
db: NULL
Command: Binlog Dump
Time: 1433
State: Master has sent all binlog to slave; waiting for more updates
Info: NULL
*************************** 2. row ***************************
Id: 56
User: root
Host: localhost
db: NULL
Command: Query
Time: 0
State: starting
Info: show processlist
2 rows in set (0.00 sec)
从主库端的Binlog Dump线程的状态我们可以看到,MySQL的复制时主库主动推送日志到从库上去的,属于“推”日志的方式来做同步。
MySQL主从复制中的各类文件
从MySQL的复制流程可以看到复制过程中涉及了两类非常重要的日志文件:二进制日志文件(Binlog)和中继日志文件(Relay Log)
二进制日志文件会把MySQL中的所有数据修改操作以二进制的形式记录到日志文件中,其中包括:create、drop、insert、update、delete等。但是二进制日志文件并不会记录select操作,因为select并不对数据做修改。
我们可以来查看一下Binlog的格式,Binlog支持三种格式:Row、Statement、Mixed
mysql> show variables like 'binlog_format';
+---------------+-------+
| Variable_name | Value |
+---------------+-------+
| binlog_format | ROW |
+---------------+-------+
1 row in set (0.00 sec)
中继日志Relay log与二进制日志文件Binlog在文件格式、内容上等都是一样的。唯一的区别就是:从库上的SQL线程在执行完Relay log中的事件之后,SQL线程还会自动删除当前中继日志文件。这样做的原因是为了避免中继日志Relay Log过多从而占用磁盘空间。
为了保证从库crash重启之后,从库的I/O线程和SQL线程仍然能够知道从哪里开始继续复制,从库默认还会创建两个日志文件master.info和relay-log.info用来保存复制的进度。master.info用来保存从库的I/O线程当前读取的二进制日志Binlog的进度,relay-log.info用来保存SQL线程应用中继日志Relay log的进度
下面青绿色表示master.info文件的信息。紫色表示relay-log.info文件的信息。
MySQL [(none)]> show slave status\G*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 172.31.22.29 #主库IP
Master_User: chaofeng #主库上用户主从复制的账号
Master_Port: 3306 #主库的mysql的端口
Connect_Retry: 60
Master_Log_File: mysql-bin.000001 #从库I/O线程当前读取的主库Binlog文件名
Read_Master_Log_Pos: 915 #从库I/O线程读取主库上Binlog的位置
Relay_Log_File: ip-172-31-26-133-relay-bin.000002 #SQL线程正在应用的Relay Log
Relay_Log_Pos: 479 #SQL线程郑州应用的Relay Log的位置
Relay_Master_Log_File: mysql-bin.000001 #SQL线程正在应用的Relay Log对于的Binlog
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Skip_Counter: 0
Exec_Master_Log_Pos: 915 #SQL线程正在应用Relay Log的位置对应主库Binlog的位置
Relay_Log_Space: 697
Master_Server_Id: 1
Master_UUID: ce15f67e-0ccc-11e9-9e0a-0af74ce261dc
Master_Info_File: /data/data_mysql/master.info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
Master_Retry_Count: 86400
Master_Bind: 1 row in set (0.00 sec)
搭建步骤:
主从同步的MySQL版本最好一致,我们这里使用两台机器来做演示,每台机器均部署一个MySQL实例
master:172.31.22.29
slave:172.31.26.133
1、在主库上,设置一个复制使用的账户,并授予" REPLICATION SLAVE "权限。
mysql> GRANT REPLICATION SLAVE ON *.* TO 'chaofeng'@'172.31.26.133' IDENTIFIED BY '123456789';
Query OK, 0 rows affected, 0 warning (0.00 sec)
这个操作表示创建一个复制用户chaofeng,可以从172.31.26.133这个主机上进行连接,密码为123456789
2、在主库这台机器上,修改my.cnf文件,开启binlog日志功能,并设置server_id的值。修改完并重启服务
[mysqld]
#secure_file_priv = /root
sql_mode=NO_ENGINE_SUBSTITUTION,STRICT_TRANS_TABLES
basedir = /usr/local/mysql
datadir = /data/data_mysql
log-bin=/usr/local/mysql/logs/mysql-bin.log #这里我把日志单独放置一个目录下。
server_id=1
log-error=/usr/local/mysql/logs/mysql.log
port = 3306
3、在主库上,设置读锁定有效,这个操作是为了确保没有数据库操作,以便获取一致性的快照。
mysql> flush tables with read lock;
Query OK, 0 rows affected (0.00 sec)
4、查看主库上此时的二进制日志名以及偏移位。
mysql> show master status;
+------------------+----------+--------------+------------------+-------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
+------------------+----------+--------------+------------------+-------------------+
| mysql-bin.000001 | 756 | | | |
+------------------+----------+--------------+------------------+-------------------+
1 row in set (0.01 sec)
5、接下来我们就开始备份主库的数据了,这里我们直接通过将mysql数据目录进行打包操作发送给从库。因为我们这里的主库服务可以停止,因此我们直接复制文件是最快的操作,但是在生产环境中你需要考虑很多。
[root@:vg_adn_tidbCkhsTest:172.31.22.29 /data/data_mysql]#tar -zcf mysql.tar.gz ./*
[root@:vg_adn_tidbCkhsTest:23.22.172.65:172.31.22.29 /data/data_mysql]#ls
auto.cnf ib_buffer_pool ibdata1 ib_logfile0 ib_logfile1 ib_logfile2 ibtmp1 mysql mysql.pid mysql.tar.gz performance_schema sys
6、主库完成之后我们就可以恢复主库的写操作了
mysql> unlock tables;
Query OK, 0 rows affected (0.00 sec)
7、将mysql.tar.gz发送给从库。并解压到从库的数据目录下
[root@:vg_adn_tidbCkhsTest:172.31.26.133 /data]#tar -zxf mysql.tar.gz -C /data/data_mysql
[root@:vg_adn_tidbCkhsTest:172.31.26.133 /data]#ls data_mysql
auto.cnf ib_buffer_pool ibdata1 ib_logfile0 ib_logfile1 ib_logfile2 ibtmp1 mysql mysql.pid performance_schema sys
9、接下来我们开始配置从库,修改从库的配置文件/etc/my.cnf,其中有个server_id参数,注意这个server_id的值必须与主库的server_id不一样,如果是多个从库,每个服务器的server_id值都不能相同。
[mysqld]
server_id=2
从库不必开启binlog功能。
10、在mysql5.7以上的版本中,除了保证server_id不一样外,还有保证server_uuid不一样才行。server_uuid的值在MySQL数据目录下的auto.cnf文件下
查看主库的server_uuid
[root@:vg_adn_tidbCkhsTest:172.31.22.29 /data/data_mysql]#cat auto.cnf
[auto]
server-uuid=ce15f67e-0ccc-11e9-9e0a-0af74ce261dc
查看从库的server_uuid
[root@:vg_adn_tidbCkhsTest:172.31.26.133 /data/data_mysql]#cat auto.cnf
[auto]
server-uuid=ce15f67e-0ccc-11e9-9e0a-0af74ce261dc
因为我们是直接将主库的数据目录复制过来的,因此两个文件下的auto.cnf的值是一模一样的,我们修改一下从库的这个值,只修改一位即可,只要能保证这两个值不一样就行。
修改从库的server_uuid值为
server-uuid=ce15f67e-0ccc-11e9-9e0a-0af74ce261dd
11、接下来重启从服务器,对从数据库服务器进行设置,这里主要设置一下几项:
MySQL [(none)]> CHANGE MASTER TO
-> MASTER_HOST='172.31.22.29',
-> MASTER_PORT=3306, -> MASTER_USER='chaofeng',
-> MASTER_PASSWORD='123456789',
-> MASTER_LOG_FILE='mysql-bin.000001',
-> MASTER_LOG_POS=756;
Query OK, 0 rows affected, 2 warnings (0.02 sec)
12、从库上启动线程
MySQL [(none)]> start slave;
Query OK, 0 rows affected (0.00 sec)
13、这时在slave上执行show processlist命令将显示类似如下的信息:
MySQL [(none)]> show processlist\G
*************************** 1. row ***************************
Id: 4
User: root
Host: localhost
db: NULL
Command: Query
Time: 0
State: starting
Info: show processlist
*************************** 2. row ***************************
Id: 6
User: system user
Host:
db: NULL
Command: Connect
Time: 5
State: Waiting for master to send event
Info: NULL
*************************** 3. row ***************************
Id: 7
User: system user
Host:
db: NULL
Command: Connect
Time: 5
State: Slave has read all relay log; waiting for more updates
Info: NULL
3 rows in set (0.00 sec)
或者你也可以这样子查看:
MySQL [(none)]> show slave status\G
*************************** 1. row ***************************
Slave_IO_State: Waiting for master to send event
Master_Host: 172.31.22.29
Master_User: chaofeng
Master_Port: 3306
Connect_Retry: 60
Master_Log_File: mysql-bin.000001
Read_Master_Log_Pos: 756
Relay_Log_File: ip-172-31-26-133-relay-bin.000002
Relay_Log_Pos: 320
Relay_Master_Log_File: mysql-bin.000001
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Replicate_Do_DB:
Replicate_Ignore_DB:
Replicate_Do_Table:
Replicate_Ignore_Table:
Replicate_Wild_Do_Table:
Replicate_Wild_Ignore_Table:
Last_Errno: 0
Last_Error:
Skip_Counter: 0
Exec_Master_Log_Pos: 756
Relay_Log_Space: 538
Until_Condition: None
Until_Log_File:
Until_Log_Pos: 0
Master_SSL_Allowed: No
Master_SSL_CA_File:
Master_SSL_CA_Path:
Master_SSL_Cert:
Master_SSL_Cipher:
Master_SSL_Key:
Seconds_Behind_Master: 0
Master_SSL_Verify_Server_Cert: No
Last_IO_Errno: 0
Last_IO_Error:
Last_SQL_Errno: 0
Last_SQL_Error:
Replicate_Ignore_Server_Ids:
Master_Server_Id: 1
Master_UUID: ce15f67e-0ccc-11e9-9e0a-0af74ce261dc
Master_Info_File: /data/data_mysql/master.info
SQL_Delay: 0
SQL_Remaining_Delay: NULL
Slave_SQL_Running_State: Slave has read all relay log; waiting for more updates
Master_Retry_Count: 86400
Master_Bind:
Last_IO_Error_Timestamp:
Last_SQL_Error_Timestamp:
Master_SSL_Crl:
Master_SSL_Crlpath:
Retrieved_Gtid_Set:
Executed_Gtid_Set:
Auto_Position: 0
Replicate_Rewrite_DB:
Channel_Name:
Master_TLS_Version:
1 row in set (0.00 sec)
以上都是查看主从复制是否正常的方法,只要能看到上面标记青绿色的信息,就说明主从复制搭建成功了
主从复制异步存在的问题:
在MySQL5.5之前的版本中,MySQL的复制是异步复制,主库和从库的数据之间存在一定的延迟,比如网络故障等各种原因,这样子容易存在隐患就是:当在主库写入一个事务成功后并提交了,但是由于从库延迟没有及时得到主库推送的Binlog日志时,主库突然宕机了,那么此时从库就可能损失这个事务,从而造成主从不一致的状况。
因此我们MySQL5.5版本之后引入了半同步复制的概念,看下节文章