TIDB 部署手册
部署
采用ansible方式部署,中控机可以是部署目标机器中的某一台。
中控机使用root安装包
yum -y install epel-release git curl sshpass
yum -y install python-pip
中控机配置
使用root用户
vi .pip/pip.conf
增加如下内容
[global]
timeout=60
index-url=http://yum.sfstg.com/pypi/root/pypi/+simple/
trusted-host=yum.sfstg.com
中控机升级pip版本
执行如下命令升级pip版本
pip install –U pip
中控机用户创建
useradd tidb
passwd tidb
配置 tidb 用户 sudo 免密码,将 tidb ALL=(ALL) NOPASSWD: ALL 添加到文件末尾即可。
# visudo
tidb ALL=(ALL) NOPASSWD: ALL
部署集群
部署安装包
需下载tidb-ansible-master安装包到本地环境home/tidb下面,使用tidb用户登录。
如下操作安装ansible
cd /home/tidb/tidb-ansible-master
sudo pip install -r ./requirements.txt
ansible --version
---无报错
在中控机上配置部署机器 ssh 互信及 sudo 规则
编辑host.ini, 增加集群IP, 集群ip为规划tidb集群的主机
$ cd /home/tidb/tidb-ansible-master
$ vi hosts.ini
[servers]
192.168.0.2
192.168.0.3
192.168.0.4
192.168.0.5
执行以下命令,按提示输入部署目标机器 root
用户密码。该步骤将在部署目标机器上创建 tidb
用户,并配置 sudo 规则,配置中控机与部署目标机器之间的 ssh 互信。
ssh-keygen -t rsa
ansible-playbook -i hosts.ini create_users.yml –k
ansible-playbook -i hosts.ini deploy_ntp.yml -k
在部署目标机器上安装 NTP 服务
分配机器资源,编辑 inventory.ini 文件
以 tidb 用户登录中控机,inventory.ini 文件路径为 /home/tidb/tidb-ansible-master/inventory.ini。
典型部署如下
[tidb_servers]
172.16.10.1
172.16.10.2
[pd_servers]
172.16.10.1
172.16.10.2
172.16.10.3
[tikv_servers]
TiKV1-1 ansible_host
TiKV1-2 ansible_host
TiKV2-1 ansible_host
TiKV2-2 ansible_host
TiKV3-1 ansible_host
TiKV3-2 ansible_host
[monitoring_servers]
172.16.10.1
[grafana_servers]
172.16.10.1
[monitored_servers]
172.16.10.2
172.16.10.3
172.16.10.4
172.16.10.5
172.16.10.6
[pd_servers:vars]
location_labels
各项参数含义参考附件
TiKV3-2
[pd_servers]—
Tikv3-2 ---tikv
ansible_host=172.16.10.6 –tikv
deploy_dir=/data1/deploy ---
[monitoring_servers]----
172.16.10.1
[monitored_servers]---
部署目录调整
部署目录通过 deploy_dir
变量控制,默认全局变量已设置为 /home/tidb/deploy
,对所有服务生效。如数据盘挂载目录为 /data1
,可设置为 /data1/deploy
,样例如下:
## Global variables
[all:vars]
deploy_dir = /data1/deploy
如为某一服务单独设置部署目录,可在配置服务主机列表时配置主机变量,以 TiKV 节点为例,其他服务类推,请务必添加第一列别名,以免服务混布时混淆。
TiKV1-1 ansible_host=172.16.10.4 deploy_dir=/data1/deploy
其他变量调整
注: 以下控制变量开启请使用首字母大写 True
,关闭请使用首字母大写 False
。
变量
含义
cluster_name
集群名称,可调整
tidb_version
TiDB 版本,TiDB-Ansible 各分支默认已配置
process_supervision
进程监管方式,默认为 systemd,可选 supervise
timezone
修改部署目标机器时区,默认为 Asia/Shanghai
,可调整,与set_timezone
变量结合使用
set_timezone
默认为 True,即修改部署目标机器时区,关闭可修改为 False
enable_firewalld
开启防火墙,默认不开启,如需开启,请将部署建议-网络要求 中的端口加入白名单
enable_ntpd
检测部署目标机器 NTP 服务,默认为 True,请勿关闭
set_hostname
根据 IP 修改部署目标机器主机名,默认为 False
dev_mode
当 dev_mode = True 时,Ansible 不去检测部署目录机器的 CPU,内存和磁盘性能,默认为 False
enable_binlog
是否部署 pump 并开启 binlog,默认为 False,依赖 Kafka 集群,参见zookeeper_addrs
变量
zookeeper_addrs
binlog Kafka 集群的 zookeeper 地址
enable_slow_query_log
TiDB 慢查询日志记录到单独文件({{ deploy_dir }}/log/tidb_slow_query.log),默认为 False,记录到 tidb 日志
deploy_without_tidb
KV 模式,不部署 TiDB 服务,仅部署 PD、TiKV 及监控服务,请将inventory.ini
文件中 tidb_servers 主机组 IP 设置为空。
alertmanager_target
可选:如果你已单独部署 alertmanager,可配置该变量,格式:alertmanager_host:alertmanager_port
grafana_admin_user
Grafana 管理员帐号用户名,默认为 admin
grafana_admin_password
Grafana 管理员帐号密码,默认为 admin,用于 Ansible 导入 Dashboard 和创建 API Key,如后期通过 grafana web 修改了密码,请更新此变量
collect_log_recent_hours
采集日志时,采集最近几个小时的日志,默认为 2 小时
enable_bandwidth_limit
在中控机上从部署目标机器拉取诊断数据时,是否限速,默认为 True,与 collect_bandwidth_limit 变量结合使用
collect_bandwidth_limit
在中控机上从部署目标机器拉取诊断数据时限速多少,单位: Kbit/s,默认 10000,即 10Mb/s,如果是单机多 TiKV 实例部署方式,需除以单机实例个数
检测环境
执行以下命令如果所有 server 返回 tidb 表示 ssh 互信配置成功。
ansible -i inventory.ini all -m shell -a 'whoami'
执行以下命令如果所有 server 返回 root 表示 tidb 用户 sudo 免密码配置成功
ansible -i inventory.ini all -m shell -a 'whoami' -b
初始化系统环境,修改内核参数
ansible-playbook bootstrap.yml
--以下报错可以忽略
ERROR MESSAGE SUMMARY ***************************************************************************************************************
[tidb149]: Ansible FAILED! => playbook: bootstrap.yml; TASK: check_system_optional : Preflight check - Check TiDB server's RAM; message: {"changed": false, "msg": "This machine does not have sufficient RAM to run TiDB, at least 16000 MB."}
部署 TiDB 集群软件并启动
ansible-playbook deploy.yml
ansible-playbook start.yml
部署完成
可以通过mysql客户端使用root免密登陆TIDB server 4000端口,使用mysql语法正常创建数据库及用户即可。