内容纲要
问题描述
本文描述TDC云平台关机,再开机的整体操作注意事项
详细描述
关机
1 先tcc检测实例运行正常后,关闭实例,确认停止状态
tcc页面上手动将所有的实例进行关闭
2 备份tdcsys namespace下的txsql(mysqldump方式)
确认主节点
确认txsql的流水
挑选流水最大的节点进行txsql数据库整库备份
账号密码可以在pod里的/etc/txsql1/conf/db.properties找到信息
备份之后可以将alldata.sql 拷贝到容器外服务器上,进行多个备份
3 备份kube-system下etcd(使用snapshot和备份数据文件目录)
查看集群是否健康,除非有特殊情况,否则3个节点一定都要健康状态
endpoints 连接串可以通过/opt/kubernetes/manifests-multi/kube-apiserver.manifest获取
ETCDCTL_API=3 etcdctl --cacert /srv/kubernetes/etcd-ca.pem --cert /srv/kubernetes/etcd.pem --key /srv/kubernetes/etcd-key.pem --endpoints https://NODE01:2379,https://NODE02:2379,https://NODE03:2379 endpoint health
确认下集群是否只有一个 leader, 防止出现脑裂集群
使用 snapshot 进行备份(在第一台master节点上) 参考命令
mkdir -p /opt/backup/etcd/
ETCDCTL_API=3 etcdctl --cacert /srv/kubernetes/etcd-ca.pem --cert /srv/kubernetes/etcd.pem --key /srv/kubernetes/etcd-key.pem --endpoints https://NODE01:2379,https://NODE02:2379,https://NODE03:2379 snapshot save /opt/backup/etcd/backup-$(date +'%Y-%m-%d-%H-%M-%S').db
4 备份apacheds数据
kubectl cp -n tdcsys apacheds-master-cq6x9-0:/var/lib/guardian-apacheds/data /tmp/data
5 关闭服务器,先关闭工作节点,再关闭主节点
开机
1 开启服务器后,每个节点执行
systemctl restart warpdrive