概要说明
集群升级是一项影响巨大的工作,升级集群的第一步就是升级Manager,本文介绍一些升级Manager之前的环境检查,本文适用版本: 5.X~7.X
详细说明
从5.X集群开始,Manager升级跟TOS的升级是绑定的,二者的升级过程步骤繁多,在正式进行升级之前先进行本文的检查可以发现并规避一些问题。
本文所有的介绍都是以CentOS系统为基础,其余操作系统的集群使用的命令会有所区别。
1、升级之前的检查
- 检查manager相关的rpm包是否有缺失:
rpm -qa | grep transwarp-manager
rpm -qa | grep -i mariadb
接下来用rpm -V 来检验上述rpm包是否有缺失。
- 检查是否更换过jar包,如果有,可能会导致升级过程中启动manager/agent失败
ll /usr/lib/transwarp-manager/master/lib/ | grep transwarp-manager
ll /usr/lib/transwarp-manager/agent/lib/ | grep transwarp-manager
ll /usr/lib/transwarp-manager/common/lib/ | grep transwarp-manager
-
检查是否开启了HA、改了默认端口、使用了https,后两项如果不是默认都会导致升级脚本失败,开启HA并不会影响升级
cat /etc/transwarp-manager/master/application.conf | grep -i ha.enabled cat /etc/transwarp-manager/master/application.conf | grep -i server.port cat /etc/transwarp-manager/master/application.conf | grep -i ssl-encryption
-
检查是否有回滚脚本,可以证明集群是否已经升级过,回滚脚本存在可能会导致无法执行升级脚本
ls /usr/lib/transwarp-manager/rollback_manager_*
-
检查jdk版本,如果跟当前集群使用的默认jdk版本不同,有可能造成升级问题;还有默认的jdk文件夹、软链接也是
java -version ll /usr/java
manager-6.0.1812a-final以及之前版本默认是JDK 1.7
manager-6.0.1905a-final以及之后版本默认是JDK 1.8 -
Manager 7.X开始不再提供 tos df的包,所以如果当前集群安装了tos df master或者df slave,那么在升级到manager 7.X 之前需要删除掉,否则升级会报错
2、提前做升级脚本中的环境检查步骤
如果条件允许,最好可以在正式开始升级之前先做checkEnvironment步骤
命令格式如下:
bash UpgradeManager.sh checkEnvironment
该命令只做环境检查不做任何升级操作,这可以提前发现很多环境问题
PS: 5.X版本UpgradeManager.sh在Basic安装包中,6.X版本开始UpgradeManager.sh在Manager安装包中。
3、关于repo源
在目录/etc/yum.repos.d下的源,最好只保留TDH安装时候建立的os.repo跟transwarp.repo,其他repo最好先删除,升级完成之后再恢复。
os源 :
升级时候其实没有用到这个源,就算是删除掉也没有问题的,只要改一下环境检查脚本即可 ,参考SLA-4544
可以缺,但是绝对不可以改成其他的源,万一跟TDH的源重复或者冲突了就会严重的问题,参考: SLA-4410
所以最好还是默认的
transwarp源:
如果这个源不是默认的源的话,很有可能会有问题