内容纲要
概要描述
部分客户的集群环境物理隔离,日常运维时无法将集群巡检日志等文件直接取出提供给星环科技。
为了更好对有高安全要求的客户提供服务,获取客户的集群基本信息,星环科技发布了新版本巡检工具,可以在生成Excel格式的巡检日志的同时,同步生成集群信息的二维码文件。通过解析二维码文件,可以获得集群的基本信息。
本文主要介绍如何安装、部署、使用新版本巡检工具收集集群信息。
详细说明
新版本巡检工具不依赖于Manager组件,有独立的Web服务。
支持环境:
- TDH 5.1.2及以上版本;
- TDC 2.x, 3.x;
优缺点:
- 支持TDC;
- 支持使用二维码存储集群基本信息;
- 支持收集告警信息
- 支持收集集群补丁信息
- –––
- 需要在集群上独立部署
- 使用独立的Web服务,会额外占用部分资源
- 在集群部署后,需要记住部署位置,以便维护
一、安装部署
推荐将新版巡检工具安装在 TDH Manager 节点 或 TDC Master 节点上。
本文以在TDH上安装2.1.10版本巡检工具为例(inspection-web-2.1.10-full.tar.gz,551M)
- 根据自己的集群环境信息,点击下载最新版巡检工具对应的架构版本:x86 / ARM
- SSH登录到 TDH Manager 或 TDC Master 节点,在其上寻找一剩余空间 > 10G 的分区所在目录,例如
/home
目录,用于安装巡检工具; - 将步骤1中下载的巡检工具文件上传到步骤2中用于安装巡检工具的目录中;
- 解压:
tar zxvf inspection-web-2.1.10-full.tar.gz
,系统会将巡检工具解压到当前目录的inspection-web
目录下:# tar zxvf inspection-web-2.1.10-full.tar.gz
- 确保本机7769端口未被占用(巡检工具默认使用7769端口,若已被使用,可以编辑 ./inspection-web/config/application.yml 修改端口);
# netstat -anp |grep 7769
- 进入
inspection-web
目录,运行./run.sh
,启动巡检工具;# cd inspection-web # ./run.sh
- 系统加载巡检工具,看到类似下图信息,表示巡检工具加载成功:
若需要停止巡检工具,直接按 Ctrl+C 键终止运行即可
二、使用巡检工具
巡检工具加载后,即可使用巡检工具。
若巡检服务手动停止后,可以进入巡检工具安装目录,运行 ./run.sh
,重新启动巡检工具。
- 在浏览器中,输入 一.7 图中External地址(例如 http://192.168.50.51:7769/ ),打开巡检工具页面(建议将其添加为浏览器书签,方便日后使用)。巡检工具会自动检测并提示检测到TDH集群或TDC集群:
- 对于TDH集群,点击 TDH 图标,首次使用时,需要确认配置:
- 点击 校验 按钮,校验成功后(若用户inspector无法校验成功,则可以使用Manager的admin用户尝试,一般可以成功),可以开始巡检。如下图,点击 立即巡检,开始巡检;
- 稍等片刻,至巡检完成
- 巡检完成后,可以点击左侧的 产品拓扑 / Patch检查 / 异常告警 / 巡检二维码 等页面,查看巡检结果;
- 点击左侧的 历史报告,可以下载巡检输出(一般为zip文件),然后将最新的巡检结果(zip文件)发给星环科技;
- 若您的环境无法将文件取出(即第6步无法完成),则您可以访问 巡检二维码 页面,将所有二维码拍照片后发给星环科技。
三、维护集群信息
可以使用Success客户服务平台维护自己的集群信息,参照:星环Success客户服务平台使用指南。
- 准备好下载到的巡检工具输出文件,一般为zip文件(例如apk.zip);
- 登录 Success平台;
- 访问 集群管理,在该页面,点击 上传集群信息 按钮;
- 在上传集群信息页面,选择集群所属的 最终用户 名称,以及巡检工具输出文件;
(若无法选择到目标最终用户,可能账号无该最终用户的维护权限,可以 联系星环售后技术支持 寻求帮助)
- Success集群管理系统会解析上传的文件,自动新建或更新集群信息;;
Success平台详细情况,请参考星环Success客户服务平台使用指南。
使用新版巡检工具,或者维护集群信息时,遇到任何问题,可以 联系星环售后技术支持 寻求帮助。