内容纲要
概要描述
客户更换kong包之后上线的sophon api状态不稳定,换包前上线的api状态正常,上线的api代码以及配置完全一样。
详细说明
上线后的api连接状态不稳定,时而连接成功,时而失败:
kong的error日志里有拒绝连接的报错:
测试了实例deploy到kong所在服务器,都能ping通:
Kong所在节点ping实例的4个pod以及svc,也都是通的:
后发现环境的容器网络的pod通过svc,只能curl到本节点的pod,其他节点的pod访问不到:
之所以有一个实例连接可以成功,是因为该实例和kong分布在一个节点,只要pod不跟kong在一个节点,都会有问题,跨节点的svc都不能访问。
查看客户设置了一些iptables路由规则,怀疑是这些规则的问题。
备份所有节点路由规则后清空,重启下tos proxy后恢复:
iptables-save > /root/iptables.txt
iptables -F
mv /opt/kubernetes/manifests-multi/tos-proxy.manifest /tmp/
等待20s以上
mv /tmp/tos-proxy.manifest /opt/kubernetes/manifests-multi/