[Aquila] 针对 aquila pod ${pod name} memory is too high 的几种解决方式

  使用配置
内容纲要

概要描述


在安装了 Aquila 的集群中,可能会经常遇到 aquila pod ${pod name} memory is too high, comes to {value} % of limit memory 的告警,本文针对该告警提出几种解决方式。

file

详细说明


  • 修改告警指标
    目前 Aquila 用的 container_memory_usage_bytes 这个指标还包含了 cache 使用量,会有虚高的现象。可以将相关服务的内存告警指标修改为 container_memory_working_set_bytes,然后查看告警是否还有。

    比如本例中是 Prometheus 的 pod 告警,那么就修改 AQUILA 告警规则 里的 aquila_pod_内存_使用里的指标。

    file

  • 增大 Prometheus 采集抓取间隔
    Manager 页面搜索 Aquila 的参数配置关键字 ‘scrape_interval’,调大相应的值,比如 15–>30, 30 –>45

    file
    然后页面右上角配置服务,重启 Prometheus 角色。

  • 增大相关组件角色的 container.limits.memory 限制
    比如本例中是 Prometheus 的 pod 告警,那就调大 prometheus.container.limits.memory.

    file
    然后页面右上角配置服务重启对应的角色。

这篇文章对您有帮助吗?

平均评分 0 / 5. 次数: 0

尚无评价,您可以第一个评哦!

非常抱歉,这篇文章对您没有帮助.

烦请您告诉我们您的建议与意见,以便我们改进,谢谢您。