監控Agent自動退出如何處理
更新時間 2024-11-13 20:17:04
最近更新時間: 2024-11-13 20:17:04
分享文章
背景信息
為避免監控服務對您的資源使用造成影響,當監控Agent占用資源超過閾值時,監控Agent將自動退出。本文將介紹當主機監控Agent自動退出時的解決方法。
操作步驟
Linux系統
1.以root用戶登錄云主機。
2.執行以下命令,在dmesg日志中,查看telegraf相關日志。
dmesg | grep telegraf
如果文件dmesg中的日志出現Memorycgroup out of memory字樣,則說明資源消耗超過閾值,例如:
3.在云主機監控Agent服務所在目錄/usr/lib/systemd/system/(ubuntu系列發行版 /etc/systemd/system/)中,修改文件telegraf.service中資源限制相關參數。
1)執行以下命令,修改目錄/usr/local/cloudmonitor/local_data中的文件agent.properties。
cd /usr/lib/systemd/system/
vi telegraf.service
請您根據實際資源占用情況設置資源限制參數,以下數據僅做參考:
- CPU限制為單核10%。CPUShares=1024
- 內存限制,單位為MB。MemoryLimit=200M
2)按Esc鍵,輸入:wq,再按Enter鍵,保存并退出文件telegraf.service。
4.執行以下命令,重新加載云主機監控Agent服務配置文件telegraf.service。
systemctl daemon-reload
5.執行以下命令,重啟云主機監控Agent。
systemctl?restart?telegraf