2022年8月

last\w确定重启时间/var/log/messagesdmesg -d -Tjournalctl -k --listjournalctl -k -l 重启前的日志号如果以上都看不出任何问题的话,可能是别的一些棘手的情况,比如这次遇到的就是内核上的bug,messages日志无异常且journalctl丢失重启前的所有日志

某应用的两台机器8088不通,8080通,检查情况登上这两台机器,互telnet,不通,这两台机器在同一网段,说明不是外部防火墙权限问题。lsof -i查看,8088有应用在监听,iptables --list -n | grep 8088未找到规则,8080的有,vi /etc/sysconfig/iptables ,把8080的规则复制一份给8088加上,重启iptables,问题解决

prometheus上线一个应用,部分监控报Multiple Series Error,检查后考虑对象可能一台机器就可以报集群内所有机器信息,于是只保留一台,下架多余的机器监控。下架后部分数据恢复,但是仍有一些监控项报Multiple Series Error手动执行promQL,发现数据获取正常,考虑可能是旧错误数据干扰,勾选instant后恢复正常

项目地址实现功能日志收集监控日志文件,将其新数据通过kafka中转存储在ES中目前实现的特性:实时从etcd获取最新配置,动态管控当前监听的对象根据ip自动获取不同的配置,方便进行区分动态创建ES index,无需提前手动创建监控数据收集运行你自定义的监控脚本,收集其数据并存储在influxdb中,方便后续的引用或者展示代码文件中已包含一个示例test_moni.go,以其为例

value, ok := x.(T)如果x的类型是T或者接口符合T,则会返回x的值和一个bool判断