文章推荐

    记录一次服务器“卡死”故障的解决过程

    晚上8点多突然收到zabbix报警,服务器负载高,IO负载高。看到报警信息马上知道了,老问题又出现了上次的方法没能解决问题,故障回顾故障背景:系统:ubuntu14.04服务器:kvm虚拟机故障现象:1.系统存在大量僵死进程,kill-9杀不掉2.系统IO负载很高3.执行命令时,终端会卡死4.reboot无法正常重启服务器,只能杀虚拟机进程5.系统日志里有以下信息上次出现这个问题是3天前,当时网上

    系统/运维 2020-01-20 22:38 浏览(11 评论(0

    Apollo分布式配置中心简易环境部署

    Apollo(阿波罗)是携程框架部门研发的分布式配置中心,能够集中化管理应用不同环境、不同集群的配置,配置修改后能够实时推送到应用端,并且具备规范的权限、流程治理等特性,适用于微服务配置管理场景。github地址为:https://github.com/ctripcorp/apollo该项目提供了两种部署方式:本地部署和分布式部署。生产环境建议使用“分布式部署”。因最近项目有使用配置中心的需求,在

    系统/运维 2020-01-20 22:38 浏览(10 评论(0

    k8s原生的集群监控方案(Heapster+InfluxDB+Grafana)

    k8s原生的集群监控方案(Heapster+InfluxDB+Grafana)Heapster+InfluxDB+Grafana简介heapster是一个监控计算、存储、网络等集群资源的工具,以k8s内置的cAdvisor作为数据源收集集群信息,并汇总出有价值的性能数据(Metrics):cpu、内存、network、filesystem等,然后将这些数据输出到外部存储(backend),如Inf

    系统/运维 2020-01-20 22:38 浏览(10 评论(0

    OpenTSDB 2.3+及TCollector 1.3+安装配置排错

    其实不太想用opentsdb,一直以来用influxdb+grafana挺方便的,而且tsdb依赖hbase,虽说容量和速度有保证,但是分布式系统对于一个监控平台来说,终归还是有些重了,出问题定位更繁琐,但领导说用那就用吧。在这里必须吐一下OpenTSDB和Tcollector的文档更新,太落后,看官方文档根本找不到配置文件的位置。最后还得看源码,尤其是TCollector,这个tsdb官方推出的

    系统/运维 2020-01-20 22:38 浏览(7 评论(0

    K8S使用dashboard管理集群

    本文介绍dashboard的部署过程,dashboard的特点主要如下:1、能够直观的看到rc、deployment、pod、services等k8s组件的运行情况和日志信息。2、结合heapster和influxdb后,dashboard的监控图表上可以看到pod的cpu和内存消耗情况。之前介绍过在1.5.2版本上部署dashboard服务,在1.9.1版本离线部署中,也介绍过dashboard

    系统/运维 2020-01-20 22:38 浏览(9 评论(0

< 12345678 ...1112 >