文章推荐

    k8s原生的集群监控方案(Heapster+InfluxDB+Grafana)

    k8s原生的集群监控方案(Heapster+InfluxDB+Grafana)Heapster+InfluxDB+Grafana简介heapster是一个监控计算、存储、网络等集群资源的工具,以k8s内置的cAdvisor作为数据源收集集群信息,并汇总出有价值的性能数据(Metrics):cpu、内存、network、filesystem等,然后将这些数据输出到外部存储(backend),如Inf

    系统/运维 2020-01-20 22:38 浏览(259 评论(0

    OpenTSDB 2.3+及TCollector 1.3+安装配置排错

    其实不太想用opentsdb,一直以来用influxdb+grafana挺方便的,而且tsdb依赖hbase,虽说容量和速度有保证,但是分布式系统对于一个监控平台来说,终归还是有些重了,出问题定位更繁琐,但领导说用那就用吧。在这里必须吐一下OpenTSDB和Tcollector的文档更新,太落后,看官方文档根本找不到配置文件的位置。最后还得看源码,尤其是TCollector,这个tsdb官方推出的

    系统/运维 2020-01-20 22:38 浏览(141 评论(0

    记录一次服务器“卡死”故障的解决过程

    晚上8点多突然收到zabbix报警,服务器负载高,IO负载高。看到报警信息马上知道了,老问题又出现了上次的方法没能解决问题,故障回顾故障背景:系统:ubuntu14.04服务器:kvm虚拟机故障现象:1.系统存在大量僵死进程,kill-9杀不掉2.系统IO负载很高3.执行命令时,终端会卡死4.reboot无法正常重启服务器,只能杀虚拟机进程5.系统日志里有以下信息上次出现这个问题是3天前,当时网上

    系统/运维 2020-01-20 22:38 浏览(166 评论(0

    Apollo分布式配置中心简易环境部署

    Apollo(阿波罗)是携程框架部门研发的分布式配置中心,能够集中化管理应用不同环境、不同集群的配置,配置修改后能够实时推送到应用端,并且具备规范的权限、流程治理等特性,适用于微服务配置管理场景。github地址为:https://github.com/ctripcorp/apollo该项目提供了两种部署方式:本地部署和分布式部署。生产环境建议使用“分布式部署”。因最近项目有使用配置中心的需求,在

    系统/运维 2020-01-20 22:38 浏览(155 评论(0

    Docker(六):Docker 三剑客之 Docker Swarm

    实践中会发现,生产环境中使用单个Docker节点是远远不够的,搭建Docker集群势在必行。然而,面对Kubernetes,Mesos以及Swarm等众多容器集群系统,我们该如何选择呢?它们之中,Swarm是Docker原生的,同时也是最简单,最易学,最节省资源的,比较适合中小型公司使用。DockerSwarm介绍Swarm在Docker1.12版本之前属于一个独立的项目,在Docker1.12版

    系统/运维 2020-01-20 22:38 浏览(142 评论(0