Cloud Insight 是一个数据管理平台,支持 Mesos 的监控。提供数据聚合、过滤、分组的功能,让用户能够在集群环境中,了解 Mesos 运行整体情况,迅速做出判断。

免费注册 查看 DEMO

支持指标

Cloud Insight Mesos 监控,默认监控以下性能指标:

  • mesos.cluster.cpus_percent
  • mesos.cluster.cpus_total
  • mesos.cluster.cpus_used
  • mesos.cluster.disk_percent
  • mesos.cluster.disk_total
  • mesos.cluster.disk_used
  • mesos.cluster.dropped_messages
  • mesos.cluster.event_queue_dispatches
  • mesos.cluster.event_queue_http_requests
  • mesos.cluster.event_queue_messages
  • mesos.cluster.frameworks_active
  • mesos.cluster.frameworks_connected
  • mesos.cluster.frameworks_disconnected
  • mesos.cluster.frameworks_inactive
  • mesos.cluster.invalid_framework_to_executor_messages
  • mesos.cluster.invalid_status_update_acknowledgements
  • esos.cluster.invalid_status_updates
  • mesos.cluster.mem_percent
  • mesos.cluster.mem_total
  • mesos.cluster.mem_used
  • mesos.cluster.outstanding_offers
  • mesos.cluster.recovery_slave_removals
  • mesos.cluster.slave_registrations
  • mesos.cluster.slave_removals
  • mesos.cluster.slave_reregistrations
  • mesos.cluster.slave_shutdowns_canceled
  • mesos.cluster.slave_shutdowns_scheduled
  • mesos.cluster.slaves_active
  • mesos.cluster.slaves_connected
  • mesos.cluster.slaves_disconnected
  • mesos.cluster.slaves_inactive
  • mesos.cluster.tasks_error
  • mesos.cluster.tasks_failed
  • mesos.cluster.tasks_finished
  • mesos.cluster.tasks_killed
  • mesos.cluster.tasks_lost
  • mesos.cluster.tasks_running
  • mesos.cluster.tasks_staging
  • mesos.cluster.tasks_starting
  • mesos.cluster.total_frameworks
  • mesos.cluster.valid_framework_to_executor_messages
  • mesos.cluster.valid_status_update_acknowledgements
  • mesos.cluster.valid_status_updates
  • mesos.registrar.queued_operations
  • mesos.registrar.registry_size_bytes
  • mesos.registrar.state_fetch_ms
  • mesos.registrar.state_store_ms
  • mesos.registrar.state_store_ms.count
  • mesos.registrar.state_store_ms.max
  • mesos.registrar.state_store_ms.min
  • mesos.registrar.state_store_ms.p50
  • mesos.registrar.state_store_ms.p90
  • mesos.registrar.state_store_ms.p95
  • mesos.registrar.state_store_ms.p99
  • mesos.registrar.state_store_ms.p999
  • mesos.registrar.state_store_ms.p9999
  • mesos.role.cpu
  • mesos.role.disk
  • mesos.role.frameworks.count
  • mesos.role.mem
  • mesos.role.weight
  • mesos.slave.cpus_percent
  • mesos.slave.cpus_total
  • mesos.slave.cpus_used
  • mesos.slave.disk_percent
  • mesos.slave.disk_total
  • mesos.slave.disk_used
  • mesos.slave.executors_registering
  • mesos.slave.executors_running
  • mesos.slave.executors_terminated
  • mesos.slave.executors_terminating
  • mesos.slave.frameworks_active
  • mesos.slave.invalid_framework_messages
  • mesos.slave.invalid_status_updates
  • mesos.slave.mem_percent
  • mesos.slave.mem_total
  • mesos.slave.mem_used
  • mesos.slave.recovery_errors
  • mesos.slave.tasks_failed
  • mesos.slave.tasks_finished
  • mesos.slave.tasks_killed
  • mesos.slave.tasks_lost
  • mesos.slave.tasks_running
  • mesos.slave.tasks_staging
  • mesos.slave.tasks_starting
  • mesos.slave.valid_framework_messages
  • mesos.slave.valid_status_updates
  • mesos.stats.elected
  • mesos.stats.registered
  • mesos.stats.system.cpus_total
  • mesos.stats.system.load_15min
  • mesos.stats.system.load_1min
  • mesos.stats.system.load_5min
  • mesos.stats.system.mem_free_bytes
  • mesos.stats.system.mem_total_bytes
  • mesos.stats.uptime_secs

简易安装

想要可视化 Mesos 的性能,往往需要自建运维系统:利用 Zabbix 等开源工具搭建运维监控平台。这往往意味着大量的工作,以及繁琐的调试过程。

而报警、指标的运算、不同主机间数据的聚合,以及自定义指标的可视化,都需要对接新的开源工具。从而,更多的时间成本和人力成本,会投入进来。

Cloud Insight 探针的安装只需一条指令,且提供 Puppet 对探针进行批量处理。监控 Mesos 也只需开启 Mesos 配置文件。过程十分简单。

而且,Cloud Insight 数据的自动抓取和上传,以及丰富的可视化效果,再加上多渠道的报警。让您免于自建运维监控系统的困扰。

数据管理

Cloud Insight 数据管理功能,能够针对集群中,不同主机的 Mesos 性能指标,进行聚合、过滤、分组。

通过简单的指标查询,能够快速了解分属于不同功能模块、地域、网段的 Mesos 的性能的最大值、平均值、最小值。让运维工作更简单、更敏捷。

开启 Mesos 监控

1. 编辑 Master 配置文件

在 Master 节点,编辑配置文件 conf.d/mesos_master.yaml,使 Cloud Insight Agent 可以与 Mesos Master API 通信。

init_config:
default_timeout: 5
instances:
# url: the API endpoint of your Mesos
master
- url: https://server:port

2. 重启 Agent

重启 OneAPM Cloud Insight Agent,使配置生效。

3. 编辑 Slave 配置文件

在 Master 节点,编辑配置文件 conf.d/mesos_slave.yaml,使 Cloud Insight Agent 可以与 Mesos Slave API 通信。

init_config:
default_timeout: 5
instances:
# url: the API endpoint of your Mesos slave
- url: https://server:port
# tasks: Task's names to monitor
tasks:
- Hello

4. 重启 Agent

重启 OneAPM Cloud Insight Agent,使配置生效。

一个为程序员而生的产品
一次改变开发习惯的机遇