Wetts's blog

Stay Hungry, Stay Foolish.

0%

微服务设计-第8章-监控

对于每个服务而言:

  • 最低限度要跟踪请求响应时间。做好之后,可用开始跟踪错误率及应用程序级的指标。
  • 最低限度要跟踪所有下游服务的健康状态,包括下游调用的响应时间,最好能够跟踪错误率。
  • 标准化如何收集指标以及储存指标。
  • 如果可能的话,以标准的格式将日志记录到一个标准的位置。如果每个服务各自使用不同的方式,聚合会非常痛苦。

对系统而言:

  • 聚合CPU之类的主机层级的标准及应用程序级指标。
  • 确保你选用的指标储存工具可用在系统和服务级别做聚合,同时也允许你查看单台主机的情况。
  • 确保指标存储工具允许你维护数据足够长的时间,以了解你的系统的趋势。
  • 使用单个可查询工具来对日志进行聚合和存储。
  • 强烈考虑标准化关联标示的使用。
  • 了解什么样的情况需要行动,并根据这些信息构造相应的警报和仪表盘。
  • 调查对各种指标聚合方式做统一化的可能性。