Help us learn about your current experience with the documentation. Take the survey.

阶段组仪表板

我们生成了许多仪表板,作为我们用来监控 GitLab.com 指标的窗口。我们的大多数仪表板都是从 runbooks 仓库 中的 Jsonnet 生成的。任何人都可以贡献这些内容,添加新的仪表板或修改现有的仪表板。

当为您的阶段组添加新仪表板时,使用 stage_group:<group name> 标记它们,可以将仪表板与其他具有相同标记的仪表板交叉链接。您可以在 dashboards/stage-groups 目录中创建阶段组仪表板。目录嵌套不能超过一层深度。

要查看您的阶段组的所有仪表板列表:

  1. 在 Grafana 中,转到 Dashboard browser
  2. 要查看特定组的所有仪表板,筛选 stage_group:<group name>

一些已生成的仪表板已经可用:

  1. 阶段组仪表板:一个可定制的仪表板,每个组都有定制的指标。
  2. 错误预算详情仪表板:一个允许探索错误预算随时间和多个 SLI 消耗情况的仪表板。

时间范围控制

包含绝对和相对时间范围选项的时间范围选择菜单。

默认情况下,所有时间都使用 UTC 时区。 我们在工程沟通中使用 UTC。

GitLab 生产系统中记录的所有指标都有 一年保留期

您也可以直接在图表上放大和过滤时间范围。更多信息,请参阅 Grafana 时间范围控制 文档。

过滤器和注释

在每个仪表板的顶部,有两个过滤器和一些注释开关。

一些特殊事件对开发和运营活动有意义。 Grafana 注释 直接在图表上标记它们。

仪表板过滤器和注释开关。

名称 类型 描述
PROMETHEUS_DS 过滤器 过滤选择性的 Prometheus 数据源。默认值是 Global,它聚合所有可用数据源的数据。大多数情况下,您不需要关心这个过滤器。
environment 过滤器 过滤指标获取的环境。默认设置是生产环境(gprd)。其他选项,请参见 生产环境映射
stage 过滤器 按阶段过滤指标:main 或金丝雀环境的 cny。默认是 main
deploy 注释 标记 GitLab.com SaaS 平台上的部署事件。
canary-deploy 注释 标记 GitLab.com SaaS 平台上的 金丝雀部署 事件。
feature-flags 注释 标记功能标志更新的时间点。

功能标志注释在仪表板面板上显示的示例:

注释