Sidekiq 执行 SLI(服务级别指标)
此 SLI 用于服务监控。但默认不用于阶段组的错误预算。
Sidekiq 执行 Apdex 测量成功作业的完成时长,作为应用性能的指标。
错误率测量发生异常时未成功作业的完成情况,作为服务器异常行为的指标。
-
gitlab_sli_sidekiq_execution_apdex_total:此计数器会在每次成功执行且不产生异常的作业时递增。它确保慢速作业不会被重复计数,因为该作业已在错误 SLI 中计数。 -
gitlab_sli_sidekiq_execution_apdex_success_total:此计数器会在每次成功执行且速度快于根据作业紧急程度定义的目标时长的作业时递增。 -
gitlab_sli_sidekiq_execution_error_total:此计数器会在每次遇到异常的作业时递增。 -
gitlab_sli_sidekiq_execution_total:此计数器会在每次作业执行时递增。
这些计数器带有以下标签:
-
worker:工作器的标识。 -
feature_category:为该工作器指定的功能类别。 -
urgency:为该工作器指定的紧急程度属性。 -
external_dependencies:基于外部依赖属性的布尔值yes或no。 -
queue:作业正在运行的队列。
有关这些 SLI 的更多信息,请参阅 runbooks 中的 Sidekiq SLI 文档。
调整作业紧急程度
并非所有工作器都执行相同类型的工作,因此可以为不同的作业定义不同的紧急程度级别。紧急程度较低的作业可以比高紧急程度的作业有更长的执行时长。
有关执行延迟要求和如何设置作业紧急程度的更多信息,请参阅 Sidekiq 工作器属性页面。
错误预算归属和所有权
此 SLI 用于服务级别监控。它提供数据给阶段组的错误预算。
此 SLI 的工作器根据其声明的功能类别为组的错误预算提供数据。
要了解哪些工作器包含在您的组中,请查看您组的组仪表板上的 Sidekiq 完成率面板。在预算归属行中,Sidekiq 执行 Apdex 日志链接会向您显示有多少作业未达到 10 秒或 300 秒的目标。
带有外部依赖的作业
带有外部依赖的作业被排除在 Apdex 和错误率计算之外。