Help us learn about your current experience with the documentation. Take the survey.

机器学习模型实验

  • Tier: 免费版、高级版、旗舰版 (Free, Premium, Ultimate)
  • Offering: GitLab.com、GitLab 自托管、GitLab 专用版 (GitLab.com, GitLab Self-Managed, GitLab Dedicated)

在创建机器学习模型时,您可能会尝试不同的参数、配置和特征工程来提升模型性能。为了日后能够复现这些实验,您需要有效地跟踪元数据和产物。使用 GitLab 模型实验来直接将参数、指标和产物记录到 GitLab 中。

什么是实验?

在项目中,实验是一组可比较的模型运行的集合。实验可以是长期的(例如,当它们代表一个用例时),也可以是短期的(由合并请求触发的超参数调优结果),但通常包含具有相似参数集的模型运行,这些参数通过相同的指标进行测量。

List of experiments

模型运行

模型运行是机器学习模型训练的一种变体,最终可以提升为模型的版本。

Experiment run list table with run ID, creation timestamps, creator name, and status.

数据科学家的目标是找到参数值能带来最佳模型性能的模型运行,这由给定的指标来体现。

Experiment details and metadata page showing ML flow run ID, source information, and parameters.

一些示例参数:

  • 算法(如线性回归或决策树)。
  • 算法的超参数(学习率、树深度、周期数)。
  • 包含的特征。

跟踪新实验和运行

实验和试验只能通过 MLflow 客户端兼容性来跟踪。有关如何使用 GitLab 作为 MLflow 客户端后端的更多信息,请参阅 MLflow 客户端兼容性

探索模型运行

要列出当前活动的实验,请访问 https/-/ml/experiments 或:

  1. 在左侧边栏,选择 搜索或转到 并找到您的项目。
  2. 选择 分析 > 模型实验
  3. 要显示所有已记录的运行及其指标、参数和元数据,请选择一个实验。
  4. 要显示运行的详细信息,请选择 详情

查看日志产物

试验产物被保存为包。在为运行记录产物后,所有为该运行记录的产物都会列在包注册表中。运行的包名称为 ml_experiment_<experiment_id>,其中版本是运行 IID。产物的链接也可以从 实验运行 列表或 运行详情 中访问。

查看 CI 信息

您可以将运行与创建它们的 CI 作业关联,从而可以快速访问触发该管道的合并请求、管道和用户:

CI information in run detail

查看已记录的指标

当您运行实验时,GitLab 会记录某些相关数据,包括其指标、参数和元数据。您可以在图表中查看这些指标进行分析。

要查看已记录的指标:

  1. 在左侧边栏,选择 搜索或转到 并找到您的项目。
  2. 选择 分析 > 模型实验
  3. 选择您要查看的实验。
  4. 选择 性能 选项卡。

A graph of an experiment’s performance