CK（MLCommons）开源项目安装与使用指南

2026-01-19 11:18:42作者：谭伦延

A technology-agnostic and non-intrusive toolset to automate development, benchmarking, optimization, comparison and deployment of complex computer systems and applications across rapidly evolving software, hardware, models and data from different vendors and users

项目地址：https://gitcode.com/gh_mirrors/ck1/ck

项目概述

CK，全称为Machine Learning Commons，是由MLCommons组织维护的一个开源框架，旨在促进机器学习的可移植性、可复现性和效率。本指南基于MLCommons/ck仓库，将引导您了解其基本结构、关键启动文件以及配置文件的使用。

1. 项目目录结构及介绍

CK项目遵循模块化的设计原则，其目录结构大致如下：

.
├── ck                    # 核心库和工具
│   ├── env               # 环境相关配置
│   ├── repo               # 不同机器学习领域的组件仓库
│   ├── script            # 脚本和辅助工具
│   └── ...               # 其它核心组件
├── docs                  # 文档
├── license.txt           # 许可证文件
├── tests                 # 测试文件和案例
├── CONTRIBUTING.md       # 贡献指南
└── README.md             # 主要的读我文件

ck: 包含了CK的核心部分，如环境管理器和组件仓库。
- env: 提供不同的运行环境配置。
- repo: 存放各种机器学习模型、数据集和其他组件。
docs: 相关技术文档和用户指南。
tests: 用于测试代码的完整性与功能。
CONTRIBUTING.md 和 README.md: 分别是贡献指导和项目简介。

2. 项目的启动文件介绍

CK项目不是一个单一应用，而是由多个组件和环境组成的生态系统。因此，并没有一个统一的“启动文件”。使用CK时，主要是通过命令行接口执行特定的“CK entry points”或脚本来激活组件和实验。例如，开始一个新的实验可能涉及调用类似ck run program:<program_name>的命令，这里的<program_name>是你想要执行的具体程序或实验名称。

3. 项目的配置文件介绍

CK利用JSON格式的配置文件来定制各个组件的行为和依赖。这些配置通常分散在各个组件内部或者作为环境变量指定。每个组件在其.json描述文件中定义了自己的要求和依赖项，比如repo.json和meta.json文件。用户可以通过修改这些文件或使用CK提供的API在运行时进行参数调整。

示例配置片段

假设我们要配置一个实验，可能会涉及到编辑或指定的简单配置示例：

{
    "dependencies": {
        "dataset": {
            "local": "path/to/your/dataset",
            "repo": "mlperf-inference",
            "checksum": "optional-sha-hash"
        },
        "model": {
            "local": "",
            "remote": "url-to-model-archive",
            "repo": "mlcommons-harware",
            "version": "{tag}"
        }
    },
    "env": {
        "CK_CAFFE_ROOT": "{INSTALL_PATH}",
        "CK_ENV_LIBRARY_OPENBLAS": "{PACKAGE_DIR}"
    }
}