MultEval 使用教程
2025-04-21 16:45:43作者:曹令琨Iris
1. 项目目录结构及介绍
MultEval 是一个用于评估机器翻译质量的工具,它可以从多个优化器运行结果中提供 BLEU、METEOR 和 TER 三种流行指标的分数,以及通过引导重采样得到的方差和通过近似随机化得到的 p 值。以下是 MultEval 的目录结构及其说明:
multeval/
├── example/ # 示例数据目录
├── lib/ # 存储库文件
├── reg-test/ # 测试用例目录
├── src/ # 源代码目录
├── .classpath # Eclipse 类路径配置文件
├── .gitignore # Git 忽略文件
├── .project # Eclipse 项目配置文件
├── .travis.yml # Travis CI 配置文件
├── CHANGELOG # 更改日志文件
├── LICENSE.txt # 许可证文件
├── README.md # 项目说明文件
├── build.xml # Ant 构建文件
├── constants # 常量文件
├── dist.sh # 分发脚本
├── get_deps.sh # 获取依赖脚本
├── multeval.sh # MultEval 主执行脚本
└── table.png # ASCII 表格示例图片
2. 项目的启动文件介绍
项目的启动主要通过 multeval.sh 脚本进行,该脚本位于项目根目录。以下是 multeval.sh 的基本使用方法:
./multeval.sh eval [选项]
其中 eval 是执行的模块,后面可以跟随多个选项来指定评估参数。例如:
./multeval.sh eval --refs example/refs.test2010.lc.tok.en.* --hyps-baseline example/hyps.lc.tok.en.baseline.opt --meteor.language en
这个命令将使用示例数据来评估一个系统,并输出 BLEU、METEOR 和 TER 分数。
3. 项目的配置文件介绍
MultEval 的配置主要通过命令行选项进行,但也有一些选项可以在配置文件中设置。以下是一些主要的配置文件及其说明:
.gitignore:此文件用于配置 Git 忽略规则,以避免将不必要的文件提交到版本库中。build.xml:Ant 构建文件用于定义项目的构建过程,包括编译、打包等步骤。multeval.sh:虽然不是传统意义上的配置文件,但该脚本中的默认参数和执行逻辑可以看作是项目的一部分配置。
在运行 multeval.sh 脚本时,可以通过命令行参数来调整配置,例如设置引导样本数量、指定语言模型等。具体的使用方法和可配置选项可以通过以下命令查看:
./multeval.sh eval
这将输出所有的命令行选项和它们的用途。
登录后查看全文
热门项目推荐
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0148- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
auto-devAutoDev 是一个 AI 驱动的辅助编程插件。AutoDev 支持一键生成测试、代码、提交信息等,还能够与您的需求管理系统(例如Jira、Trello、Github Issue 等)直接对接。 在IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。Kotlin03
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0111
项目优选
收起
暂无描述
Dockerfile
731
4.73 K
Ascend Extension for PyTorch
Python
609
786
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
1 K
1.01 K
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
433
392
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
145
237
Claude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed.
Get Started
Rust
1.15 K
148
暂无简介
Dart
983
250
Oohos_react_native
React Native鸿蒙化仓库
C++
347
401
昇腾LLM分布式训练框架
Python
166
197
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.67 K
985