Argilla v2.8.0版本发布：增强OAuth集成与多语言支持

2025-06-13 09:11:02作者：齐添朝

Argilla是一个开源的机器学习数据标注平台，专注于为自然语言处理（NLP）任务提供高效的数据标注和管理解决方案。它允许团队协作标注文本数据，支持多种NLP任务类型，如文本分类、命名实体识别等。

核心更新：更灵活的OAuth集成

v2.8.0版本显著改进了OAuth集成能力，使系统能够支持更多身份验证提供商。现在，用户可以通过简单的配置扩展支持的OAuth提供商，而不仅限于默认选项。

在配置文件中，开发者可以添加自定义的社交认证后端类。例如，要添加Apple ID作为认证提供商，只需在配置中添加相应条目：

providers:
  - name: apple-id
    client_id: "<client_id>"
    client_secret: "<client_secret>"

extra_backends:
    - social_core.backends.apple.AppleIdAuth

这种设计使得集成新的OAuth提供商变得非常简单，只需几行配置即可完成。同时，系统现在默认支持KeyCloak单点登录(SSO)功能，为企业用户提供了更便捷的身份验证选择。

重要改进与修复

PostgreSQL兼容性修复：解决了在使用PostgreSQL数据库时可能出现的错误，提升了系统的稳定性。
基础URL重定向优化：当定义了ARGILLA_BASE_URL环境变量时，系统现在能够正确处理斜杠重定向，避免了潜在的URL解析问题。
数据集设置获取改进：修复了在使用client.datasets.list()方法时无法获取数据集设置的问题，提高了API的可用性。
Elasticsearch SSL验证支持：在Helm部署中增加了对Elasticsearch SSL验证的配置选项，增强了安全性。
多语言支持增强：新增了日语翻译，使日本用户能够获得更好的本地化体验。

技术实现细节

在OAuth集成方面，v2.8.0采用了Python Social Auth库作为基础，通过灵活的配置机制实现了对多种认证提供商的支持。系统内部处理OAuth流程时，会动态加载配置中指定的认证后端类，确保不同提供商的特有参数和流程都能被正确处理。

对于数据库兼容性问题，团队优化了SQL查询语句，确保在不同数据库引擎下都能稳定运行。特别是在PostgreSQL环境下，调整了某些特定语法的使用方式，避免了潜在的语法冲突。

升级建议

对于现有用户，升级到v2.8.0版本可以获得更好的身份验证体验和系统稳定性。特别是那些需要集成企业SSO解决方案或使用PostgreSQL作为后端数据库的用户，这个版本带来了显著的改进。

配置新的OAuth提供商时，建议仔细阅读相关提供商的文档，确保正确设置client_id和client_secret等参数。同时，对于生产环境，始终建议在升级前进行充分的测试。

总结

Argilla v2.8.0通过增强的OAuth集成能力和多项重要修复，进一步提升了平台的灵活性和稳定性。这些改进使得Argilla能够更好地满足不同规模团队的需求，特别是在企业环境中的身份验证和数据管理方面。随着多语言支持的持续完善，Argilla正逐步成为一个真正全球化的数据标注解决方案。

argilla

Argilla is a collaboration tool for AI engineers and domain experts to build high-quality datasets

项目地址：https://gitcode.com/GitHub_Trending/ar/argilla

登录后查看全文

项目优选

收起

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

494

518

ops-nn

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

作为 Ascend for PyTorch 社区的核心组件，TorchNPU 是昇腾专为 PyTorch 打造的深度学习适配插件，使 PyTorch 框架能够直接调用昇腾 NPU，为开发者提供昇腾 AI 处理器的超强算力。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

AscendNPU-IR是基于MLIR（Multi-Level Intermediate Representation）构建的，面向昇腾亲和算子编译时使用的中间表示，提供昇腾完备表达能力，通过编译优化提升昇腾AI处理器计算效率，支持通过生态框架使能昇腾AI处理器与深度调优

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

CANNBot 是面向 CANN 开发的用于提升开发效率的系列智能体，本仓库为其提供可复用的 Skills 模块。

CANN 学习中心仓，支持在线互动运行、边学边练，提供教程、示例与优化方案，一站式助力昇腾开发者快速上手。

Jupyter Notebook

648

287