Odigos项目v1.0.192版本发布:增强应用回滚与集群监控能力
Odigos是一个开源的分布式追踪与可观测性平台,它通过自动检测和收集应用程序的遥测数据(包括指标、日志和追踪),帮助开发者快速构建完整的可观测性解决方案。最新发布的v1.0.192版本带来了一系列重要改进,特别是在应用回滚机制和集群监控方面有了显著增强。
核心功能改进
应用回滚机制增强
新版本为应用检测失败的情况增加了自动回滚功能。当Odigos尝试对应用进行检测(instrumentation)但失败时,系统会自动将应用回滚到之前的状态。这一机制通过以下方式实现:
- 在检测前创建应用的快照
- 检测过程中持续监控状态
- 检测失败时自动恢复快照
这种机制大大降低了在生产环境中尝试新检测方式的风险,使开发者可以更安全地进行实验和调试。
集群监控能力提升
v1.0.192版本在集群监控方面做了多项改进:
-
健康检查探针完善:为所有服务添加了就绪(ready)和健康(healthy)探针,确保服务在完全初始化后才开始接收流量,并能及时检测和处理不健康状态。
-
指标服务器支持:当不使用主机网络(hostNetwork)时,Odiglet现在会启用指标服务器,为系统提供更丰富的性能指标。
-
自定义指标支持:新增了MeterProvider,允许用户添加自定义指标,扩展了监控的灵活性。
-
eBPF管理器指标:新增了对eBPF管理器的指标收集,为底层网络性能监控提供了更多数据。
架构优化
集群收集器启动顺序调整
新版本优化了集群收集器的启动逻辑,现在会在目标(destinations)添加之前就启动集群收集器。这种改变带来了两个主要优势:
- 更早开始收集集群级别的指标和事件
- 避免了因目标配置延迟导致的数据丢失
安全更新
版本包含了多项依赖项的安全更新:
- 升级了JWT库到v5.2.2,修复了潜在的安全问题
- 更新了多个文档相关的依赖项,确保构建过程的安全性
开发者体验改进
命令行工具增强
Odigos CLI工具现在支持从开源版本(OSS)到企业版(Enterprise)的迁移,通过新增的--onprem-token参数简化了迁移流程。
用户界面优化
- 更新了UI-Kit到v0.0.36版本,带来了更流畅的用户体验
- 修复了检测规则(instrumentation rules)的GraphQL模式问题,使界面展示更加准确
总结
Odigos v1.0.192版本通过增强应用回滚机制和完善集群监控能力,进一步提升了平台的稳定性和可靠性。这些改进使得Odigos更适合在生产环境中部署,特别是对于那些需要高可用性和全面监控的企业级应用场景。安全更新和开发者体验的优化也体现了项目团队对产品质量和用户体验的持续关注。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0190
cann-learning-hubCANN 学习中心仓,支持在线互动运行、边学边练,提供教程、示例与优化方案,一站式助力昇腾开发者快速上手。Jupyter Notebook0113
Step-3.7-FlashStep-3.7-Flash是一个拥有 1980 亿参数的稀疏混合专家(MoE)视觉语言模型,由 1960 亿参数的语言主干网络和 18 亿参数的视觉编码器组合而成,具备原生图像理解能力。Python00
JoyAI-EchoJoyAI-Echo,这是一个独立的、仅用于推理的版本,旨在实现分钟级多镜头音视频生成。它采用了经过蒸馏的DMD生成器、配对的跨模态记忆以及故事级别的一致性。其性能的核心在于,一个跨模态视听记忆库能够在长达五分钟的视频中保持角色外观和语音音色的一致性。同时,一个训练后处理流程将基于记忆的强化学习与分布匹配蒸馏相结合,实现了7.5倍的速度提升,显著增强了视觉质量和对齐效果。00
omega-aiOmega-AI:基于java打造的深度学习框架,帮助你快速搭建神经网络,实现模型推理与训练,引擎支持自动求导,多线程与GPU运算,GPU支持CUDA,CUDNN。Java04
llm-universe本项目是一个面向小白开发者的大模型应用开发教程,在线阅读地址:https://datawhalechina.github.io/llm-universe/Jupyter Notebook08