Azure Kusto管理库3.4.0版本发布:增强集群安全与扩展能力
Azure Kusto(也称为Azure Data Explorer)是微软提供的一个快速、完全托管的数据分析服务,用于实时分析海量数据流。azure-mgmt-kusto是Azure SDK for Python中专门用于管理Kusto服务的客户端库,它允许开发者通过Python代码来创建、配置和管理Kusto集群、数据库及其他相关资源。
主要更新内容
1. 新增Callout策略管理功能
3.4.0版本引入了Callout策略管理功能,这是对Kusto集群安全架构的重要增强。Callout策略允许管理员定义特定的出站访问规则,精确控制集群对外部服务的访问权限。
新增的CalloutPolicy模型支持配置以下属性:
- 策略名称
- Callout类型(通过
CalloutType枚举定义) - 目标服务URL
- 授权头信息
开发者现在可以通过以下方法管理Callout策略:
begin_add_callout_policies:批量添加Callout策略begin_remove_callout_policy:移除指定Callout策略list_callout_policies:列出当前配置的所有Callout策略
2. 区域状态监控支持
新版本在Cluster和ClusterUpdate模型中新增了zone_status属性,使用ZoneStatus枚举来表示集群在各个可用区的运行状态。这一改进使得开发者能够:
- 实时监控集群在不同可用区的健康状态
- 及时发现和处理区域级别的故障
- 为多区域部署提供更细粒度的状态信息
3. 脚本执行权限控制增强
Script模型新增了两个重要属性:
script_level:通过ScriptLevel枚举定义脚本的执行级别principal_permissions_action:使用PrincipalPermissionsAction枚举控制脚本对主体权限的操作
这些增强使得管理员能够更精细地控制:
- 脚本的执行上下文和安全沙箱
- 脚本对数据库主体权限的修改能力
- 不同安全级别的脚本隔离执行
4. 新增Python语言扩展支持
在LanguageExtensionImageName枚举中新增了两个Python运行时环境:
PYTHON3_11_7:标准Python 3.11.7环境PYTHON3_11_7_DL:专为深度学习优化的Python 3.11.7环境
这使得Kusto查询能够利用Python 3.11的最新特性,特别是在机器学习和数据分析场景下,开发者现在可以使用更现代的Python生态系统。
5. 沙盒镜像管理改进
SandboxCustomImage模型新增了base_image_name属性,允许开发者明确指定自定义沙盒镜像所基于的基础镜像。这一改进使得:
- 镜像构建过程更加透明
- 更容易跟踪镜像的依赖关系
- 简化了镜像版本管理
6. 跟随者数据库管理增强
新增了FollowerDatabaseDefinitionGet和FollowerDatabaseListResultGet模型,提供了更丰富的跟随者数据库信息获取能力。配合新增的list_follower_databases_get方法,开发者现在能够:
- 获取跟随者数据库的详细配置信息
- 批量查询集群的所有跟随者数据库
- 更有效地管理分布式数据库架构
技术影响与最佳实践
-
安全最佳实践:新引入的Callout策略功能应该成为生产环境部署的标准配置,特别是对于需要访问外部服务的场景。建议:
- 为每个外部服务创建专用的Callout策略
- 定期审计和更新策略配置
- 使用最小权限原则配置授权头信息
-
多区域部署监控:利用新的
zone_status属性,开发者可以构建更健壮的多区域监控方案:- 实现自动化的区域故障检测
- 建立跨区域流量切换机制
- 设计区域级别的容量规划
-
脚本安全控制:对于需要执行自定义脚本的场景,建议:
- 根据脚本的信任级别设置适当的
script_level - 严格控制具有权限修改能力的脚本
- 实现脚本执行的审批工作流
- 根据脚本的信任级别设置适当的
-
Python扩展使用:当升级到Python 3.11环境时,注意:
- 测试现有Python脚本的兼容性
- 评估是否需要迁移到新的深度学习专用环境
- 利用Python 3.11的性能改进优化查询
升级建议
对于现有项目,升级到3.4.0版本时需要注意:
-
新增的Callout策略功能会改变集群的网络访问行为,建议在测试环境充分验证后再部署到生产环境。
-
如果使用了自定义沙盒镜像,需要检查
base_image_name属性的设置,确保与现有部署兼容。 -
使用脚本功能的应用程序需要评估新的权限控制属性,避免升级后出现权限问题。
-
对于多区域部署,建议更新监控系统以利用新的
zone_status信息。
这个版本为Azure Kusto服务的管理提供了更强大的安全控制和更丰富的监控能力,特别是在企业级安全合规和复杂部署场景下,这些新功能将大大提升管理效率和安全性。
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
unified-cache-managementUnified Cache Manager(推理记忆数据管理器),是一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理并持久化推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。Python03
MiniCPM-V-4_5MiniCPM-V 4.5 是 MiniCPM-V 系列中最新且功能最强的模型。该模型基于 Qwen3-8B 和 SigLIP2-400M 构建,总参数量为 80 亿。与之前的 MiniCPM-V 和 MiniCPM-o 模型相比,它在性能上有显著提升,并引入了新的实用功能Python00
HunyuanWorld-Mirror混元3D世界重建模型,支持多模态先验注入和多任务统一输出Python00
MiniMax-M2MiniMax-M2是MiniMaxAI开源的高效MoE模型,2300亿总参数中仅激活100亿,却在编码和智能体任务上表现卓越。它支持多文件编辑、终端操作和复杂工具链调用Python00
Spark-Scilit-X1-13B科大讯飞Spark Scilit-X1-13B基于最新一代科大讯飞基础模型,并针对源自科学文献的多项核心任务进行了训练。作为一款专为学术研究场景打造的大型语言模型,它在论文辅助阅读、学术翻译、英语润色和评论生成等方面均表现出色,旨在为研究人员、教师和学生提供高效、精准的智能辅助。Python00
GOT-OCR-2.0-hf阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile014
Spark-Chemistry-X1-13B科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00