PostgresML 2.10.0 发布:支持 PostgreSQL 17 与 Python 11 的重大更新
PostgresML 是一个将机器学习能力直接集成到 PostgreSQL 数据库中的开源项目,它允许开发者使用 SQL 语句就能完成机器学习模型的训练和预测,无需将数据移出数据库。这种设计极大地简化了机器学习工作流程,特别适合需要实时预测或与业务数据深度集成的应用场景。
近日,PostgresML 团队发布了 2.10.0 版本,这是该项目的一个重要里程碑。本次更新不仅带来了对最新 PostgreSQL 17 的支持,还包含了多项功能增强和依赖项更新,为 2025 年的技术栈做好了准备。
核心更新内容
PostgreSQL 17 全面支持
作为本次更新的重头戏,PostgresML 2.10.0 版本正式添加了对 PostgreSQL 17 的支持。PostgreSQL 17 作为最新稳定版本,带来了多项性能优化和新特性,PostgresML 的兼容性更新确保了用户能够充分利用这些改进。
Python 11 运行时环境
项目同时升级了 Python 运行时环境至 Python 11 版本。Python 作为机器学习领域的主流语言,其新版本通常会带来性能提升和新特性支持。这一更新使得 PostgresML 能够利用 Python 11 的最新功能,为机器学习任务提供更好的支持。
机器学习依赖项全面升级
PostgresML 2.10.0 对核心机器学习依赖项进行了全面更新,包括:
- 添加了对 Llama 3.2 1B 和 3B 模型的支持,扩展了大语言模型的选择范围
- 修复了 XGBoost 预测时形状不匹配的错误,提升了模型稳定性
- 更新了 Rust XGBoost 实现,改进了性能
这些更新确保了 PostgresML 能够利用最新的机器学习技术进展,为用户提供更强大的分析能力。
功能改进与优化
除了核心组件的更新外,2.10.0 版本还包含多项功能改进:
- Docker 环境优化:在容器启动脚本中自动创建 vector 扩展,简化了部署流程
- 安全增强:增加了关于 Hugging Face 认证和远程代码信任的文档说明,帮助用户更好地管理模型安全
- 文档完善:更新了 VPC 相关文档,添加了安全组删除指南,提升了云部署的指导性
开发者体验提升
PostgresML 团队在此版本中也注重改善开发者体验:
- 仪表板界面进行了多项优化,包括主页链接调整和产品横幅样式改进
- 文档导航结构重新组织,防止内容换行,提升了可读性
- 增加了 Rust 工具链支持,为底层开发提供更好的环境
技术前瞻
PostgresML 2.10.0 的发布展示了项目团队对技术前沿的持续关注。通过支持最新的数据库和编程语言版本,PostgresML 确保了其在数据库内机器学习领域的领先地位。特别是对 PostgreSQL 17 的早期支持,使得用户能够在生产环境中同时享受到数据库和机器学习技术的最新进展。
对于考虑采用 PostgresML 的团队来说,2.10.0 版本提供了一个稳定的基础,可以放心地构建数据密集型的机器学习应用。项目活跃的社区和持续的更新节奏也预示着 PostgresML 未来将有更多令人期待的功能推出。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00