Keras 3中的张量聚合操作：从reduce_sum/reduce_mean到ops.sum/ops.mean

2025-04-30 00:35:28作者：袁立春Spencer

在深度学习模型构建过程中，张量的聚合操作（如求和、求平均）是非常基础且常用的功能。随着Keras从2.x版本升级到3.0，这些操作的使用方式也发生了变化，这对于从TensorFlow迁移到Keras 3的用户来说需要特别注意。

Keras 2.x时代的reduce操作

在Keras 2.x及更早版本中，TensorFlow用户可以直接在模型构建中使用tf.reduce_sum和tf.reduce_mean等函数。这些函数能够方便地对张量进行聚合操作，例如计算一组嵌入向量的平均值。

Keras 3的多后端支持

Keras 3的一个重大改进是支持多后端（TensorFlow、PyTorch、JAX等）。为了保持不同后端之间API的一致性，Keras团队重新设计了这些基础操作的实现方式。

Keras 3中的替代方案

在Keras 3中，原来的reduce_sum和reduce_mean功能被整合到了ops模块中：

ops.sum - 替代原来的reduce_sum功能
ops.mean - 替代原来的reduce_mean功能

这些新API不仅保持了原有功能，还提供了更好的跨后端兼容性。例如，无论你使用的是TensorFlow、PyTorch还是JAX后端，这些操作都能以相同的方式工作。

为什么需要这种改变

这种改变主要基于以下几个考虑：

统一性：为不同深度学习框架提供一致的API体验
可维护性：简化核心代码库，减少后端特定的实现
可扩展性：更容易添加对新后端的支持

实际应用示例

假设我们需要计算一组嵌入向量的平均值，在Keras 3中可以这样实现：

import keras.ops as ops

# 假设embeddings是一个形状为(batch_size, seq_len, embedding_dim)的张量
mean_embeddings = ops.mean(embeddings, axis=1)

这种用法与NumPy的API风格非常相似，降低了学习成本。

迁移建议

对于从Keras 2.x迁移到Keras 3的用户，建议：

将代码中的tf.reduce_sum替换为ops.sum
将tf.reduce_mean替换为ops.mean
检查是否有其他依赖于特定框架实现的reduce操作

这种改变虽然需要一些代码调整，但从长远来看，它提高了代码的可移植性和可维护性，是值得投入的改进。

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

JiuwenSwarm 是一款基于openJiuwen开发的智能AI Agent，它能够将大语言模型的强大能力，通过你日常使用的各类通讯应用，直接延伸至你的指尖。

Python

2.25 K

677