【亲测免费】探索未来智能硬件：Gemmini——一款强大的DNN硬件平台

2026-01-15 17:26:13作者：幸俭卉

Berkeley's Spatial Array Generator

项目地址：https://gitcode.com/gh_mirrors/ge/gemmini

项目简介

Gemmini 是一个全面的深度神经网络（DNN）硬件探索和评估平台，其目标是为架构师提供深入洞察系统各个组成部分以及软件栈如何相互作用以影响整体DNN性能的机会。这个项目作为Chipyard生态系统的一部分，采用了先进的Chisel硬件描述语言进行开发。

项目技术分析

Gemmini 是一个基于RoCC加速器的解决方案，拥有非标准的RISC-V自定义指令，与Rocket或BOOM处理器核心的RoCC端口相连，并通过系统总线直接访问L2缓存。它的心脏是一个可配置的 systolic 数组，支持两种数据流模式：输出站定和权重站定。这种灵活性允许在运行时选择最适合的计算策略。

系统的输入和输出存储在一个显式管理的SRAM划片缓存中，由DMA引擎处理主内存与缓存之间的数据传输。为了实现重量站定数据流，还包含了一个附加的SRAM银行和加法单元作为累加器。激活函数、量化操作和矩阵转置等功能也得以集成，以增强其功能。

主要参数

Systolic Array维度：可以根据需求调整大小，包括两层层次结构，即完全组合的“tile”和带有流水线寄存器的“mesh”。
Dataflow参数：确定数据流模式是单一类型还是支持多种选择。
Memory参数：可定制的缓存容量和银行数量。
Type参数：定义输入、输出和积累的数据类型，包括固定点和浮点数。
Access-execute队列参数：实现了加载、存储和执行的解耦，确保高效的操作流程。

应用场景

Gemmini 在多个领域有广泛的应用潜力：

研究与开发：用于理解不同硬件设计对DNN性能的影响。
数据中心优化：提升大规模机器学习模型的处理速度。
嵌入式应用：在资源有限的环境中提供高效的DNN计算。
实时智能系统：如自动驾驶汽车和物联网设备，需要快速响应和低延迟的DNN计算。

项目特点

灵活性：Gemmini 支持输出站定和权重站定数据流，可根据实际工作负载动态选择。
可配置性：可以调整 systolic 数组尺寸、内存属性和其他关键参数，以适应不同的硬件和性能要求。
高效能：利用 systolic 数组的并行计算能力和优化的内存管理，提高计算效率。
广泛适用：既能在功能性模拟器（如Spike）上运行，也能在循环精确的模拟器（如Verilator）上进行性能验证。
开源生态：Gemmini 是 Chipyard 生态系统的一部分，提供了丰富的工具链和支持，方便开发者参与和贡献。

快速启动

按照项目文档中的指示安装依赖，构建Gemmini硬件和软件，然后在各种模拟器上运行。无论你是初学者还是经验丰富的开发者，Gemmini 都为你准备了详细的步骤。

Gemmini 提供了一个独特的窗口，让我们能够深入洞察未来的智能硬件设计。利用这个强大的工具，你可以自由地探索、实验和创新，推动DNN硬件的新边界。立即加入Gemmini社区，开启你的硬件探索之旅！

Berkeley's Spatial Array Generator

项目地址：https://gitcode.com/gh_mirrors/ge/gemmini

登录后查看全文

热门内容推荐

1 【亲测免费】开源项目 `build-your-own-x` 使用指南 2 【亲测免费】探索科技之旅：《Build Your Own X》项目详解 3 GitHub_Trending/bu/build-your-own-x自动化：CI/CD流程在自制项目中的应用 4 从零打造智能家居系统：用build-your-own-x实现家庭自动化

最新内容推荐

Degrees of Lewdity中文汉化终极指南：零基础玩家必看的完整教程 Unity游戏翻译神器：XUnity Auto Translator 完整使用指南 PythonWin7终极指南：在Windows 7上轻松安装Python 3.9+终极macOS键盘定制指南：用Karabiner-Elements提升10倍效率 Pandas数据分析实战指南：从零基础到数据处理高手 Qwen3-235B-FP8震撼升级：256K上下文+22B激活参数 7步搞定机械键盘PCB设计：从零开始打造你的专属键盘终极WeMod专业版解锁指南：3步免费获取完整高级功能 DeepSeek-R1-Distill-Qwen-32B技术揭秘：小模型如何实现大模型性能突破音频修复终极指南：让每一段受损声音重获新生

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

flutter_flutter

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

喝着茶写代码！最易用的自托管一站式代码托管平台，包含Git托管，代码审查，团队协作，软件包和CI/CD。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

无需学习 Kubernetes 的容器平台，在 Kubernetes 上构建、部署、组装和管理应用，无需 K8s 专业知识，全流程图形化管理