【亲测免费】 **NVIDIA GPU进程监控工具nvitop安装与配置完全指南**
2026-01-21 05:07:46作者:伍希望
项目基础介绍与编程语言
项目名称: nvitop
作者: XuehaiPan
主要编程语言: Python
项目简介: nvitop是一个交互式的NVIDIA GPU设备与进程查看器,它提供了丰富的信息显示和彩色界面,能够实时更新GPU状态。此工具超越了基本的监控功能,包括树状视图、环境变量查看、进程过滤、资源指标监控等,并且配备了一个CUDA设备选择工具——nvisel,专为深度学习研究者设计。它还支持通过API扩展,便于开发者创建自己的监控解决方案。
关键技术和框架
- NVIDIA Management Library (NVML): 直接使用NVML Python绑定查询设备状态,高效且准确。
- psutil库: 获取主机进程信息,确保跨平台兼容性。
- cachetools: 实现缓存结果以提高查询效率。
- termcolor和curses库: 创建彩色和交互式终端界面。
- 多线程: 异步数据收集,响应更快。
- Windows-curses(Windows平台): 提供Windows上的终端支持。
安装与配置步骤
准备工作
- 系统要求: 确保你的系统是Linux或Windows,且Python版本为3.7或更高。
- 安装必备软件包: 需要安装Python环境和必要的库。如果你的系统未安装Python 3.7+,请先下载并安装Python。
- NVIDIA驱动: 确保你的系统已安装最新的NVIDIA显卡驱动。如果需要,可以从NVIDIA官网或使用提供的脚本安装。
安装步骤
第一步:安装Python虚拟环境(推荐)
创建一个隔离的Python环境,可以使用venv或conda:
# 使用venv
python3 -m venv mynvitopenv
source mynvitopenv/bin/activate # 对于Linux/macOS
.\mynvitopenv\Scripts\activate # 对于Windows
# 或使用conda(如果已安装)
conda create -n nvitop python=3.7
conda activate nvitop
第二步:安装nvitop
-
直接使用pipx安装(简单快捷)
pipx install nvitop或设置别名以便快速调用:
# 根据你的shell类型调整命令 echo 'alias nvitop="pipx run nvitop"' >> ~/.bashrc # 对于Bash用户 -
从源代码安装(高级用户)
git clone --depth=1 https://github.com/XuehaiPan/nvitop.git cd nvitop pip3 install .
第三步:验证安装
打开终端,输入以下命令来检查nvitop是否成功安装:
nvitop -1
该命令会显示所有GPU的状态一次,类似于执行nvidia-smi。
使用和配置
- 运行nvitop无需特殊配置,直接在终端中启动即可。
- 若要更改默认行为,可以利用命令行选项,如
-m模式切换,或通过环境变量NVITOP_MONITOR_MODE自定义默认监控模式。 - 在Windows上,确保终端支持Unicode字符,或者使用
-U参数强制使用ASCII字符以避免乱码。
至此,您已经完成了nvitop的安装与初步配置,现在可以开始愉快地监控您的GPU进程了!
以上就是针对小白用户的nvitop安装与配置详细指南。希望这能让您的GPU管理之旅更加顺畅。如果有其他特定需求或遇到问题,请参考项目的GitHub页面获取更多信息。
登录后查看全文
热门项目推荐
相关项目推荐
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C0131
let_datasetLET数据集 基于全尺寸人形机器人 Kuavo 4 Pro 采集,涵盖多场景、多类型操作的真实世界多任务数据。面向机器人操作、移动与交互任务,支持真实环境下的可扩展机器人学习00
mindquantumMindQuantum is a general software library supporting the development of applications for quantum computation.Python059
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
AgentCPM-ReportAgentCPM-Report是由THUNLP、中国人民大学RUCBM和ModelBest联合开发的开源大语言模型智能体。它基于MiniCPM4.1 80亿参数基座模型构建,接收用户指令作为输入,可自主生成长篇报告。Python00
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
496
3.64 K
Ascend Extension for PyTorch
Python
300
338
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
307
131
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
868
479
暂无简介
Dart
744
180
React Native鸿蒙化仓库
JavaScript
297
346
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
11
1
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
66
20
仓颉编译器源码及 cjdb 调试工具。
C++
150
882