深入解析Ollama Python API中的模型运行状态监控

2025-05-30 20:39:24作者：董宙帆

Ollama Python Library为你的Python 3.8+项目无缝接入强大语言模型打开了一扇便捷之门。通过简单几行代码，即可与Ollama进行对话，探索知识的无限广阔。不论是询问“天空为何是蓝色”，还是实现复杂文本生成，这个库都能轻松应对。支持响应流式处理，让你的交互实时流畅，每个思考片段即时呈现。不仅如此，全面的API涵盖了从聊天、生成文字到模型管理的各项功能，满足定制化需求，无论是创建独特模型角色，还是执行异步操作，Ollama Python Library都是你探索AI语言世界的理想伙伴。让每一次对话都充满智慧的火花，立刻开始你的Ollama之旅吧！

项目地址：https://gitcode.com/GitHub_Trending/ol/ollama-python

在Ollama Python API的实际应用中，开发者经常需要监控模型在系统中的运行状态，特别是了解模型是在CPU还是GPU上运行以及资源占用情况。本文将详细介绍如何通过Python API获取这些关键信息。

模型运行状态的基本获取

通过Ollama CLI工具，我们可以直接使用ollama ps命令查看模型运行状态，其中包含了处理器使用情况等重要信息。然而在Python API中，ollama.ps()方法返回的对象并不直接包含"Processor"这一字段。

通过现有数据计算资源占用

虽然API没有直接暴露处理器使用百分比，但我们可以通过返回对象中的size和size_vram两个关键字段来计算出GPU的使用率：

# 获取模型运行状态
model_status = ollama.ps()

# 计算GPU使用百分比
gpu_percentage = (model_status.size_vram / model_status.size) * 100

# 计算CPU使用百分比
cpu_percentage = 100 - gpu_percentage

技术原理分析

这种方法之所以有效，是因为：

size字段表示模型在内存中的总大小
size_vram字段表示模型在显存中的大小
两者的比值可以反映出模型在GPU上的资源占用比例

实际应用建议

在实际开发中，建议将这些计算封装成工具函数：

def get_processor_usage(model_status):
    """计算模型在CPU和GPU上的资源占用百分比"""
    if not model_status.size:
        return 0, 0  # 处理除零情况
    
    gpu_pct = (model_status.size_vram / model_status.size) * 100
    cpu_pct = 100 - gpu_pct
    return round(cpu_pct, 2), round(gpu_pct, 2)