LLM项目中的工具调用功能在聊天模式下的实现分析

2025-05-30 17:34:11作者：姚月梅Lane

在LLM项目的开发过程中，团队最近实现了聊天模式下工具调用的重要功能扩展。这一功能允许用户在交互式聊天会话中直接调用预定义的工具函数，大大增强了模型的实用性和灵活性。

核心功能实现上，开发团队为llm chat命令添加了与llm prompt相同的工具调用参数支持，包括-T/--tool和--functions选项。这意味着用户可以在持续对话中无缝使用各种工具功能，而工具调用的上下文会在每次用户输入时自动重置，确保每次交互都是独立的。

技术实现层面，该功能目前已经成功适配了多个主流模型：

在gpt-4.1-mini模型上表现良好，能够正确识别用户请求并调用指定工具
在Claude 3.5 Haiku模型上也实现了稳定支持，不仅能执行工具调用，还能提供额外的有用反馈
在Gemini 2.5 Flash模型上目前存在兼容性问题，团队判断可能是模型本身的bug导致

值得注意的是，团队特别考虑了工具调用可能带来的token消耗问题。为此设计了-u/--usage选项，让用户可以随时查看token使用情况，避免因工具调用导致意外的高额消耗。

从架构设计角度看，这一功能实现体现了几个重要考量：

保持了与现有命令的参数一致性，降低用户学习成本
设计了合理的上下文管理机制，确保工具调用的独立性
考虑了不同模型后端的兼容性问题
加入了使用监控功能，提高系统透明度

未来发展方向上，团队计划进一步扩展工具集管理能力，包括：

支持在聊天会话开始时加载预定义的工具集合
实现插件形式的工具包集成
探索"代理"模式，将特定工具组合打包为专用对话代理

这一功能的实现标志着LLM项目在交互能力上的重要进步，使模型不仅能进行对话，还能在对话过程中主动调用外部功能，大大扩展了应用场景。对于开发者而言，这为构建更复杂的AI应用提供了坚实基础；对于终端用户，则能体验到更强大、更实用的对话交互。

目前该功能已基本完成并合并到主分支，团队将继续优化不同模型后端的兼容性，并探索更丰富的工具管理方案，以进一步提升用户体验。

llm

Access large language models from the command-line

项目地址：https://gitcode.com/gh_mirrors/llm/llm

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

openHiTLS

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.03 K

492

torchair

TorchAir 支持用户基于PyTorch框架和torch_npu插件在昇腾NPU上使用图模式进行推理。

Python

342

146