LLM项目0.26版本发布:工具支持功能全面上线
LLM是一个强大的命令行工具和Python库,用于与大型语言模型交互。它提供了简洁的接口,让开发者能够轻松地在终端或代码中调用各种语言模型的能力。该项目由Simon Willison创建,旨在简化语言模型的使用流程,同时提供丰富的扩展能力。
工具支持功能的重大突破
0.26版本最引人注目的特性是全面引入了工具支持功能。这一创新允许语言模型在执行过程中调用外部工具,极大地扩展了模型的实际应用能力。工具支持功能此前已在0.26a0和0.26a1两个alpha版本中进行了测试和优化。
工具支持的核心思想是让语言模型不仅能生成文本,还能执行具体的操作。例如,模型可以调用一个计算器进行数学运算,或者查询当前时间,甚至执行更复杂的系统命令。这种能力将语言模型从单纯的文本生成器提升为可以实际执行任务的智能代理。
新增默认工具
为了展示工具支持的潜力,0.26版本内置了两个实用的默认工具:
llm_version()
工具:允许模型查询当前运行的LLM版本信息llm_time()
工具:让模型能够获取当前系统时间
这些工具虽然简单,但很好地演示了工具支持的基本原理和使用方式。开发者可以基于这些示例创建更复杂的自定义工具。
安全警告与防护措施
考虑到工具执行可能带来的安全风险,特别是提示注入攻击的威胁,0.26版本特别加入了显眼的安全警告。提示注入攻击是指恶意用户通过精心设计的输入诱导模型执行非预期操作。开发团队强调了谨慎使用工具支持的重要性,特别是在处理敏感操作时。
技术改进与稳定性提升
除了主要功能外,0.26版本还包含多项技术改进:
- 采用单调ULID作为响应ID,解决了日志系统中偶尔出现的测试失败问题
- 新增
tool_instances
表,详细记录工具执行过程中创建的Toolbox实例 - 将
llm.get_key()
函数正式文档化,为插件开发者提供标准化的密钥管理工具
开发者资源与文档完善
为了帮助开发者充分利用新功能,项目团队提供了详细的文档说明:
- 如何为模型插件添加工具支持
- 工具开发的最佳实践指南
- 安全使用工具的建议和注意事项
这些资源将大大降低开发者集成工具支持的难度,促进更丰富的生态系统发展。
总结
LLM 0.26版本的工具支持功能标志着该项目从单纯的模型交互工具向更全面的AI代理平台演进。通过允许模型执行实际任务,而不仅仅是生成文本,LLM为开发者开辟了全新的应用场景可能性。虽然这一功能带来了新的安全考量,但通过谨慎的设计和清晰的文档,它有望成为LLM生态系统中最具变革性的功能之一。
PaddleOCR-VL
PaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00- DDeepSeek-V3.2-ExpDeepSeek-V3.2-Exp是DeepSeek推出的实验性模型,基于V3.1-Terminus架构,创新引入DeepSeek Sparse Attention稀疏注意力机制,在保持模型输出质量的同时,大幅提升长文本场景下的训练与推理效率。该模型在MMLU-Pro、GPQA-Diamond等多领域公开基准测试中表现与V3.1-Terminus相当,支持HuggingFace、SGLang、vLLM等多种本地运行方式,开源内核设计便于研究,采用MIT许可证。【此简介由AI生成】Python00
openPangu-Ultra-MoE-718B-V1.1
昇腾原生的开源盘古 Ultra-MoE-718B-V1.1 语言模型Python00ops-transformer
本项目是CANN提供的transformer类大模型算子库,实现网络在NPU上加速计算。C++0135AI内容魔方
AI内容专区,汇集全球AI开源项目,集结模块、可组合的内容,致力于分享、交流。03Spark-Chemistry-X1-13B
科大讯飞星火化学-X1-13B (iFLYTEK Spark Chemistry-X1-13B) 是一款专为化学领域优化的大语言模型。它由星火-X1 (Spark-X1) 基础模型微调而来,在化学知识问答、分子性质预测、化学名称转换和科学推理方面展现出强大的能力,同时保持了强大的通用语言理解与生成能力。Python00Spark-Scilit-X1-13B
FLYTEK Spark Scilit-X1-13B is based on the latest generation of iFLYTEK Foundation Model, and has been trained on multiple core tasks derived from scientific literature. As a large language model tailored for academic research scenarios, it has shown excellent performance in Paper Assisted Reading, Academic Translation, English Polishing, and Review Generation, aiming to provide efficient and accurate intelligent assistance for researchers, faculty members, and students.Python00GOT-OCR-2.0-hf
阶跃星辰StepFun推出的GOT-OCR-2.0-hf是一款强大的多语言OCR开源模型,支持从普通文档到复杂场景的文字识别。它能精准处理表格、图表、数学公式、几何图形甚至乐谱等特殊内容,输出结果可通过第三方工具渲染成多种格式。模型支持1024×1024高分辨率输入,具备多页批量处理、动态分块识别和交互式区域选择等创新功能,用户可通过坐标或颜色指定识别区域。基于Apache 2.0协议开源,提供Hugging Face演示和完整代码,适用于学术研究到工业应用的广泛场景,为OCR领域带来突破性解决方案。00- HHowToCook程序员在家做饭方法指南。Programmer's guide about how to cook at home (Chinese only).Dockerfile011
- PpathwayPathway is an open framework for high-throughput and low-latency real-time data processing.Python00
最新内容推荐
项目优选









