Hands-On LLMs 项目教程
2024-09-22 03:58:20作者:盛欣凯Ernestine
1. 项目介绍
Hands-On LLMs 是一个开源项目,旨在帮助开发者学习如何设计、训练和部署一个实时金融顾问的大型语言模型(LLM)系统。该项目涵盖了LLMs、LLMOps和向量数据库的使用,通过实际案例和代码示例,帮助开发者掌握相关技术。
2. 项目快速启动
2.1 克隆项目
首先,克隆项目到本地:
git clone https://github.com/iusztinpaul/hands-on-llms.git
cd hands-on-llms
2.2 安装依赖
项目使用 Poetry 进行依赖管理,确保你已经安装了 Poetry。然后运行以下命令安装依赖:
poetry install
2.3 配置外部服务
在开始使用项目之前,你需要配置一些外部服务,如 Alpaca、Qdrant、Comet ML 和 AWS。具体配置步骤请参考项目中的 README.md 文件。
2.4 运行示例
项目包含多个模块,每个模块都有自己的 README 文件,提供了详细的安装和使用说明。以下是一个简单的示例,展示如何运行训练管道:
cd modules/training_pipeline
poetry run python main.py
3. 应用案例和最佳实践
3.1 金融顾问系统
该项目的主要应用案例是构建一个实时金融顾问系统。通过训练一个专门用于金融领域的LLM,系统能够回答用户的金融问题,并提供相关的建议。
3.2 最佳实践
- 数据集生成:使用GPT-3.5生成金融问答数据集,用于微调开源LLM。
- 模型微调:使用QLoRA方法微调模型,以提高模型在特定任务上的表现。
- 实时流处理:使用Bytewax构建实时流处理管道,将金融新闻文档转换为向量并存储在Qdrant向量数据库中。
- 推理管道:使用LangChain构建推理管道,结合向量数据库和微调模型,提供实时的金融咨询服务。
4. 典型生态项目
4.1 Hugging Face Transformers
Hugging Face 的 Transformers 库是该项目中使用的主要工具之一,提供了大量的预训练模型和工具,用于文本分类、生成和语义搜索等任务。
4.2 Qdrant
Qdrant 是一个高效的向量数据库,用于存储和查询高维向量数据。在项目中,Qdrant 用于存储金融新闻文档的向量表示,以便进行语义搜索。
4.3 Comet ML
Comet ML 是一个用于机器学习实验跟踪和模型管理的平台。在项目中,Comet ML 用于跟踪训练实验和监控推理结果。
4.4 Beam
Beam 是一个提供无服务器GPU计算的平台,用于部署训练和推理管道。通过Beam,开发者可以在云端高效地训练和部署LLM。
通过以上模块的学习和实践,开发者可以全面掌握如何构建和部署一个实时的金融顾问LLM系统。
登录后查看全文
热门项目推荐
相关项目推荐
Kimi-K2.5Kimi K2.5 是一款开源的原生多模态智能体模型,它在 Kimi-K2-Base 的基础上,通过对约 15 万亿混合视觉和文本 tokens 进行持续预训练构建而成。该模型将视觉与语言理解、高级智能体能力、即时模式与思考模式,以及对话式与智能体范式无缝融合。Python00- QQwen3-Coder-Next2026年2月4日,正式发布的Qwen3-Coder-Next,一款专为编码智能体和本地开发场景设计的开源语言模型。Python00
xw-cli实现国产算力大模型零门槛部署,一键跑通 Qwen、GLM-4.7、Minimax-2.1、DeepSeek-OCR 等模型Go06
PaddleOCR-VL-1.5PaddleOCR-VL-1.5 是 PaddleOCR-VL 的新一代进阶模型,在 OmniDocBench v1.5 上实现了 94.5% 的全新 state-of-the-art 准确率。 为了严格评估模型在真实物理畸变下的鲁棒性——包括扫描伪影、倾斜、扭曲、屏幕拍摄和光照变化——我们提出了 Real5-OmniDocBench 基准测试集。实验结果表明,该增强模型在新构建的基准测试集上达到了 SOTA 性能。此外,我们通过整合印章识别和文本检测识别(text spotting)任务扩展了模型的能力,同时保持 0.9B 的超紧凑 VLM 规模,具备高效率特性。Python00
Baichuan-M3-235BBaichuan-M3 是百川智能推出的新一代医疗增强型大型语言模型,是继 Baichuan-M2 之后的又一重要里程碑。Python00
VLOOKVLOOK™ 是优雅好用的 Typora/Markdown 主题包和增强插件。 VLOOK™ is an elegant and practical THEME PACKAGE × ENHANCEMENT PLUGIN for Typora/Markdown.Less00
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
539
3.76 K
Ascend Extension for PyTorch
Python
349
414
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
889
609
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
338
185
openJiuwen agent-studio提供零码、低码可视化开发和工作流编排,模型、知识库、插件等各资源管理能力
TSX
986
252
openGauss kernel ~ openGauss is an open source relational database management system
C++
169
233
暂无简介
Dart
778
193
华为昇腾面向大规模分布式训练的多模态大模型套件,支撑多模态生成、多模态理解。
Python
114
140
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.35 K
758