HealthGPT 使用与启动指南

2026-01-30 05:08:51作者：翟萌耘Ralph

【ICML 2025 Spotlight】 Official Repo for Paper ‘’HealthGPT : A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation‘’

项目地址：https://gitcode.com/gh_mirrors/hea/HealthGPT

1. 项目介绍

HealthGPT 是一个先进的医疗大型视觉-语言模型，具有统一的框架，集成了医疗视觉理解和生成能力。本项目提出了一种异质低秩适应（H-LoRA）和三阶段学习策略，使预训练的大型语言模型能够有效地遵循视觉理解和生成指令。

2. 项目快速启动

环境准备

首先，克隆我们的仓库并创建 Python 环境以运行 HealthGPT：

# 克隆项目
git clone https://github.com/DCDmllm/HealthGPT.git
cd HealthGPT

# 准备 Python 环境
conda create -n HealthGPT python=3.10
conda activate HealthGPT
pip install -r requirements.txt

准备预训练权重

HealthGPT 使用 clip-vit-large-patch14-336 作为视觉编码器，并使用 Phi-3-mini-4k-instruct 和 phi-4 作为 HealthGPT-M3 和 HealthGPT-L14 的预训练 LLM 基础模型。请下载相应的权重：

视觉编码器：clip-vit-large-patch14-336
HealthGPT-M3 基础模型：Phi-3-mini-4k-instruct
HealthGPT-L14 基础模型：phi-4

下载后，将 last.ckpt 和 model.yaml 文件放在 taming_transformers/ckpt 目录下。

推理

以医疗视觉问答为例，执行以下步骤进行推理：

# 运行推理脚本
cd llava/demo
bash com_infer.sh

或者直接在终端运行以下 Python 命令：

python3 com_infer.py \
--model_name_or_path "microsoft/Phi-3-mini-4k-instruct" \
--dtype "FP16" \
--hlora_r "64" \
--hlora_alpha "128" \
--hlora_nums "4" \
--vq_idx_nums "8192" \
--instruct_template "phi3_instruct" \
--vit_path "openai/clip-vit-large-patch14-336/" \
--hlora_path "path/to/your/local/com_hlora_weights.bin" \
--fusion_layer_path "path/to/your/local/fusion_layer_weights.bin" \
--question "你的问题" \
--img_path "path/to/image.jpg"

请将 path/to/your/local/com_hlora_weights.bin 和 path/to/your/local/fusion_layer_weights.bin 替换为实际的权重文件路径。

3. 应用案例和最佳实践

案例 1： 使用 HealthGPT 进行医疗图像的问答。
案例 2： 利用 HealthGPT 生成医疗图像描述。

4. 典型生态项目

项目 A： 集成 HealthGPT 到医院的信息系统中，提供智能问答服务。
项目 B： 利用 HealthGPT 为远程医疗服务生成详细的图像描述。

【ICML 2025 Spotlight】 Official Repo for Paper ‘’HealthGPT : A Medical Large Vision-Language Model for Unifying Comprehension and Generation via Heterogeneous Knowledge Adaptation‘’

项目地址：https://gitcode.com/gh_mirrors/hea/HealthGPT

登录后查看全文

热门内容推荐

1 编程实践项目探索指南：从零构建技术能力体系 2 技术解构式学习：从0到1构建你的编程知识体系 3 构建自己的技术世界：build-your-own-x项目的实践探索指南 4 解锁编程技能的实践之旅：从零构建你的技术世界 5 技术实践探索：从零开始构建核心系统的实践指南 6 亲手锻造技术引擎：从0到1构建核心系统的实践指南

最新内容推荐

AcFunDown视频下载工具完全指南还在为数字笔记抓狂？这款开源神器让手写批注效率提升300%Windows笔记本电池健康管理全指南：从根源解决电池损耗问题 gmx_MMPBSA分子间相互作用索引错误的深度诊断与解决 Axure RP 11 本地化方案：Mac中文界面优化与原型设计工具汉化全指南如何高效获取教育资源？这款工具让教材下载效率提升80%视频元数据深度编辑：专业技巧与案例网盘直链下载技术解析与应用指南如何用DeepSeek-R1推理模型提升复杂任务解决能力：完整指南 5个突破瓶颈技巧：硬件优化工具让你的电脑性能提升30%

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统