如何在llama-cpp-python项目中单独构建并使用共享库文件

2025-05-26 17:26:45作者：宣海椒Queenly

在llama-cpp-python项目中，有时我们需要单独构建共享库(.so)文件而不是通过pip直接安装。这种情况通常出现在需要定制化编译选项(如启用CUDA支持)或解决特定环境下的编译问题时。本文将详细介绍如何正确构建并使用这些共享库文件。

构建共享库的基本步骤

要构建llama.cpp的共享库版本，需要使用CMake工具并设置特定的编译选项。以下是核心构建命令：

cmake -DLLAMA_STATIC=OFF -DBUILD_SHARED_LIBS=ON -DCMAKE_CXX_FLAGS=-fPIC -DCMAKE_C_FLAGS=-fPIC -DLLAMA_CCACHE=OFF -B build .
cmake --build build --config Release

这些命令会生成两个关键的共享库文件：

libllama.so：主库文件
libggml_shared.so：底层计算库

关键编译选项解析

-DBUILD_SHARED_LIBS=ON：强制生成共享库而非静态库
-DLLAMA_STATIC=OFF：禁用静态库构建
-fPIC标志：确保生成位置无关代码，这对共享库至关重要
-DLLAMA_CCACHE=OFF：禁用ccache缓存，避免潜在问题

解决常见编译问题

在构建过程中可能会遇到线程库链接问题，这可以通过修改CMakeLists.txt文件解决：

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -std=c++11 -pthread")

这个修改显式地添加了pthread支持，确保线程相关功能正常编译。

使用自定义构建的共享库

构建完成后，有两种方式使用这些共享库：

直接替换：将生成的.so文件复制到Python环境的site-packages/llama_cpp目录中
环境变量指定：设置LLAMA_CPP_LIB环境变量指向共享库的完整路径

针对CUDA支持的特别说明

如果需要GPU加速，可以在CMake命令中添加CUDA支持选项：

cmake -DLLAMA_CUDA=ON -DLLAVA_BUILD=OFF -B build .

注意禁用LlaVa构建可以避免一些兼容性问题，虽然不是必须的。

总结

通过单独构建共享库的方式，我们可以更灵活地控制llama-cpp-python的编译选项，解决特定环境下的兼容性问题，或者启用一些特殊功能如CUDA加速。这种方法虽然比直接pip安装稍显复杂，但为高级用户提供了更大的控制权和灵活性。

llama-cpp-python

Python bindings for llama.cpp

项目地址：https://gitcode.com/gh_mirrors/ll/llama-cpp-python

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

134

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN开源社区的核心管理仓库，包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息

555

110