首页
/ Neo4j知识图谱构建器部署与多语言适配实践

Neo4j知识图谱构建器部署与多语言适配实践

2025-06-24 18:10:31作者:明树来

项目背景

Neo4j知识图谱构建器(Neo4j Knowledge Graph Builder)是一个基于React和FastAPI构建的开源项目,用于创建和管理知识图谱。该项目包含前端React应用和后端FastAPI服务,通常需要部署在云服务器上供团队协作使用。

部署挑战与解决方案

防火墙环境下的部署问题

在公有云VM部署时遇到的主要挑战是防火墙环境下的跨域访问限制。由于浏览器同源策略要求,前端React应用需要与后端API在同一域名下访问。作者最初尝试通过Nginx反向代理将前后端统一到同一域名下,但遇到了404错误。

经过分析发现,Docker容器间的网络通信存在限制。最终采用的解决方案是:

  1. 前端直接暴露端口访问

    • 保持前端原始配置,不通过反向代理
    • 直接通过http://服务器IP:4040访问前端
  2. 后端通过Nginx反向代理

    • 配置Nginx将/kgbuilderapi路径代理到后端服务
    • 允许特定端口通过防火墙
  3. 后端添加CORS支持

    • 在FastAPI应用中添加CORSMiddleware
    • 配置允许所有来源的跨域请求
app.add_middleware(
    CORSMiddleware,
    allow_origins=["*"],
    allow_credentials=True,
    allow_methods=["*"],
    allow_headers=["*"]
)

多语言评估指标适配

项目中的评估指标最初仅支持英语,为了支持中文等其它语言,作者进行了以下改进:

  1. 环境变量配置

    • 在.env文件中添加LANGUAGE变量
    • 通过docker-compose.yml传递给后端容器
  2. 升级ragas版本

    • 将ragas升级到0.2.11版本
    • 该版本支持多语言指标适配
  3. 自定义AnswerRelevancy指标

    • 创建适配目标语言的answer_relevancy函数
    • 使用async/await处理异步提示适配
def adapted_answer_relevancy(llm, embeddings):
    answer_relevancy = AnswerRelevancy(
        name="answer_relevancy", strictness=3, embeddings=embeddings
    )
    
    async def adapt_prompt():
        adapted_prompts = await answer_relevancy.adapt_prompts(language=LANGUAGE, llm=llm)
        return adapted_prompts
    
    adapted_prompts = asyncio.run(adapt_prompt())
    answer_relevancy.set_prompts(**adapted_prompts)
    return answer_relevancy

部署架构建议

对于生产环境部署,建议采用以下架构:

  1. 前端服务

    • 使用Nginx作为静态文件服务器
    • 配置适当的缓存策略
    • 启用HTTPS加密
  2. 后端服务

    • 使用Gunicorn或Uvicorn作为应用服务器
    • 配置合理的worker数量
    • 启用日志记录和监控
  3. 数据库连接

    • 使用连接池管理Neo4j连接
    • 配置适当的超时和重试策略
    • 启用TLS加密连接

性能优化建议

  1. 嵌入模型优化

    • 根据目标语言选择合适的嵌入模型
    • 考虑使用量化模型减少内存占用
    • 启用模型缓存机制
  2. 评估指标优化

    • 对长文本评估进行分块处理
    • 实现异步批量评估
    • 缓存评估结果
  3. 资源监控

    • 监控GPU/CPU使用率
    • 跟踪内存消耗
    • 设置资源使用阈值告警

总结

通过本文介绍的部署方案,成功解决了Neo4j知识图谱构建器在防火墙环境下的部署问题,并实现了对中文等多语言的支持。这些实践经验对于类似的知识图谱项目部署具有参考价值,特别是在需要跨域访问和多语言支持的场景下。

未来可以考虑进一步优化前端反向代理方案,使其能够与后端服务统一域名访问,同时保持安全性和性能。此外,持续完善多语言支持,特别是非拉丁语系语言的评估指标适配,将大大提升项目的国际化能力。

登录后查看全文
热门项目推荐
相关项目推荐

项目优选

收起
kernelkernel
deepin linux kernel
C
22
6
docsdocs
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
197
2.17 K
ohos_react_nativeohos_react_native
React Native鸿蒙化仓库
C++
208
285
pytorchpytorch
Ascend Extension for PyTorch
Python
59
94
RuoYi-Vue3RuoYi-Vue3
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
973
574
nop-entropynop-entropy
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
9
1
ops-mathops-math
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
549
81
openHiTLSopenHiTLS
旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件,通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求,让密码技术应用更简单,同时探索后量子等先进算法创新实践,构建密码前沿技术底座!
C
1.02 K
399
communitycommunity
本项目是CANN开源社区的核心管理仓库,包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息
393
27
MateChatMateChat
前端智能化场景解决方案UI库,轻松构建你的AI应用,我们将持续完善更新,欢迎你的使用与建议。 官网地址:https://matechat.gitcode.com
1.2 K
133