YAS项目推荐服务查询实现解析
2025-07-08 05:01:58作者:彭桢灵Jeremy
向量数据库查询服务架构设计
在YAS项目的推荐服务模块中,我们实现了一个基于向量相似度的产品推荐查询服务。该服务利用Spring AI框架与Azure AI的嵌入能力,结合PostgreSQL的PGvector扩展,构建了一个高效的相似性查询系统。
核心数据结构
系统采用了一个专门设计的向量存储表结构:
CREATE TABLE IF NOT EXISTS vector_store (
id uuid DEFAULT uuid_generate_v4() PRIMARY KEY,
content text,
metadata json,
embedding vector(1536)
);
这个表结构包含四个关键字段:
id- 使用UUID作为主键content- 存储实体的原始文本内容metadata- 以JSON格式存储实体的元数据(如产品ID、SKU等)embedding- 存储经过嵌入模型处理后的1536维向量
查询机制实现
系统采用了一种高效的相似度查询方法,核心查询语句如下:
SELECT *, embedding <=> ${embedded_query_value} AS distance
FROM public.vector_store
WHERE embedding <=> ${embedded_query_value} < ${similarity_threshold}
ORDER BY distance
这个查询包含几个关键技术点:
- 向量相似度计算:使用
<=>操作符计算查询向量与存储向量之间的余弦距离 - 相似度阈值过滤:通过
< ${similarity_threshold}条件筛选出相似度足够高的结果 - 距离排序:按照计算出的距离值升序排列,确保最相关的结果排在前面
技术实现流程
整个查询过程分为几个关键步骤:
- 查询向量化:用户输入的自然语言查询首先被发送到Azure OpenAI服务,转换为1536维的嵌入向量
- 向量相似度搜索:使用生成的嵌入向量在PGvector数据库中进行相似度搜索
- 结果过滤与排序:应用相似度阈值过滤,并按相关性排序返回结果
- 元数据提取:从匹配的向量记录中提取产品元数据作为最终返回结果
性能优化考虑
在实现过程中,我们特别关注了以下几个性能优化点:
- 向量维度选择:采用1536维的向量表示,在准确性和计算效率之间取得平衡
- 索引优化:PGvector支持多种向量索引类型,可根据实际数据规模和查询模式选择最合适的索引策略
- 阈值调优:相似度阈值的设置直接影响结果质量和数量,需要根据实际业务需求进行调整
应用场景扩展
这种基于向量的相似性查询不仅适用于产品推荐,还可以扩展到以下场景:
- 个性化内容推荐
- 语义搜索
- 异常检测
- 聚类分析
通过灵活调整查询参数和元数据结构,该服务可以轻松适应不同的业务需求。
总结
YAS项目的推荐查询服务通过结合现代AI技术和向量数据库,实现了高效、灵活的产品推荐功能。这种架构不仅解决了传统推荐系统的冷启动问题,还能捕捉到更深层次的语义关联,为用户提供更加精准的推荐结果。
登录后查看全文
热门项目推荐
相关项目推荐
GLM-5智谱 AI 正式发布 GLM-5,旨在应对复杂系统工程和长时域智能体任务。Jinja00
GLM-5.1GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。GLM-5.1大大提高了代码能力,在完成长程任务方面提升尤为显著。和此前分钟级交互的模型不同,它能够在一次任务中独立、持续工作超过8小时,期间自主规划、执行、自我进化,最终交付完整的工程级成果。Jinja00
MiniMax-M2.7MiniMax-M2.7 是我们首个深度参与自身进化过程的模型。M2.7 具备构建复杂智能体应用框架的能力,能够借助智能体团队、复杂技能以及动态工具搜索,完成高度精细的生产力任务。Python00- QQwen3.5-397B-A17BQwen3.5 实现了重大飞跃,整合了多模态学习、架构效率、强化学习规模以及全球可访问性等方面的突破性进展,旨在为开发者和企业赋予前所未有的能力与效率。Jinja00
HY-Embodied-0.5这是一套专为现实世界具身智能打造的基础模型。该系列模型采用创新的混合Transformer(Mixture-of-Transformers, MoT) 架构,通过潜在令牌实现模态特异性计算,显著提升了细粒度感知能力。Jinja00
LongCat-AudioDiT-1BLongCat-AudioDiT 是一款基于扩散模型的文本转语音(TTS)模型,代表了当前该领域的最高水平(SOTA),它直接在波形潜空间中进行操作。00
项目优选
收起
deepin linux kernel
C
27
14
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
659
4.26 K
🎉 (RuoYi)官方仓库 基于SpringBoot,Spring Security,JWT,Vue3 & Vite、Element Plus 的前后端分离权限管理系统
Vue
1.54 K
894
Ascend Extension for PyTorch
Python
504
609
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
391
288
暂无简介
Dart
906
218
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
69
21
昇腾LLM分布式训练框架
Python
142
168
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
939
863
🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端
TypeScript
1.33 K
108