Langchainrb项目中OpenAI嵌入模型参数的最新调整
2025-07-08 08:43:58作者:卓炯娓
在Langchainrb项目中,开发者们最近对OpenAI嵌入模型(embeddings)的参数处理进行了重要调整。这一变化主要涉及dimensions参数的使用方式,反映了OpenAI API的最新规范。
参数变更背景
OpenAI的嵌入模型API近期进行了更新,其中text-embedding-ada-002模型不再支持dimensions参数。该参数现在仅适用于较新的text-embedding-3-small和text-embedding-3-large模型。这一变化促使Langchainrb项目需要相应调整其参数处理逻辑。
技术实现方案
项目维护者经过讨论后确定了以下改进方向:
- 保留参数但优化处理:继续保留
dimensions参数,但仅在新支持的模型上使用 - 默认模型升级:将默认嵌入模型从
text-embedding-ada-002升级为更高效经济的text-embedding-3-small - 智能参数传递:根据所选模型自动决定是否传递
dimensions参数
代码实现细节
在具体实现上,项目采用了以下策略:
def embed(
text:,
model: defaults[:embeddings_model_name],
encoding_format: nil,
user: nil,
dimensions: nil
)
# 参数验证逻辑...
parameters = {
input: text,
model: model
}
# 仅在新模型上传递dimensions参数
if model.start_with?("text-embedding-3") && dimensions
parameters[:dimensions] = dimensions
end
# 其他参数处理...
end
开发者建议
对于使用Langchainrb的开发者,建议注意以下几点:
- 如果使用新版嵌入模型,可以指定输出维度
- 对于旧版模型,指定维度参数将被忽略
- 新版模型在性价比和性能上都有提升,建议迁移
总结
这次调整体现了Langchainrb项目紧跟上游API变化的敏捷性,同时也保持了良好的向后兼容性。开发者可以放心使用新版功能,同时旧代码也不会立即失效。这种平衡的维护策略值得其他开源项目借鉴。
登录后查看全文
热门项目推荐
相关项目推荐
kernelopenEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。C0131
let_datasetLET数据集 基于全尺寸人形机器人 Kuavo 4 Pro 采集,涵盖多场景、多类型操作的真实世界多任务数据。面向机器人操作、移动与交互任务,支持真实环境下的可扩展机器人学习00
mindquantumMindQuantum is a general software library supporting the development of applications for quantum computation.Python059
PaddleOCR-VLPaddleOCR-VL 是一款顶尖且资源高效的文档解析专用模型。其核心组件为 PaddleOCR-VL-0.9B,这是一款精简却功能强大的视觉语言模型(VLM)。该模型融合了 NaViT 风格的动态分辨率视觉编码器与 ERNIE-4.5-0.3B 语言模型,可实现精准的元素识别。Python00
GLM-4.7-FlashGLM-4.7-Flash 是一款 30B-A3B MoE 模型。作为 30B 级别中的佼佼者,GLM-4.7-Flash 为追求性能与效率平衡的轻量化部署提供了全新选择。Jinja00
AgentCPM-ReportAgentCPM-Report是由THUNLP、中国人民大学RUCBM和ModelBest联合开发的开源大语言模型智能体。它基于MiniCPM4.1 80亿参数基座模型构建,接收用户指令作为输入,可自主生成长篇报告。Python00
最新内容推荐
项目优选
收起
deepin linux kernel
C
27
11
OpenHarmony documentation | OpenHarmony开发者文档
Dockerfile
496
3.64 K
Ascend Extension for PyTorch
Python
300
338
openEuler内核是openEuler操作系统的核心,既是系统性能与稳定性的基石,也是连接处理器、设备与服务的桥梁。
C
306
131
本项目是CANN提供的数学类基础计算算子库,实现网络在NPU上加速计算。
C++
868
479
暂无简介
Dart
744
180
React Native鸿蒙化仓库
JavaScript
297
346
Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台,包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分,采用java语言实现,可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用
Java
11
1
🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer(第 2 版)》、《程序员面试金典(第 6 版)》题解
Java
66
20
仓颉编译器源码及 cjdb 调试工具。
C++
150
882