LangChain项目中TypedDict与结构化输出的正确使用方式

2025-04-28 14:44:44作者：宗隆裙

The agent engineering platform.

项目地址：https://gitcode.com/GitHub_Trending/la/langchain

在LangChain项目开发过程中，许多开发者会遇到结构化输出与TypedDict类型定义不匹配的问题。本文将通过一个典型案例分析问题根源，并给出正确的实现方案。

问题现象

开发者在使用LangChain的with_structured_output功能时，期望得到一个符合TypedDict定义的结构化输出，但实际得到的却是包含额外类型信息的嵌套结构。具体表现为输出结果中包含了不必要的"type"和"properties"字段，而不是预期的扁平化键值对结构。

问题根源分析

经过深入调查，发现问题并非来自LangChain框架本身，而是由于开发者在使用API时的一个常见错误：在调用with_structured_output方法时，错误地实例化了TypedDict类，即使用了SiteLinks()而不是直接传递SiteLinks类型。

TypedDict是Python的类型提示工具，用于定义字典的结构，它本身不应该被实例化。当开发者错误地实例化TypedDict并传递给结构化输出方法时，会导致框架无法正确识别预期的输出结构。

正确实现方案

以下是使用LangChain结构化输出的正确方式：

from typing import Optional
from typing_extensions import TypedDict
from langchain_openai import ChatOpenAI

class SiteLinks(TypedDict):
    "URLs to extract from the web page"
    legal_notice: Optional[str]
    faq: Optional[str]
    about_us: Optional[str]

# 正确用法：直接传递TypedDict类型
llm = ChatOpenAI(model="gpt-4o-mini", temperature=0, max_tokens=500)
structured_llm = llm.with_structured_output(SiteLinks)

最佳实践建议

类型定义清晰：确保TypedDict中的字段类型定义准确，特别是对于可选字段要使用Optional明确标注
避免实例化类型：记住TypedDict是类型提示工具，不是常规的数据类，不应实例化
测试验证：编写简单的断言测试验证输出结构是否符合预期
版本兼容性：虽然这个问题不是版本导致的，但保持LangChain及其相关依赖的最新版本仍是良好实践

总结

正确使用LangChain的结构化输出功能可以显著提升大语言模型输出的可靠性和可用性。关键在于理解TypedDict的本质作用以及它与常规字典的区别。通过遵循本文介绍的正确用法，开发者可以避免常见的陷阱，获得预期的结构化输出结果。

The agent engineering platform.

项目地址：https://gitcode.com/GitHub_Trending/la/langchain

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统