首页
/ Canvas-Editor 中基于标题概念的内容获取机制解析

Canvas-Editor 中基于标题概念的内容获取机制解析

2025-06-16 21:05:50作者:邓越浪Henry

在文档编辑场景中,经常需要根据标题来获取对应的内容段落,这在医疗文书、法律文件等结构化文档处理中尤为常见。Canvas-Editor 项目提供了一套基于标题概念的内容获取机制,能够智能地识别并提取标题下的关联内容。

标题概念的设计原理

Canvas-Editor 通过为标题元素添加 conceptId 属性来实现内容关联。这种设计类似于文档中的书签功能,但更加结构化:

  1. 概念标识:每个标题可以绑定唯一的 conceptId,作为内容检索的锚点
  2. 层级关系:支持多级标题(TitleLevel.FIRST等),形成文档结构树
  3. 内容关联:系统会自动将标题后的非标题内容视为该标题的所属内容

实现方法详解

标题插入规范

要使用标题内容获取功能,需要按照特定格式插入标题元素:

instance.command.executeInsertElementList([
  {
    value: '',
    title: {
      conceptId: '123' // 必须设置的概念ID
    },
    type: ElementType.TITLE,
    level: TitleLevel.FIRST,
    valueList: [
      {
        value: '主诉:',
        size: 18
      }
    ]
  },
  {
    value: "发热三天,咳嗽五天。"
  }
])

关键点说明:

  • title.conceptId 是必填项,作为内容检索的唯一标识
  • 标题后的普通内容元素会自动关联到该标题
  • 遇到下一个同级或更高级标题时,内容关联自动终止

内容检索API

通过 getTitleValue 方法获取标题内容:

const contentData = instance.command.getTitleValue({ conceptId: '123' })

返回数据结构示例:

[
  {
    "conceptId": "123",
    "value": "发热三天,咳嗽五天。",
    "elementList": [
      {
        "value": "发热三天,咳嗽五天。",
        "size": 16
      }
    ],
    "zone": "main"
  }
]

实际应用场景

  1. 医疗文书处理:快速提取"主诉"、"现病史"等标准章节内容
  2. 合同解析:自动获取"甲方义务"、"违约责任"等条款内容
  3. 知识管理:构建结构化文档的知识提取系统

注意事项

  1. 确保 conceptId 在文档中唯一
  2. 内容关联范围是从标题开始到下一个同级或更高级标题结束
  3. 返回的内容包含完整的格式信息(字体大小、样式等)
  4. 对于多区域文档(如页眉页脚),可以通过 zone 字段区分

这种基于语义的概念化标题设计,使得文档内容的程序化处理变得更加高效和可靠,特别适合需要高度结构化的文档编辑场景。

登录后查看全文
热门项目推荐
相关项目推荐