DeepChat项目中Markdown与HTML混合渲染的技术实践

2025-07-03 22:18:54作者：胡易黎Nicole

背景与问题场景

在基于DeepChat构建的对话系统中，开发者经常需要处理富文本内容的渲染问题。一个典型场景是：消息内容前半部分需要以Markdown格式呈现（如代码块、标题等），而后半部分则需要自定义HTML样式（如引用框、按钮等）。然而在实际开发中，开发者发现当使用HTML类型渲染时，Markdown语法无法正常解析，导致样式失效。

技术原理分析

1. Markdown与HTML的渲染机制

Markdown本质上是一种轻量级标记语言，最终会被转换为HTML进行渲染。现代Markdown解析器（如remarkable）通常默认允许内嵌HTML标签，这带来了便利性，但也存在安全风险：

安全性问题：恶意用户可能通过HTML注入XSS攻击代码
渲染冲突：当Markdown内容包含HTML标签时，解析器可能无法区分"需要原样展示的代码"和"需要执行的标签"

2. DeepChat的安全策略

DeepChat在2.1.0版本后出于安全考虑，默认禁用了HTML类型的Markdown解析。这是导致开发者遇到"Markdown在HTML模式下失效"问题的根本原因。这种设计虽然提高了安全性，但也给需要混合渲染的场景带来了挑战。

解决方案实践

方案一：强制重渲染机制（适用于旧版本）

对于使用较旧版本的开发者，可以通过以下workaround实现混合渲染：

import { marked } from 'marked'

// 在消息处理逻辑中
signals.onResponse({ 
  html: marked(markdownContent), 
  overwrite: true  // 强制重渲染
})

技术要点：

使用marked库预先将Markdown转换为HTML
通过overwrite参数确保内容更新时完全重新渲染
将转换后的HTML作为html类型内容传递

优缺点：

优点：兼容性好，适用于各种版本
缺点：需要手动管理转换过程，可能影响性能

方案二：使用remarkable配置（2.1.1+版本推荐）

DeepChat 2.1.1版本引入了remarkable配置项，提供了更优雅的解决方案：

const chatOptions = {
  messages: {
    remarkable: {
      html: true,  // 允许解析HTML
      breaks: true // 自动转换换行符
      // 其他remarkable配置...
    }
  }
}

最佳实践建议：

生产环境应严格限制HTML标签白名单
对于用户生成内容，建议先进行消毒处理
复杂样式推荐使用CSS类而非内联样式

高级应用：实现打字机效果

结合上述技术，可以实现更丰富的交互效果。例如实现Markdown内容的逐字输出效果：

let typedContent = ''
const typewriterEffect = (markdown) => {
  typedContent += markdown.charAt(currentIndex)
  signals.onResponse({
    html: marked(typedContent),
    overwrite: true
  })
}