Telethon项目中转发消息时保持文本格式的技术解析

2025-05-22 13:28:35作者：郦嵘贵Just

Pure Python 3 MTProto API Telegram client library, for bots too!

项目地址：https://gitcode.com/gh_mirrors/te/Telethon

在即时通讯自动化开发中，使用Telethon库转发消息时修改文本内容是一个常见需求。本文深入分析如何在使用Telethon v1版本时保持消息的原始格式（如隐藏文本、剧透文本等特殊样式），并提供专业解决方案。

问题本质

当开发者直接修改Message对象的text属性时，消息实体（entities）信息会丢失。这是因为：

文本修改后，原有的实体偏移量（offset）不再匹配新文本
Telethon v1对部分实体类型的支持有限
直接替换文本会破坏原始消息的结构化数据

技术原理

即时通讯消息由两部分组成：

原始文本内容
实体数组（包含样式标记、链接、提及等）

每个实体包含三个关键属性：

offset：样式起始位置
length：样式长度
type：样式类型（粗体、斜体、隐藏文本等）

解决方案

方法一：HTML解析模式（推荐）

from telethon import events

async def forward_with_formatting(client):
    # 获取原始消息
    message = await client.get_messages(source_channel, ids=[message_id])
    
    # 使用HTML模式保持格式
    await client.send_message(
        target_channel,
        message.text.replace("old", "new"),
        parse_mode='html'
    )

方法二：手动调整实体偏移量

async def forward_with_entities(client):
    message = await client.get_messages(source_channel, ids=[message_id])
    new_text = message.text.replace("old", "new")
    
    # 计算文本变化量
    delta = len(new_text) - len(message.text)
    
    # 调整实体偏移量
    new_entities = []
    for entity in message.entities:
        new_entity = entity.copy()
        if entity.offset > change_position:
            new_entity.offset += delta
        new_entities.append(new_entity)
    
    await client.send_message(
        target_channel,
        new_text,
        entities=new_entities
    )

版本兼容性说明

Telethon v1对以下实体支持有限：
- 隐藏文本（spoiler）
- 自定义表情（custom emoji）
- 部分富文本格式
如需完整支持所有实体类型，建议：
- 升级到Telethon v2
- 或使用HTML/Markdown解析模式

最佳实践建议

对于简单文本替换：
- 优先使用HTML解析模式
- 保持替换文本长度一致
对于复杂修改：
- 考虑使用消息编辑API分步操作
- 或先转发原始消息再编辑
性能优化：
- 批量处理时缓存实体信息
- 避免频繁建立新连接

通过理解这些底层机制，开发者可以更灵活地处理即时通讯消息转发中的格式保持问题。对于大多数场景，使用HTML解析模式是最简单可靠的解决方案。对于需要精确控制的高级场景，则需要深入了解即时通讯消息实体结构并手动调整偏移量。

Pure Python 3 MTProto API Telegram client library, for bots too!

项目地址：https://gitcode.com/gh_mirrors/te/Telethon

登录后查看全文

项目优选

收起

deepin linux kernel

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

🍒 Cherry Studio 是一款支持多个 LLM 提供商的桌面客户端

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用