Telethon库中contacts.getContactIDs方法的ID类型问题解析

2025-05-22 12:50:39作者：舒璇辛Bertina

问题背景

在使用Telethon库进行即时通讯API开发时，开发者发现contacts.getContactIDs方法返回的联系人ID列表存在异常。该方法本应返回完整的联系人ID数组，但实际返回的结果中却夹杂着0值，导致数据不完整。

问题根源

经过深入分析，发现问题的根源在于Telethon库对该API方法的响应数据解析存在类型不匹配。虽然官方TL模式定义中指定该方法返回Vector<int>类型，但实际上现代即时通讯系统已经将用户ID升级为8字节的长整型(long)数据。

技术细节

在Telethon的自动生成的TL代码中，原始实现如下：

class GetContactIDsRequest(TLRequest):
   @staticmethod
   def read_result(reader):
     reader.read_int()  # Vector ID
     return [reader.read_int() for _ in range(reader.read_int())]

问题在于reader.read_int()只能正确读取4字节的整型数据，而现代用户ID实际上是8字节的长整型。这导致解析时只能读取ID的前4字节，剩余4字节被错误解析为0值或后续ID的一部分。

解决方案

临时解决方案是将读取方法修改为使用reader.read_long()：

return [reader.read_long() for _ in range(reader.read_int())]

这个修改能够正确读取8字节的用户ID，返回完整的联系人ID列表。

更深层次的考量

虽然官方TL模式定义仍然使用Vector<int>，但这可能反映了该API方法的历史遗留问题。实际上，现代即时通讯系统中：

用户ID早已从32位升级为64位
大多数相关API方法都已使用long类型处理ID
该API方法可能较少被使用，因此类型定义未及时更新

最佳实践建议

对于开发者而言，建议：

优先考虑使用getContacts方法替代getContactIDs，功能更全面且维护更好
如需使用该方法，可以自行修改本地Telethon安装中的相关代码
注意用户ID类型的统一处理，避免在系统中混用int和long类型

总结

这个问题展示了开源库在对接不断演变的API时可能遇到的兼容性挑战。虽然Telethon严格遵循官方TL模式定义，但实际运行环境中可能存在定义与实现不一致的情况。开发者需要理解底层数据格式，才能在遇到问题时快速定位和解决。

Telethon

Pure Python 3 MTProto API Telegram client library, for bots too!

项目地址：https://gitcode.com/gh_mirrors/te/Telethon

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

旨在打造算法先进、性能卓越、高效敏捷、安全可靠的密码套件，通过轻量级、可剪裁的软件技术架构满足各行业不同场景的多样化要求，让密码技术应用更简单，同时探索后量子等先进算法创新实践，构建密码前沿技术底座！

1.1 K

611

ops-math

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

C++

1.01 K

MindSpeed-MM

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。