cc65编译器字符编码转换问题分析与修复

2025-07-01 23:26:56作者：姚月梅Lane

问题背景

cc65是一款流行的8位计算机C语言编译器，支持多种复古计算机平台。近期在开发过程中，开发者发现了一个与字符编码转换相关的严重问题，影响了标准库函数如fgets和文件删除操作的正常功能。

问题现象

用户报告在使用特定平台时，发现以下异常行为：

fgets函数无法正确识别回车键输入，需要多次按Enter键才能返回
文件删除操作失效
其他stdio函数也存在类似问题

这些问题在硬件和模拟器(R48)上都能复现，且确认在cc65 v2.19的特定提交(e444f4c40)后出现。

技术分析

字符编码差异

问题的核心在于不同平台使用的字符编码系统不同：

ASCII编码中：'a'=0x61，'A'=0x41，'\n'=0x0a，'\r'=0x0d
PETSCII编码中：'a'=0x41，'A'=0xC1，'\n'=0x0d，'\r'=0x0a

问题根源

通过代码追踪和测试，发现以下关键点：

在提交1b85ab698后，字符编码转换逻辑发生了变化
字符常量被错误地进行了双重转换
对于特定DOS命令(如删除文件需要发送'S')，错误的转换导致命令无法识别

测试验证

开发者创建了专门的测试用例来验证问题：

测试字符常量和字符串字面量的编码转换
确认编译器生成的代码正确，但汇编器处理存在问题
发现字符常量未被正确转换，而字符串却被正确转换的矛盾现象

解决方案

修复工作主要包括：

修正汇编器对字符常量的处理逻辑
确保字符编码只进行一次转换
统一字符常量和字符串字面量的处理方式

影响范围

该问题不仅影响特定平台，实际上会影响所有使用非ASCII字符编码的目标平台，特别是某些系列计算机。

经验教训

跨平台开发时，字符编码处理需要特别小心
需要建立更完善的回归测试机制来捕捉这类问题
编译器工具链各组件(编译器、汇编器、链接器)之间的字符编码处理需要保持一致

结语

字符编码问题是跨平台开发中的常见挑战。cc65团队通过细致的分析和测试，快速定位并修复了这一问题，确保了编译器在各种复古计算机平台上的兼容性。这也提醒开发者在使用非标准字符编码的平台时，需要特别注意相关函数的实现细节。

cc65

cc65 - a freeware C compiler for 6502 based systems

项目地址：https://gitcode.com/gh_mirrors/cc/cc65

登录后查看全文

项目优选

收起

kernel

deepin linux kernel

docs

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

Java

RuoYi-Vue3

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

Vue

1.24 K

680