GmSSL项目中SM4-ECB模式加密数据截断问题分析

2025-06-07 23:19:31作者：霍妲思

问题现象

在使用GmSSL库进行SM4算法ECB模式加密时，开发者发现当输入数据包含中英文混合内容时，加密结果会出现数据截断现象。具体表现为加密后的数据只有前半部分有效，后半部分被填充为0值。而同样的代码在CBC模式下却能正常工作。

问题定位

通过分析开发者提供的代码片段，可以清晰地看到问题所在。核心问题出现在sms4_ecb_encrypt函数的调用方式上。该函数的第四个参数nblocks表示需要加密的数据块数量，而开发者直接设置为1，导致只加密了第一个16字节的数据块。

技术背景

SM4算法是中国相关密码管理机构发布的分组密码算法标准，采用128位分组长度和128位密钥长度。ECB(Electronic Codebook)模式是最基础的分组密码工作模式，它将明文分成固定大小的块，然后对每个块独立加密。

在ECB模式下，当处理超过一个分组长度的数据时，必须循环处理所有数据块。这与CBC模式不同，CBC模式由于存在链式反馈机制，通常实现上会自动处理所有数据块。

解决方案

正确的实现方式应该是根据输入数据的实际长度计算需要加密的块数，然后进行循环处理。以下是修正后的代码示例：

std::string Gmssl::sm4EcbEncode_pkcs7(const std::string& input, string keys) 
{
    sms4_key_t enc_key;
    uint8_t *key= (unsigned char*)keys.c_str();
    sms4_set_encrypt_key(&enc_key, key);
    std::string paddedInput = pkcs7Padding(input);
    size_t outputSize = ((paddedInput.length() + 15) / 16) * 16;
    std::vector<unsigned char> outputBuffer(outputSize);
    
    // 计算需要加密的块数
    size_t blockCount = paddedInput.length() / 16;
    sms4_ecb_encrypt(reinterpret_cast<const unsigned char*>(paddedInput.c_str()), 
                    outputBuffer.data(), 
                    &enc_key, 
                    blockCount);  // 传入实际的块数
    
    std::string out=base64Encode(std::string(outputBuffer.begin(), outputBuffer.end()));
    return out;
}