TFHE-rs v0.11.0发布:全同态加密库的重大升级
项目背景
TFHE-rs是一个基于Rust语言实现的全同态加密(Fully Homomorphic Encryption,FHE)库,由Zama团队开发。全同态加密是一种允许在加密数据上直接进行计算的加密技术,无需事先解密数据。TFHE-rs提供了从底层加密原语到高级API的完整实现,支持CPU和GPU加速,是隐私保护计算领域的重要工具。
核心升级内容
1. 性能显著提升
本次v0.11.0版本在多个方面带来了显著的性能改进:
CPU性能优化:
- 64位值的移位和旋转操作性能提升28%
- 批量程序引导(PBS)现在只需加载密钥一次即可处理所有密文
- 零知识证明v2版本带来了巨大的性能提升
GPU性能优化:
- 64位加法运算性能提升30%
- 优化了单进位传播性能
- 改进了整数乘法运算(当其中一个输入密文为布尔值时)
2. 新功能引入
字符串加密支持:
新增了strings模块,通过FheAsciiString类型在高级API中支持安全的字符串操作。这使得开发者能够直接在加密的ASCII字符串上执行各种操作,为文本处理类应用提供了更好的支持。
增强的零知识证明: 零知识证明v2版本不仅性能大幅提升,还增加了对椭圆曲线点有效性的验证,提高了安全性。需要注意的是,现在零知识证明只能与专用参数一起使用。
调试工具:
新增了noise-asserts调试功能,允许开发者验证短整数噪声级别是否符合用户提供的最大噪声限制,这对于调试和验证加密操作的正确性非常有帮助。
安全序列化:
LweSecretKey和GlweSecretKey现在支持安全序列化,并提供了safe_serialized_size方法来获取支持安全序列化的实体的序列化大小。
3. GPU功能扩展
GPU支持得到了显著增强:
- 新增绝对值计算功能
- 支持有符号除法运算
- 引入了数组类型支持
- 增加了数组比较和搜索功能
- 修复了多GPU环境下的一些问题
4. 重要修复与改进
CPU方面:
- 修复了混合使用CPU和GPU时
CompressedCiphertextListBuilder的问题 - 修正了紧凑公钥加密中的单密文加密问题
- 修复了进位传播和比较操作中的一些边界情况
- 改进了小工具分解的平衡性
GPU方面:
- 修复了压缩相关的问题
- 修正了多LUT情况下的采样提取
- 解决了内存错误和单GPU执行问题
- 改进了多比特PBS的稳定性和性能
兼容性说明
v0.11.0版本引入了一些不兼容的变更,开发者需要注意:
-
数据结构兼容性:所有版本的
GgswCiphertext及其变体、各种密钥结构等与0.10之前版本不兼容。 -
参数和函数变更:
DispersionParameter特性现在返回新类型而非原始f64- 默认参数现在使用TUniform参数
- 一些类型和特性被重命名或弃用
-
架构特定功能:移除了x86_64-unix等架构特定特性,改为自动检测。
技术影响与应用前景
TFHE-rs v0.11.0的发布标志着全同态加密技术在实用化道路上又迈出了重要一步。性能的提升使得更多实时应用成为可能,而新增的字符串支持和调试工具则大大提高了开发者的生产力。
GPU支持的增强特别值得关注,它为需要高性能计算的应用场景(如大规模数据分析、机器学习推理等)提供了更好的支持。零知识证明性能的提升也为需要验证计算完整性的应用场景(如区块链、安全多方计算等)带来了新的可能性。
随着隐私计算需求的不断增长,TFHE-rs这样的全同态加密库将在医疗数据分析、金融风险评估、隐私保护机器学习等领域发挥越来越重要的作用。v0.11.0版本的发布无疑将进一步推动这些应用的发展。
AutoGLM-Phone-9BAutoGLM-Phone-9B是基于AutoGLM构建的移动智能助手框架,依托多模态感知理解手机屏幕并执行自动化操作。Jinja00
Kimi-K2-ThinkingKimi K2 Thinking 是最新、性能最强的开源思维模型。从 Kimi K2 开始,我们将其打造为能够逐步推理并动态调用工具的思维智能体。通过显著提升多步推理深度,并在 200–300 次连续调用中保持稳定的工具使用能力,它在 Humanity's Last Exam (HLE)、BrowseComp 等基准测试中树立了新的技术标杆。同时,K2 Thinking 是原生 INT4 量化模型,具备 256k 上下文窗口,实现了推理延迟和 GPU 内存占用的无损降低。Python00
GLM-4.6V-FP8GLM-4.6V-FP8是GLM-V系列开源模型,支持128K上下文窗口,融合原生多模态函数调用能力,实现从视觉感知到执行的闭环。具备文档理解、图文生成、前端重构等功能,适用于云集群与本地部署,在同类参数规模中视觉理解性能领先。Jinja00
HunyuanOCRHunyuanOCR 是基于混元原生多模态架构打造的领先端到端 OCR 专家级视觉语言模型。它采用仅 10 亿参数的轻量化设计,在业界多项基准测试中取得了当前最佳性能。该模型不仅精通复杂多语言文档解析,还在文本检测与识别、开放域信息抽取、视频字幕提取及图片翻译等实际应用场景中表现卓越。00
GLM-ASR-Nano-2512GLM-ASR-Nano-2512 是一款稳健的开源语音识别模型,参数规模为 15 亿。该模型专为应对真实场景的复杂性而设计,在保持紧凑体量的同时,多项基准测试表现优于 OpenAI Whisper V3。Python00
GLM-TTSGLM-TTS 是一款基于大语言模型的高质量文本转语音(TTS)合成系统,支持零样本语音克隆和流式推理。该系统采用两阶段架构,结合了用于语音 token 生成的大语言模型(LLM)和用于波形合成的流匹配(Flow Matching)模型。 通过引入多奖励强化学习框架,GLM-TTS 显著提升了合成语音的表现力,相比传统 TTS 系统实现了更自然的情感控制。Python00
Spark-Formalizer-X1-7BSpark-Formalizer 是由科大讯飞团队开发的专用大型语言模型,专注于数学自动形式化任务。该模型擅长将自然语言数学问题转化为精确的 Lean4 形式化语句,在形式化语句生成方面达到了业界领先水平。Python00