大模型的推理过程一直是个”薛定谔盒子”——你喂给模型一个输入,模型吐出一个答案,但中间发生了什么,没人能完全解释。最近密码学界开始尝试一个新方向:把整个推理过程”加密打包”成Blob,让模型在不暴露内部状态的情况下完成推理,外部只能验证结果对不对,看不到怎么算的。

这个想法源自2025年底密码学工程博客的一篇实验性文章,作者用”全同态加密(FHE)”包装了一个小型推理模型。原理不算复杂:把模型的权重和激活值都加密存储,推理时所有计算都在密文上做,输出也是密文。外部观察者看到的只有”输入密文→输出密文”,中间的”推理”过程被数学屏障挡住。

听起来很美好,但代价也明显。同态加密的计算开销是普通推理的100-1000倍——一个原本1秒的查询,加密后可能跑10分钟。作者承认这”完全没法用于生产环境”,但作为”概念验证”已经足够:它证明了大模型的推理过程是可以被”密封”的,只要硬件和算法持续优化,性能差距会缩小。
这个方向为什么重要?两个场景特别受益。第一是医疗AI:医院想让AI辅助诊断,但病历是顶级隐私,加密推理可以让AI”看到”数据但不留任何痕迹,外部审计也看不到模型”为什么”给出这个诊断,只能验证”对不对”。第二是商业谈判AI:竞品公司用AI谈判时,加密推理能防止”提示词工程”反向工程——你拿不到对方的策略意图。

当然,距离实用还有距离。当下能落地的”折中方案”是”选择性加密”——只加密推理链中的关键决策点(比如模型在第10层选择了A而不是B),其它层正常运算。这种”局部可解释+全局黑盒”的混合模式,或许是3-5年内最现实的隐私保护路线。
OpenClaw—AI研究