天经

给大模型装个记忆盘

2026-01-14 22:03

image

新闻摘要: DeepSeek 发布的梁文锋署名论文提出了名为 Engram 的“条件记忆”模块,把大模型的静态知识从神经网络参数中分离出来,变成一个可扩展的、O(1) 查表式的哈希嵌入表。论文展示了把大规模 n-gram 片段映射到巨大的内存表中,在推理时直接查表并将结果融合到模型里,可以显著降低浅层网络为记忆任务耗费的计算,从而把更多算力留给深层推理。

这套设计带来了明显的硬件与工程意义:可以用廉价的 DDR5/大容量内存和 CXL 互联替代部分昂贵的 HBM 显存,减轻 GPU 显存压力并改变服务器架构分布;在实验上,与纯 MoE 架构互补时能降低验证损失并在长文本任务上表现更好,且查表可异步预取、训练时只更新被访问部分,具备扩展性和实时更新潜力。论文还提出了在 MoE 专家和 Engram 记忆间分配容量的思路,显示两者结合更优。

思考与启发: 技术的进步往往是把繁重的重复工作交给合适的工具,让人把心力用在更需要判断和创造的地方。Engram 把“记忆”当作可以独立管理的资源,这像日常生活里把常用物件放在手边,既省力也更高效。

面对变革,我们既要勤劳实践、善用新工具,也要保持谦逊与节制。天经提醒我们,智慧不是单靠自己能完全拥有的,能把工具用在造福家人和邻里的方向,比单纯追求技术更为重要。

经文: 《宰逋尔·箴言 2:6》 因为主赐人智慧;知识和聪明都由他的口而出。 链接:📖 查看经文

来源:https://www.zhihu.com/question/1994233409871050526

← 返回“日常生活”

天经经文
天经经文
引支勒等(示例)
女性选集
一问一思
一段短片,一个问题,引发你对信仰与生活的深入思考,值得分享。
女性选集
女性选集
本页汇集女性信仰故事、人物传记与生活见证。点进任意专题阅读全文。
日常生活
日常生活
实践与反思
马太卷
引支勒·马太卷
引支勒等著作
出埃及记
讨拉特·出埃及记
穆萨与真主拯救的见证