MIT CSAIL:70 年存储进化——从 3.75MB 到 1TB
MIT CSAIL 对比展示存储技术 70 年演进:1956 年硬盘仅 3.75MB,如今同等体积可存储 1TB,计算基础设施的飞跃令人惊叹。
查看原文核心要点
2026 年 4 月 5 日,MIT CSAIL(计算机科学与人工智能实验室)通过社交媒体发布了一组极具冲击力的对比数据:1956 年 IBM 为美国空军制造的 RAMAC 305 系统,单块硬盘容量仅 3.75MB,体积却占据数个机柜;而 70 年后的今天,同样物理空间可容纳 1TB 数据——容量增长超过 26 万倍。这一数据对比浓缩了存储介质从磁芯/磁鼓到 HDD 再到 SSD/NAND 的完整技术迭代路径,折射出计算基础设施在半导体、材料工程、密度控制等维度的系统性跃迁。
原文 + 中文翻译
原文:"70 years of storage evolution: from 3.75MB in 1956 to 1TB today — in the same physical space. The scale of what's possible has transformed entirely."
翻译:"70 年存储进化史:从 1956 年的 3.75MB 到今天的 1TB——在同样的物理空间内。可能性规模已彻底改变。"
深度解读
1. 存储密度的指数增长是半导体工业的缩影
从 3.75MB 到 1TB 的跨越(约 26.7 万倍增长),背后并非单一技术突破,而是多个工程极限的接力式突破。首先是磁记录密度:从早期每平方英寸几十 KB,到如今HAMR(热辅助磁记录)技术已突破每平方英寸 3TB 以上。其次是存储介质形态的根本转变——从磁鼓(机械旋转)到磁盘再到 NAND Flash/3D V-NAND,数据的物理组织方式发生了三次范式转移。MIT CSAIL 选择以"同等物理空间"为标尺,恰恰说明密度提升不只依赖单元尺寸微缩,更依赖堆叠层数增加(3D NAND 已有超过 300 层产品)与架构创新的双重驱动。
2. 这一跨越对 AI 基础设施的含义
存储密度的指数增长与当前 AI 训练/推理的海量数据需求形成了正反馈循环。GPT-4 级别的模型训练需数 TB 级别的高质量语料,LoRA 微调与 RAG(检索增强生成)系统对本地向量数据库的需求动辄数百 GB。70 年前 RAMAC 的 3.75MB 容量甚至无法容纳一个完整 BERT 模型的分词器词表(通常约 3 万词条)。今天单块 1TB NVMe SSD 已可支撑中小规模模型的实时推理部署,成本从当年数十万美元(RAMAC 租赁价格约月费 3,200 美元,折合今天超过 3 万美元)降至普通消费级约 60-80 美元。这种成本结构变化使"存储即算力"的边界持续模糊,存储层级(memory tier)正在成为 AI 系统设计的核心变量。
3. 能耗与可靠性:密度提升的隐性代价
存储密度攀升的同时,功耗与数据持久性风险也在演变。1956 年的磁鼓系统能耗极高但数据寿命极长(室温下磁性介质可保存数十年)。现代 QLC NAND 在提升密度的同时,擦写次数(P/E Cycle)已降至约 1,000 次,消费级 SSD 的数据保持期在断电状态下通常为 1 年以内。对于需要长期归档的场景,磁带(LTO Tape)与HAMR HDD 仍是不可替代的选择——MIT CSAIL 的对比更多呈现的是容量数字的戏剧性,而非对不同存储介质适用场景的综合评判。
值得关注
- Samsung 与 SK Hynix 的 3D NAND 层数竞赛:2026 年初 SK Hynix 已展示超过 400 层 3D NAND 原型,2026 年内是否会出现 500 层产品上市,将直接影响 1TB SSD 的成本能否下探至 50 美元以下。
- HAMR 技术的商业化进度:Seagate 已在 2024-2025 年推出采用 HAMR 的 30TB+ HDD,企业级市场的 HAMR 渗透率何时突破 30%,将重新定义冷数据存储的经济模型。
- CXL(Compute Express Link)内存池化:CXL 3.0 规范正在推动存储与 DRAM 的边界融合,2026 年主流服务器平台对 CXL 的原生支持程度,将决定"同等物理空间"内存储与内存的动态分配能力。
- AI 推理场景对存储 IOPS 的需求:随着 KV Cache 规模增大(单个 70B 模型满载 KV Cache 约 160GB),高密度 DRAM 与存储的混合架构设计将成为新课题,而非单纯比拼容量数字。
- DNA 存储与分子存储的前沿实验:MIT CSAIL 本身的团队(包括 researchers 代号如 J. B.等)已有多篇论文探索分子级存储,若实验性技术进入工程化阶段,"同等物理空间"的容量上限可能再跳升 3-5 个数量级。
信源行:
原文链接:https://x.com/MIT_CSAIL/status/2040821838352113927
背景报道:Wikipedia - IBM 305 RAMAC(1956 年磁记录系统历史档案);AnandTech(现代 NAND/SSD 密度追踪);Semiconductor Digest(HAMR 技术商业化进程)。