标签大模型下的文章 - 董昊的个人博客

登录

标签搜索

DONG HAO

累计撰写 160 篇文章
累计收到 78 条评论

搜索到 1 篇与大模型的结果

2025-05-09
计算大模型需要的GPU内存计算大模型需要的GPU内存一个大模型需要多大 GPU 内存才能跑起来的计算公式：M = ((P * 4B) / (32 / Q) ) * 1.2M: 所需的 GPU 显存，单位是 GB。P: 模型的参数数量。例如，7B 模型有 70 亿个参数。4B: 每个参数占用的字节数，这里假设每个参数占用 4 个字节（通常指 FP32 或 Float32 格式）。32: 4 个字节等于 32 位。Q: 加载模型时使用的位数。例如，16 位 (FP16/BF16)，8 位 (INT8) 或 4 位 (INT4)。这通常称为量化。1.2: 表示额外开销的系数，通常为 20%。这考虑了除了模型权重之外还需要加载到 GPU 显存中的其他数据，例如优化器状态、梯度等。‍举个例子：使用 FP16 量化加载 Llama 70B 模型，计算过程就是 M = ( (70,000,000,000 4) / (32 / 16) ) 1.2 = 168 GB‍
- 2025年05月09日
- 120 阅读
- 0 评论
- 0 点赞