harry's blog

在 PyTorch 中，我们经常需要查看和分析模型的参数信息。本文将介绍几个常用的参数查看和统计方法。

1. 查看模型参数信息

1.1 查看需要梯度的参数

以下代码可以列出模型中所有需要计算梯度的参数名称：

def print_trainable_parameters(model):
    for name, param in model.named_parameters():
        if param.requires_grad:
            print(f"Trainable parameter: {name}")

1.2 查看非 GPU 参数

检查哪些参数没有被加载到 GPU 上：

def print_cpu_parameters(model):
    for name, param in model.named_parameters():
        if not param.is_cuda:
            print(f"Parameter on CPU: {name}")

1.3 查看 Float32 类型参数

列出所有 float32 类型的参数：

def print_float32_parameters(model):
    for name, param in model.named_parameters():
        if param.dtype == torch.float32:
            print(f"Float32 parameter: {name}")

1.4 查看 name、size、requires_grad 和 dtype

for name, param in model.named_parameters():
    print(f"Name: {name}, {param.size()}, Grad: {param.requires_grad}, {param.dtype}")

2. 统计模型参数量

以下代码可以计算模型的总参数量，并转换为十亿级别显示：

def count_parameters(model):
    total_params = sum(p.numel() for p in model.parameters())
    total_params_billion = total_params / 1e9
    
    # 可选：打印每层参数详情
    for name, param in model.named_parameters():
        print(f"{name}: {param.shape}, 参数量: {param.numel():,}")

    print(f"模型参数统计:")
    print(f"总参数量: {total_params:,}")
    print(f"十亿级参数量: {total_params_billion:.3f}B")

使用示例

# 假设已经定义了模型
model = YourModel()

# 打印需要训练的参数
print_trainable_parameters(model)

# 统计模型参数量
count_parameters(model)

注意事项

使用 named_parameters() 可以同时获取参数名称和参数值
numel() 方法用于计算张量中的元素总数
参数类型检查可以使用 dtype 属性
GPU 状态检查可以使用 is_cuda 属性

本文由 Yonghui Wang 创作，采用知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外，均为本站原创或翻译，转载前请务必署名
最后编辑时间为: Sep 16, 2025 07:32 pm

pytorch 中输出模型参数名和梯度的一些操作