harry's blog

在训练神经网络的时候我们有时需要输出网络中间层，一般来说我们有两种处理方法：一种是在 model 的 forward 中保存中间层的变量，然后再 return 的时候将其和结果一起返回；另一种是使用 pytorch 自带的 register_forward_hook，即 hook 机制

1. register_forward_hook

register_forward_hook(hook)

返回 module 中的一个前向的 hook，这个 hook 每次在执行模型中forward函数的时候都会被调用
hook: hook(module, input, output)

可能不是很好理解，我们直接用一个例子来说明，如下所示，首先我们将 hook 包装在类 SaveValues 中，我们现在想要获取模型 Net 中的 l1 的输入和输出，因此将 model.l1 存入到类中：value = SaveValues(model.l1)，在类中定义一个 hook_fn_act 函数，此函数的作用是随着我们的 register_forward_hook 函数获取 Net 的某一层的名字，输入以及输出，在这里对应的就是 model.l1 的输入和输出，最终我们将他获取的网络层的名字、输入以及输出保存到类 SaveValues 中方便我们输出

注意：hook_fn_act 函数必须有三个参数，分别对应 module，input 以及 output

class SaveValues():
    def __init__(self, layer):
        self.model  = None
        self.input  = None
        self.output = None
        self.grad_input  = None
        self.grad_output = None
        self.forward_hook  = layer.register_forward_hook(self.hook_fn_act)
        self.backward_hook = layer.register_full_backward_hook(self.hook_fn_grad)
    def hook_fn_act(self, module, input, output):
        self.model  = module
        self.input  = input[0]
        self.output = output
    def hook_fn_grad(self, module, grad_input, grad_output):
        self.grad_input  = grad_input[0]
        self.grad_output = grad_output[0]
    def remove(self):
        self.forward_hook.remove()
        self.backward_hook.remove()

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.l1 = nn.Linear(2, 5)
        self.l2 = nn.Linear(5, 10)

    def forward(self, x):
        x = self.l1(x)
        x = self.l2(x)
        return x

l1loss = nn.L1Loss()
model  = Net()
value  = SaveValues(model.l2)
gt = torch.ones((10,), dtype=torch.float32, requires_grad=False)
x  = torch.ones((2,), dtype=torch.float32, requires_grad=False)

y = model(x)
loss  = l1loss(y, gt)
loss.backward()
x += 1.2
value.remove()

运行上述程序，当我们运行到 y = model(x) 这一行时，我们看一下 value 中的值（图左），当我们运行完 y = model(x) 时，我们看一下 value 中的值（图右），这是因为在执行 net 中的 forward 函数时，我们的 hook 机制会从中提取出网络的输入和输出，不执行 forward 就不会提取

注意：当我们不想在提取网络中间层时，我们调用 value.remove()即可，即删除了网络中的 hook。但是在训练网络时我们可能需要输出每个 epoch 的中间层信息，那么在 for 循环中就不需要删除 hook 啦

2. register_full_backward_hook

好像这个反向 hook 很少用到？

register_forward_hook(hook)

返回 module 中的一个反向的 hook，这个 hook 每次在执行forward的时候都会被调用
hook: hook(module, grad_input, grad_output)

继续上述的代码，这次我们运行到 loss.backward() 之前与之后查看 value 中存储的 grad 的变化，如下所示，可以发现在没有反向传播之前 grad 为 None，当我们执行反向传播之后 grad 就有值了

注意：这里将 layer 换成了 l2，因为第一层 l1 经过 backward 之后依然是左图不变，可能是第一层没有梯度？

value  = SaveValues(model.l2)  # modify here: model.l1--->model.l2

3. remove

关于 remove 其实如果显存足够可以不用 remove，虽然每个 epoch 的时候 hook 的值都会变化，但是只占用一个 hook 的内存，除非开销很大可以考虑 remove

4. visual

当我们的 SaveValues 类提取出特征图之后，就可以对 value.output 进行可视化啦

当然如果有需要也可以用 input、output 或者 grad 进行相应的操作

本文由 Yonghui Wang 创作，采用知识共享署名4.0 国际许可协议进行许可
本站文章除注明转载/出处外，均为本站原创或翻译，转载前请务必署名
最后编辑时间为: Dec 19, 2024 12:13 pm

pytorch 的 hook 机制

1. register_forward_hook

2. register_full_backward_hook

3. remove

4. visual