wandb: Network error (ConnectionError), entering retry loop.
image
本文字数:257 字 | 阅读时长 ≈ 1 min

wandb: Network error (ConnectionError), entering retry loop.

image
本文字数:257 字 | 阅读时长 ≈ 1 min

这是网络的原因,目前没有直接的解决方法,但是有间接的解决方法

GitHub 讨论:wandb
官网解决方案:wandb

GitHub 上貌似没有很好的解决方法,官网给出了两个解决方案。进入上述链接,然后搜索以下关键字

How do I deal with network issues?

1. SSL certificate

解决 SSL certificate,我没有管理员权限,无法更改,而且更改完之后可能依然会报错?

2. offline

推荐:将模型存储成 offline 形式,然后等网络好之后(或者找一台能够登陆 wandb 的电脑)同步上去即可

方案链接:Is it possible to save metrics offline and sync them to W&B later?

方法很简单,在其他不变的情况下,在文件开始加入下面两句

os.environ["WANDB_API_KEY"] = YOUR_KEY_HERE
os.environ["WANDB_MODE"] = "offline"

最后训练完后会出现 wandb sync wandb/xxx,按照提示同步即可

3. 本地

方案链接

在本地运行 wandb,缺点是无法同步

9月 09, 2024