linux 基本命令 1. 登录服务器 内网:ssh root@ip 外网:ssh -p 端口号 root@ip 2. 删除移动复制 删除...

7月 28, 2022

1. linux 服务器相关 查看当前文件夹及其子文件夹的数量: ls -lR | grep -c "^-" kill 了...

以 Qwen2-VL 为例,介绍如何使用 vLLM 部署大模型并提供 OpenAI 兼容的接口服务. 环境安装 有几个坑,对于 qwen2-vl...

这部分讲一下 VLM 训练的逻辑,例如常见的 LLaVA,Qwen-VL 等等,从图文提取,图文处理和训练逻辑等方面进行介绍,后面的介绍还是以 ...

InternVL: Learning Transferable Visual Models From Natural Language Sup...

全部大写字母改为小写,同时不要加句号 import torch from transformers import AutoModel, Auto...

8月 26, 2025

什么是 sub_group_size 参数? 在分布式深度学习中,NVIDIA 的 DeepSpeed 和 NCCL 是常用的深度学习优化工具,...

8月 21, 2025

旋转位置编码(简称 RoPE)是一种用于 Transformer 类模型的相对位置编码方法,在像 Llama 等模型中被广泛应用。 1. 1D ...

Learning Transferable Visual Models From Natural Language Supervision C...

强化学习回顾 在阅读本文之前,强烈建议先学习一下 PPO 算法,不然后面可能会听的云里雾里。本文参考知乎博客《RLHF 的 PPO 算法解析》 ...