The Llama 3 Herd of Models Llama 2: Open Foundation and Fine-Tuned Chat...

10月 06, 2024

transformer 的 attention 机制本身是不带有位置信息的,因此对于文本序列,attention 机制本身就会丢失掉原文当中的序...

Qwen-VL: A Versatile Vision-Language Model for Understanding, Localizat...

9月 30, 2024

1. 登录 dockerhub 登录并注册dockerhub 在 linux 端登录 (python) ➜ harryyhwang docker...

以 FP16 来举例,FP16(半精度浮点数)使用 16 位来表示一个数字,其中包括 1 位符号位、5 位指数位和 10 位尾数位(也称为小数或...

现在我想实现一个这样的需求: 将 nfs 盘挂载在 /llm-cfs 下面,但是我的服务器必须挂载在 /apd 文件夹下,也就是说我最终只能挂载...

1. tqdm 简介 Github 地址: https://github.com/tqdm/tqdm 安装: pip install tqdm ...

9月 09, 2024

1. 下载文件并配置 wget https://raw.github.com/sivel/speedtest-cli/master/speedt...

Python 多线程是指在同一个进程中,通过多个线程并发执行,以提高程序的并发性和响应性 Python 自带 threading 模块,封装了底...

9月 06, 2024