3月 26, 2025

1. 哈希表 哈希表(Hash Table)是一种基于数组的集合数据结构,它能够通过一个哈希函数将元素映射到数组的索引上,从而使得数据存储和检索...

3月 24, 2025

GPT-1 回答你的问题:GPT-1 在输入时已经包含了多个答案,那么如何计算每个答案的概率? 是的,在 GPT-1 的方法中,每个候选答案都是...

DeepSeek-R1:强化学习如何提升大模型的推理能力 1. 引言 随着OpenAI的o1-preview发布,思维链(Chain of Th...

1. 为什么需要位置编码? 1.1 一个直观的例子 假设:没有位置编码,下面这句话 “The cat sat on the mat.”(猫坐在...

在 Transformer 结构中,Attention 机制是核心,下面我们介绍各种 Attention 的变体 假设我们有一个句子: “我 ...

要讲 attention,肯定就离不开Attention is All You Need这篇文章,虽然我之前都是看的视觉任务,但是视觉任务比如 ...

Deepseek v1 1. 模型结构 Deepseek LLM 第一版本。 目前,ChatGPT、Claude、Bard 等封闭模型引领了 L...

CLIP: Learning Transferable Visual Models From Natural Language Supervi...

3月 10, 2025

pip install -e . 命令在可编辑模式下安装 Python 包时,实际上是通过创建一个指向源代码目录的链接来实现的。以下是这个过程的...