跳转至

深度学习

神经网络层

LLM from scratch

  1. 注意力机制
  2. 编码器与解码器
  3. 绝对位置编码
  4. RoPE
  5. transformer变种
  6. 大模型推理

评论