就是玩

Your description here.

首页 任意传(Any Transfer) 关于

李沐老师【动手学深度学习v2】 P65 注意力分数——Additive Attention 代码深度注释 & 数据流程图

  • 作者: richard
  • 时间: 2024-05-17
  • 分类: 默认分类

这一章维度转换比较复杂,我整理了一下,图片看不清的话可以在新窗口中打开,或者另存为:

代码深度注释,代码中有些变量为了更容易理解,我稍微做了重命名:
Additive Attention - Code.png

数据流程图:
Additive Attention - Flow.png

标签: none

已有 8 条评论

  1. Moments Moments
    October 18th, 2024 at 11:22 pm

    good

    回复
  2. 1 1
    May 16th, 2025 at 01:51 am

    1

    回复
  3. 1 1
    May 16th, 2025 at 01:54 am

    1

    回复
    1. 1 1
      May 16th, 2025 at 03:08 am

      1

      回复
    2. 1 1
      May 16th, 2025 at 03:08 am

      1

      回复
    3. 1 1
      May 16th, 2025 at 03:10 am

      1

      回复
  4. 1 1
    May 16th, 2025 at 02:20 am

    555

    回复
  5. 1 1
    May 16th, 2025 at 02:51 am

    1

    回复
取消回复

添加新评论

  • 上一篇: 【教程】使用 FreeFileSync 对极空间进行多账号增量备份
  • 下一篇: Tortoise SVN, Git 图标一键恢复工具

最新文章

  • 通过50行代码,让你理解深度学习中的反向传播、梯度下降和计算图原理
  • LeRobot 常用脚本大全
  • Tortoise SVN, Git 图标一键恢复工具
  • 李沐老师【动手学深度学习v2】 P65 注意力分数——Additive Attention 代码深度注释 & 数据流程图
  • 【教程】使用 FreeFileSync 对极空间进行多账号增量备份
  • 反向传播梯度公式推导
  • 群晖 NoteStation 批量倒入到思源笔记
  • 欢迎使用 Typecho

最近回复

  • 1: 1
  • 1: 1
  • 1: 1
  • 1: 1
  • 1: 1
  • 1: 1
  • 1: 1
  • 1: 1
  • 1: 1
  • 1: 1
© 2025 就是玩. 由 Typecho 强力驱动.
粤ICP备2023129842号