网站地图官方微信:
网站首页 古泉镇 蒋庄乡 兰江乡 黄溪镇 勐朗镇 民乐乡

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 索尼互动娱乐宣布 PS6 的开发工作已经全面启动,你会如何期待索尼的下一代游戏主机呢? |

    PS1是94年12月3日上市 PS2是2000年3月4日 P...

    查看详情>>
  • | 有哪些BI工具惊艳了你? |

  • | 写业务的话,go是不是垃圾? |

  • | TVB 演员陈慧珊转行当英语老师,称已拿博士学位,如何看待她的选择?为什么这么多 TVB 演员转行? |

  • | MacOS真的比Windows流畅吗? |

  • | 系统太稳定了甲方觉得我们没有工作量,怎么收运维费? |

  • | 卫监查实医院当天排班表中没有该医生,但是在封存的医院住院病历中却有“上级医师查房记录”是病历造***吗? |

  • | 为什么很多技术都觉得前端很简单? |

  • | 杨幂论文一年间 AI 率从 0 飙至 91%,为什么会这样?AI 查重到底有没有统一标准? |

  • | 为什么这么多人讨厌中国移动? |

  • | 为什么香港在知乎这么不被看好? |

  • 因为苹果家的技术,能强大到改变现实法则。 2024年款苹果...

    2025-06-27
  • 先说一个绝对没人知道的,ZoomIt。 有什么用呢? 可以...

    2025-06-27
  • 主板有VGA灯? 你用的VGA接口? 无论是用VGA DVI...

    2025-06-27
  • 听说过chatgpt吗 你让他给你写个前端页面看看,写的贼溜...

    2025-06-27

关注我们

添加微信好友,关注最新动态