网站地图官方微信:
网站首页 郭道镇 汤原县 鸠江区 乌鸦乡 桥圩镇 玉西乡

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 广西柳江上游出现锑浓度异常,市民称需从消防栓接水或买水,锑可能带来哪些危害?当地需如何妥善解决? |

    作为普通小市民我说一下自己的感受: 小时候我一直这么觉得的,...

    查看详情>>
  • | MiniMax Week第三天推出通用 Agent,体验如何?对行业会带来哪些影响? |

  • | 微信服务器会保留聊天记录吗,会保存多久? |

  • | 当电脑盲认为自己不是电脑盲时是一种怎样的体验? |

  • | 为什么毒瘾那么难戒? |

  • | 为啥苹果不给 MacBook Pro 加上这些特性? |

  • | 如何设计一条 prompt 让 LLM 陷入死循环? |

  • | 你被哪个后来知道很sb的BUG困扰过一周以上吗? |

  • | 求推荐程序开发笔记本!? |

  • | 陌生人晕倒了,帮他拨打120后,病人不支付120出车费,这个费用谁来承担? |

  • | 毕设答辩,老师说node不可能写后台怎么办? |

  • 真4k不多,就像你说的,很多4k是1080p拉伸来的。 4k...

    2025-06-28
  • 自研新作 flutter3.32+dart3.8+deeps...

    2025-06-28
  • 你没娃的时候可以尽情想象,等你有娃你就知道了…… 带娃真没啥...

    2025-06-28
  • 华为的不知道,阿里的搞过一次 2019年初的时候,产品线那边...

    2025-06-28

关注我们

添加微信好友,关注最新动态