网站地图官方微信:
网站首页 颜店镇 许湾乡 畜牧场 龙形镇 荣丁镇 盘石镇

当前位置: 首页 >

写CUDA到底难在哪?

对GPU进行性能优化时,cudagraph是绕不开的话题。

不仅是GPU,大部分的xpu都会提供类似graph mode的优化,相比于每次分别由CPU进行kernel launch的eager mode,graph mode通常都会有较大性能提升,然而也经常容易出现各种各样的奇怪问题。

NVIDIA有一个简单的 博客 介绍,其中只使用了stream capture的形式来构造cudagraph,而且本质上就是多个kernel前后提交,根本无法展示cudagraph的复杂性。

本文尝试从底层原理出发,根据文档 和 …。

写CUDA到底难在哪?

  • | 苹果 6 月 10 日召开的 2025 年全球开发者大会「WWDC25」,有哪些值得关注的信息? |

    认真思考之后我觉得,Liquid Glass 是苹果近年来最...

    查看详情>>
  • | 为何雷军天天健身,却无健身痕迹? |

  • | M1 如此高的性能在 iPad 上究竟有什么用? |

  • | 怎么看待B站舞蹈区和某些风格比较暴露的up? |

  • | 公司老板不想续费3w一年的云服务器,合理吗? |

  • | PHP现在真的已经过时了吗? |

  • | 四岁的女孩儿跳舞怕压腿,家长该坚持吗? |

  • | 请问照片里这个人是谁呀? |

  • | 在C中,如何实现删掉一行注释无法运行? |

  • | 歼20速度接近3马赫是什么水平? |

  • | 为什么中国主机带宽比美国贵5倍(原来错误的10000倍),比如阿里云? |

  • 有包装,大家嫌弃过度包装。 没有包装大家嫌弃太过简陋。 不同...

    2025-06-24
  • 代码仓库 gitee 创建项目cargo new rust-...

    2025-06-24
  • 第一眼:圆角没处理成连续曲率 第二眼:甚至连组件间距都不一致...

    2025-06-24
  • 看懂现在的世界局势,你才能理解中伊关系。 我们正在成为历史...

    2025-06-24

关注我们

添加微信好友,关注最新动态