v100 优化方案 - 妞妞推工作室

v100 其实是支持int8张量的，但方法跟图灵不一样，下面是说明文件

https://github.com/ai-bond/flash-attention-v100/blob/main/docs/volta.md

flashattention的优化方案：

https://github.com/ai-bond/flash-attention-v100

目前有人用sageattention 运行成功，但貌似速度很一般。有人提出，还不如flashattention的方案。希望在未来能得到优化把，暂时不研究v100的 sageattention方案。只能用sageattn_qk_int8_pv_fp16_triton 这个模式运行，说明资料如下

https://github.com/Ph0rk0z/SageAttention2/issues/11

triton-lang/triton-windows: Triton with Windows support

zimage加速方案

https://www.bilibili.com/video/BV1kTmxB8EpW

标签: none

添加新评论

上一篇: 2080ti等图灵系列显卡windows 编译安装 sage 和 nunchaku插件。
下一篇: sd-webui-forge-classic neo 安装教程

最新文章
sd-webui-forge-classic neo 安装教程
v100 优化方案
2080ti等图灵系列显卡windows 编译安装 sage 和 nunchaku插件。
ubuntu安装forgeui neo
2080ti 和v100 加速方案
ubuntu修改虚拟内存
ubuntu通过释放cache内存解决ubuntu死机问题
ubuntu挂载windows局域网硬盘
sd-forge使用ip-adapter安装细节补充
Stable Diffusion WebUI Forge 中通过 API 调整 GPU 显存分配的解决方案

最近回复
admin: yum install -y wget && wget -O i...
Chrome233: 多用户wg方案页面貌似不能访问了，可以补档吗？谢谢

分类
技术分享
账号分享
游戏赚钱
阅读赚钱
苹果赚钱

归档
March 2026
February 2026
January 2026
December 2025
November 2025
August 2025
July 2025
June 2025
May 2025
April 2025
March 2025
November 2024
October 2024
September 2024
August 2024
July 2024
June 2024
May 2024
April 2024
March 2024
February 2024
January 2024
December 2023
November 2023
October 2023
September 2023
July 2023
June 2023
May 2023
December 2022
August 2022
July 2022
April 2022
March 2022
November 2021
October 2021
April 2021
March 2021
February 2021
January 2021
November 2020
October 2020
August 2020
July 2020
June 2020
April 2020
March 2020
February 2020
December 2019
June 2019
May 2019
April 2019
March 2019
December 2018
October 2018
September 2018
August 2018

其它
登录
文章 RSS
评论 RSS