加速替代CUDA!摩尔线程开源vLLM
11月5日消息,加速近日,替代摩尔线程上线了大语言模型高速推理框架开源项目vLLM的线程MUSA移植版本,为开发者提供基于摩尔线程全功能GPU进行开源项目MUSA移植的开源范例。
摩尔线程表示,加速正努力围绕自主研发的替代统一系统架构GPU、MUSA软件平台,线程构建完善好用的开源MUSA应用生态。
vLLM是加速一个高效且易用的大模型推理和服务框架,支持创新的替代PagedAttention内存管理、连续批处理请求、线程CUDA/HIP图的开源快速模型执行、CUDA核心优化、加速分布式推理支持等,替代可显著提高大语言模型(LLM)的线程推理性能。
目前,vLLM已在各种大语言模型中得到广泛应用,成为业界常用的开源大模型推理框架。
摩尔线程基于vLLM v0.4.2版本,进行了移植适配,使之支持摩尔线程GPU后端Device,并完全开源,开发者可以二次开发、升级vLLM到社区更新版本等。
值得一提的是,得益于摩尔线程MUSA架构的先进性、软件栈对CUDA的优良兼容性,通过MUSIFY代码自动转换工具,用户可以快捷地将原有的CUDA代码迁移到MUSA平台,实现替代。
同时,CUDA相关库的调用,也可以快速替换为相应的MUSA加速库,如算子库muDNN、集合通信库MCCL、线性代数库muBLAS等。
摩尔线程通过MUSA软件栈对CUDA软件栈接口兼容,大幅提升了应用移植的效率,缩短了开发周期,还提供MUSIFY自动代码移植工具等一系列实用工具和脚本。
摩尔线程vLLM-MUSA开源地址:
https://github.com/MooreThreads/vLLM_musa
- ·全程90 帧丝滑吃鸡!天玑 8400畅玩《和平精英》 开黑最佳上分神器!
- ·阿斯帕斯突入禁区对抗后倒地,裁判未作判罚
- ·疾速6400MT/s!雷克沙战神之翼ARES RGB DDR5内存条图赏
- ·托比谈德布劳内批评队友:他让事情变得复杂,我们应团结走出困境
- ·[流言板]该做出改变了?过去15场比赛,国王仅取得5胜10负
- ·小鹏G6高速遭大货车追尾3人死里逃生:转身提了P7+
- ·比亚迪第二艘滚装船交付即运营:5000辆新车驶向欧洲
- ·保时捷霸气广告:谁都可以说赶超我 上赛道就不一定了
- ·全球最孤独的动物:这只大猩猩独囚商场36年 主人声称3000万可赎身
- ·[流言板]阿森纳球员萨卡与杰伦
- ·[流言板]发挥出色!布克全场砍下27分3篮板9助攻2抢断
- ·[流言板]ESPN:火箭与狄龙
- ·[流言板]奥斯卡发文告别海港:这里永远是我的家,感谢你们做的一切
- ·孔萨:很高兴在英格兰队获得比赛时间,恭喜凯恩达成百场里程碑
- ·世俱杯32强诞生!中超无缘参加,欧洲4大豪门集体缺席,梅西参赛
- ·[流言板]未来可期!乔丹