开云app官方在线 摩尔线程MTTS5000:80GB显存 单卡算力1千万亿次

发布日期:2026-02-14 13:12    点击次数:155

开云app官方在线 摩尔线程MTTS5000:80GB显存 单卡算力1千万亿次

2月12日音书,智谱发布新一代大模子GLM-5之后,立即秘书,在旗舰级AI训推一体全功能GPU MTT S5000上完成了Day-0全经由适配与考据,第一时刻提供撑抓。

MTT S5000是摩尔线程专为大模子推行、推理及高性能运筹帷幄联想的全功能GPU智算卡,基于第四代MUSA架构“平湖”,原生适配PyTorch、Megatron-LM、vLLM、SGLang等主流框架。

它早在2024年就一经低调推出,然则具体造型、参数、性能一直莫得对外公开,荒谬奥妙。

此次在秘书适配GLM-5的同期,摩尔线程初次公布了MTT S5000的部分参数和性能,荒谬惊喜!

据悉,MTT S5000单卡配备多达80GB显存,显存带宽高达1.6TB/s,对比上代MTT S4000分辩提高了67%、113%,多卡间的互联带宽也有784GB/s。

它完好撑抓从FP8到FP64的全精度运筹帷幄,况兼是国内最早原生撑抓FP8精度的推行GPU之一,建树了硬件级FP8 Tensor Core加快单位。

FP8比拟BF16/FP16可将数据位宽减半、显存带宽压力缩短50%、表面运筹帷幄糊涂量翻倍,并全面撑抓DeepSeek、Qwen等架构,开云体育推行性能可提高30%以上。

MTT S5000的单卡FP8 AI算力最高可达1000 TFLOPS,初次达到PFLOPS级别,也即是每秒1千万亿次运筹帷幄。

比拟之下,MTT S4000的算力为INT8 256 TOPS、BF16 128 TFLOPS、FP32/64 32/64 TFLOPS。

据业内东说念主士称,MTT S5000实测性能不错对标NVIDIA H100,尤其是在多模态大模子微调任务中,部分性能更是杰出H100,以致开动接近最新的Blackwell架构。

2026年1月,开云app官方智源参议院基于MTT S5000千卡集群,完成了前沿具身大脑模子RoboBrain 2.5(数千亿参数)的端到端推行与对都考据,MTT S5000发达出了与H100集群极高的适度一致性,练亏本值(loss)相反仅为0.62%,举座推行着力以致达成小幅杰出。

另据互联网厂商的场景实测,MTT S5000在典型端到端推理及推行任务中,性能不错达到NVIDIA H20的2.5倍操纵。

当今,基于MTT S5000的夸娥万卡集群一经落地,浮点运算才能达到10Flops(每秒1千亿亿次运筹帷幄),在Dense高贵模子推行中MFU达到60%,在MoE群众模子中看守在40%操纵,有用推行时刻占比跨越90%,推行线性扩张着力达95%。

基于原生FP8才能,它能完好复现顶尖大模子的推行经由,Flash Attention算力愚弄率跨越95%,多项重要讨论均达到国外主活水平。

值得一提的是,MTT S5000在集群通讯层面选拔草创的ACE时刻,将复杂通讯任务从运筹帷幄中枢卸载,大幅提高模子算力愚弄率(MFU)。

实测显现,MTT S5000从64卡扩张至1024卡,系统的线性扩张着力保抓在90%以上,推行速率随算力加多实在同步倍增。

{jz:field.toptypename/}

{jz:field.toptypename/}

MTT S5000在推理场景相通发达优异,比如在2025年12月,摩尔线程聚会硅基流动基于MTT S5000完成了对DeepSeek-V3 671B满血版的深度适配与性能测试。

实测单卡Prefill糊涂跨越4000 tokens/s,Decode糊涂跨越1000 tokens/s,刷新了国产GPU的推理记录。




Copyright © 1998-2026 开云app官方在线入口™版权所有

wxshuangluan.com 备案号 备案号: 京ICP备2026011999号-15

技术支持:®开云app RSS地图 HTML地图