第一時(shí)間!摩爾線程MTT S5000適配阿里Qwen3.5三款新模型體育·APP,??太極生兩儀??現(xiàn)在下載安裝,周周送518。業(yè)界賠率最佳,賽事最全,涵蓋海量熱門體育賽事,提供視頻直播。專業(yè)體育數(shù)據(jù)統(tǒng)計(jì),滿足對(duì)體育賽事的一切需求!
相關(guān)推薦: 1.2.3.4.5.6.7.8.9.10.11.12.13.14.15.16.17.18.19.20.21.22.23.24.25.26.27.28.29.30.
2月26日消息,間摩在開源大規(guī)模的爾線Qwen3.5-397B-A17B之后,阿里宣布再次開源千問(wèn)Qwen3.5最新三款中等規(guī)模模型:Qwen3.5-35B-A3B、新模型Qwen3.5-122B-A10B、間摩Qwen3.5-27B。爾線
摩爾線程第一時(shí)間極速響應(yīng),新模型在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上完成了對(duì)這三款全新模型的間摩全方位適配。
此次高效支持,爾線充分展示了摩爾線程MUSA生態(tài)的新模型成熟度與完備性。
在本次Qwen3.5系列模型的間摩適配過(guò)程中,MUSA生態(tài)賦能開發(fā)者的爾線兩大核心能力得到了有力驗(yàn)證:
▼原生MUSA C支持:
允許開發(fā)者直接使用MUSA C進(jìn)行內(nèi)核開發(fā),大幅降低CUDA生態(tài)遷移門檻;
▼深度兼容Triton-MUSA:
開發(fā)者可使用熟悉的新模型Triton語(yǔ)法編寫高性能算子,并通過(guò)Triton-MUSA后端,間摩無(wú)縫運(yùn)行在摩爾線程全功能GPU上。爾線
在底層技術(shù)層面,新模型針對(duì)Qwen3.5多模態(tài)模型采用的混合注意力機(jī)制,摩爾線程實(shí)現(xiàn)了原生優(yōu)化。
基于muDNN計(jì)算庫(kù)和MATE開源算子庫(kù),摩爾線程為混合注意力機(jī)制中的長(zhǎng)序列處理提供高效支撐,成功在MTT S5000上實(shí)現(xiàn)了該模型的高性能推理。
從GLM-5、MiniMax M2.5、Kimi K2.5到Qwen3.5系列,摩爾線程對(duì)SOTA大模型的極速適配已成常態(tài)。
MTT S5000是摩爾線程專為大模型訓(xùn)練、推理及高性能計(jì)算設(shè)計(jì)的全功能GPU智算卡,基于第四代MUSA架構(gòu)“平湖”,原生適配PyTorch、Megatron-LM、vLLM、SGLang等主流框架。
MTT S5000單卡配備多達(dá)80GB顯存,顯存帶寬高達(dá)1.6TB/s,對(duì)比上代MTT S4000分別提升了67%、113%,多卡間的互聯(lián)帶寬也有784GB/s。
它完整支持從FP8到FP64的全精度計(jì)算,而且是國(guó)內(nèi)最早原生支持FP8精度的訓(xùn)練GPU之一,配置了硬件級(jí)FP8 Tensor Core加速單元。
單卡FP8 AI算力最高可達(dá)1000 TFLOPS,首次達(dá)到PFLOPS級(jí)別,也就是每秒1千萬(wàn)億次計(jì)算,實(shí)測(cè)性能可以對(duì)標(biāo)NVIDIA H100,尤其是在多模態(tài)大模型微調(diào)任務(wù)中,部分性能更是超越H100,甚至開始接近最新的Blackwell架構(gòu)。