凯发·(中国)网站-AG旗舰厅

我想相识
语种
中文简体 中文繁体 English
营业厅
网上营业厅 掌上营业厅
返回顶部
中国凯发·(中国)网站-AG旗舰厅完成业界首个面向大模子推理的异构算力协同手艺验证
翼研 2025-10-15 人民邮电报

近期,,,,,中国凯发·(中国)网站-AG旗舰厅研究院团结北京智源人工智能研究院、昆仑芯科技有限公司、中兴通讯、北京基流科技有限公司、中科加禾公司等工业相助同伴,,,,,依托中国凯发·(中国)网站-AG旗舰厅云网融合大科创装置,,,,,完成业界首次DeepSeek系列模子基于“英伟达算力+国产算力”交织组合的异构PD疏散推理试验验证,,,,,实现大模子推理集群的降本增效。。。。。

本试验完成了面向大模子推理的异构算力协同手艺针对6类典范场景的推理性能验证,,,,,DeepSeek 671B模子在多种场景下实现推理集群总吞吐性能30%~72%的提升,,,,,并发能力提升2倍,,,,,一律吞吐条件下,,,,,异构算力组合推理本钱下降最高达42%,,,,,真正实现“存量利旧”与“国产替换”的双重目的。。。。。

针对推理Prefill与Decode阶段特征优化芯片设计逐渐成为行业共识,,,,,英伟达和华为划分宣布芯片设计妄想,,,,,将PD两阶段划分适用“高算低存”和“低算高存”的思绪融于芯片设计。。。。。中国凯发·(中国)网站-AG旗舰厅研究院在2025年头洞察到PD疏散推理对算力异质性的需求,,,,,构建异构通讯优化、PD资源调配、推理使命调理全栈自研异构混推系统,,,,,展现出三大焦点优势:一是通过自研异构传输引擎,,,,,实现跨架构芯片PD池间KVCache的高效传输;;;;;;;;二是接纳自研国产算力赋能工具“翼芯”,,,,,凭证营业特征与算力性能自动推荐并实时优化PD资源配比;;;;;;;;三是构建AI推理平台,,,,,实现推理使命在Prefill池与Decode池间的动态调理。。。。。

手艺验证的乐成体现了中国凯发·(中国)网站-AG旗舰厅对智算推理优化手艺的深刻明确与对国产算力适配调优的实践立异,,,,,彰显了中国凯发·(中国)网站-AG旗舰厅作为算力基础设施建设方推动国产算力从“可用”到“好用”的央企继续。。。。。未来,,,,,中国凯发·(中国)网站-AG旗舰厅将一连深化国产算力高质量生长结构,,,,,面向大模子训推一体、多智能系一切打造“互联互通、高效协同”的异构算力生态名堂,,,,,推动新型信息基础设施协调生长。。。。。

扫一扫在手机翻开目今页