生成式AI应用的不断发展,使全社会对算力尤其是异构计算资源的需求达到新高度。作为新质生产力的重要动力引擎,算力资源的开放性和安全性直接关系到数字经济的稳定和发展。近日,紫光股份旗下新华三集团发布全新多元异构算力平台H3C UniServer R5330 G7和H3C UniServer R5500 G7,以多元异构、开放包容、灵活高效等多重优势,提供高性能、高可靠的多元算力,为不同AI负载提供强劲算力支撑,为数字经济高质量发展提供坚实后盾。
智能算力旗舰 H3C UniServer R5500 G7
为AI而生 先进模块化设计打造极致算力
“百模大战”热潮下,大模型的训练及推理过程均需要强大的算力作为支撑。H3C UniServer R5500 G7是专为AI大模型训练而设计的智能算力旗舰新品,支持千亿级参数规模的大模型训练。产品采用系统解耦的先进模块化设计,兼容最新OCP OAI开放硬件标准,实现算力开放和可进化;通过搭载2颗最新处理器以及新一代OAM 8-GPU模组,为AI大模型训练提供旗舰级算力与互联带宽,加速AGI时代到来。
算力旗舰,助力AI大模型训练:
● 支持超过15种、千亿级参数主流大模型训练,覆盖AIGC、计算机视觉、自然语言处理和大数据分析等多种AI应用场景。
● 采用先进模块化设计,用户可灵活选择GPU计算模块,提高系统的可扩展性和可维护性,节省成本。
● GPU模组算力可提升200%,Llama2-70B增量预训练仅需15天。
生态兼容,AI业务平滑迁移:
● 主流开源大模型一键迁移,客户模型零代码改动。
● CUDA底层原生兼容,算子库兼容可达95%以上。
● 适配国内外主流深度学习框架,原生适配国产飞桨深度学习框架。
可靠高效,算力管理智能灵活:
● CPU、GPU模组、BMC芯片等核心部件支持国产化,供应可靠。
● 结合傲飞算力平台,可实现万卡集群算力统一调度,算力高效使用。
● 算力资源统一管理、监控、告警,智能灵活。
自主算力引擎H3C UniServer R5330 G7
直面异构算力 卓越性能助力AGI时代
随着多元异构算力的广泛应用,伴随而来的诸多挑战也逐渐浮现。由于不同厂商硬件存在计算架构、缓存资源、互联方式等差异,极大限制了算力资源的充分使用和灵活调度。新华三集团发布的自主算力引擎产品——H3C UniServer R5330 G7,搭载2颗最新处理器+GPU异构算力,可有效解决异构算力部署的技术难题;CUDA算子库支持95%以上,让底层适配更加高效便捷,实现生态无缝迁移;开放包容,异构赋能,为不同AI负载提供强劲算力支撑。
训推一体,AI开发新范式:
● 对比上一代GPU,大模型训练场景下的AI算力提升超过30%,显存容量提升100%。
●大模型推理场景仅需单台8-GPU便可支持在100用户同时访问情况下达到15 token/s,提供更快的服务响应速度。
●支持多元GPU异构算力大模型混合部署,更具灵活性,为用户提供更多选择。
生态开放,AI业务快速部署:
●CUDA算子库支持95%以上,用户代码零改动。
●支持200种以上主流AI模型,软件栈兼容国内外主流生态,支持原生社区分布式训练方案。
●覆盖通用计算、FFT(快速傅里叶变换)等多种计算模式。
异构赋能,实现智能算力调度:
●结合傲飞算力平台,可实现万卡集群算力统一调度。
●提供模型训练、微调、评估、推理全流程服务。
●支持AI算力资源统一管理、监控、告警,让运维更智能、更灵活。
算力已成为数字经济时代的关键生产要素。未来,新华三集团将继续秉持“精耕务实,为时代赋智慧”的理念,加速算力平台的智能再进化,为百行百业的数智变革夯实算力底座,推动新质生产力蓬勃发展。
(来源:新华三)