售前咨询 400-158-6780

您现在的位置:首页 » 成功案例 » 政府

某研究所高性能计算建设项目

项目背景

 

     现有的高性能计算服务器集群是在 2010 年部署的,至今已经使用了接近六年,共包括 36 个节点,其中 4 个节点用于管理 (型号为 HP DL380),32 个节点用于计算 (型号为 HP C7000+BL460C),所有节点共用一套存储系统(HP MSA2000)。

     该集群的存储系统采用 NFS 共享的方式,性能已经出现瓶颈,并且无法进行扩容,空间容量已经非常紧张并且无法及时提供集群计算的数据。原有集群只能适合于对图形或网格要求不高的 CAE 求解运算情况。但是随着支持 Linux 以及并行计算的仿真计算软件越来越多,对高性能仿真服务器集群的需求也随之增加,32 节点的集群计算节点已经无法满足实际使用需求。而且,由于模型越来越大、项目之间的数据需要相互借鉴,但由于系统的陈旧导致研发人员长期保留的数据长期无法共享或者再利用。并且集群自带的存储系统空间严重不足,迫切希望在新购集群时将此问题一并解决。  

 

方案设计

 

     计算系统:用于执行用户计算任务的子系统 ,采用联想最新融合架构刀片服务器Flex System X240 M5 50台(4台Flex刀箱),构成整体双路计算节点50台的计算系统,系统双精度峰值性能达到36.8万亿次每秒计算能力。

     存储系统:用于存储用户数据或计算任务数据的子系统,根据存储系统的架构的设计和构建,本次联想为中船重工 703 所设计的具有世界领先架构的分布式存储系统,本次采用 4 个 10Gb/s 光万兆接口与 IO 节点连接,提供不小于36000Mb 的带宽速度。本存储系统能够支持超过 PB 级的存储容量,并根据用户应用发展的趋势,适时按需进行在线动态扩展。本套分布式存储系统在高性能和工程设计图片存取运行中提供快速检索、快速存取数据和高可用技术等海量数据管理功能,并且通过独特的冗余技术确保数据安全和千万级文件量存取。

     服务系统:用于管理和监控集群系统以及用户接入的子系统,利用联想x3650 M5作为高性能系统的管理和登陆节点,并使用两台x3650 M5作为系统的IO节点管理用户庞大的文件系统。

     网络系统:用于子系统内连接和子系统间互连,网络系统分为集群管理和监控网络、计算网络、存储网络三部分,其中管理网络使用高速千兆交换机BNT RackSwitch G8052,提供便捷的管理环境,同时利用56Gb/s Infiniband高速网络搭建高性能计算的核心网络,另外利用10Gb/s 以太网络组成存储文件系统,三套网络实现高性能集群架构的整体均衡性。

     基础架构:用于聚合各子系统,为整个集群系统提供供电、散热、布线等服务,完善的机柜、供电PDU、集中控制台及布线服务确保用户放心使用这台强大的高性能计算系统,在使用过程中真正做到操作简便,服务快捷,架构稳定。

     软件系统:用于整合管理硬件资源,为用户提供软件平台与服务,节点操作系统选择业内主流的 Red Hat Enterprise Linux 6.0,并行集群系统和作业调度采用业内最优秀软件 IBM Platform 平台软件,通过这一管理软件实现集群管理系统的监控、管理、告警、统计、作业调度等功能,并且我们提供了 GNU、Intel 等编译环境,BLAS、LAPACK、FFTW、Intel MKL 等常用数学函数库和 OpenMP 及 MPI 并行开发环境,GPU 开发环境,以及其它相关的 HPC 开发运行环境。实现用户使用环境的完美部署。

 

客户收益

 

     通过该项目的实施,用户在生产过程中的部件研发和模拟仿真等流程效率都得到了极大的提升。一个部件在研发过程中所用时间缩短了 50%以上,成功实现产品开发周期的大提速。

     运用分布式存储技术,打破传统高性能系统的设计局限,既提升了存储系统的共享性、可用性,也成功实现了数据的高速吞吐和安全保存。

     利用业内最先进的硬件 Lenovo Flex System 融合架构刀片系统和最优秀的集群软件 IBMPlatform,确保用户运用最稳定的系统,最便捷实用的管理系统,提高测试研发效率。

     联想将为用户提供完善的服务,包括安装调试、系统优化、用户培训等,这些都不单独收费,用户没有任何后顾之忧。  

  

  

  

  

  

官方微信号

技术咨询QQ:1049058381

业务咨询QQ:1509255309

网站首页| 产品中心|解决方案|IT服务|成功案例|关于我们

版权所有 2011-2015 北京飞蓝科技有限公司。保留一切权利。 京ICP备11061412号
X