工程仿真HPC解决方案

随着近年来互联网的高速发展,通过计算机辅助求解分析复杂的工程问题已经变得越来越普及,这种方式广泛应用于航空、航天、船舶、车辆、土木建筑、机械工程、原子能工程等,一般主要用来求解流体力学、结构力学、材料力学、电磁场、电路耦合等问题。

1.方案背景

工程问题,自古以来就是复杂而纠结的问题。但随着近年来互联网的高速发展,通过计算机辅助求解分析复杂的工程问题已经变得越来越普及,这种方式广泛应用于航空、航天、船舶、车辆、土木建筑、机械工程、原子能工程等,一般主要用来求解流体力学、结构力学、材料力学、电磁场、电路耦合等问题。

而随着求解的问题深度增加和应用领域的要求,普通的计算机性能已经不能满足工程仿真日益增长的计算规模,因此高性能计算就成为了最好的选择。

作为应用于国家高新技术产业的工程仿真,有一系列严苛的实际需求。

首先就是数据的共享,众所周知,像航空航天或者土木建筑这种行业,工程仿真是不可能一个人独立完成的,因此就需要众多的人进行协同工作。其次工程仿真使用的软件基本都是商业软件,使用者无法对软件进行二次开发,而且当软件使用出现问题时,只能联系相关的软件官方进行远程调试和维护。最后就是集群问题了,怎样完美达到每个节点所能达到的能耗极限,怎样完美利用每个处理器的性能,当集群出现故障时怎样快速分析解决会是很多人纠结的问题。

unnamed.jpg


2.解决方案描述

基于分析我们得出,工程仿真类计算的核心内容是多节点之间数据的共享和高性能的计算效率。结合景派科技多年来的经验,我们为客户提供针对化专业化的解决方案。

景派科技高性能应用集群针对工程仿真领域的解决特点大致如下:

(1)完善的数据共享功能

数据共享功能在高性能计算方面一直有很多的瓶颈,因为高效的计算性能必然会带来海量的数据,而工程仿真的特性又需要多人协同工作。

因此在我们的方案中,提供了专业级的直连存储,更有专用的存储节点构建Lustre或者ceph分布式文件系统,这样能让每个客户在每个节点上进行软件的计算而不相互影响。除此之外我们还考虑到用户的数据安全,数据备份等,并为这些可能出现的问题都做了充足地准备,包括搭建具有容错性地阵列等。 

(2)高效的计算效率

结合工程仿真的特点,我们公司的解决方案中使用intel的至强系列的第二代可扩展处理器,不仅实现了较高的处理性能,并且在能效以及内存上都有不错的优势。而多年屹立不倒的品牌无疑也向世界宣告着毋庸置疑的质量。

而至强系列作为intel服务器专用CPU,其优良的浮点运算性能和多线程也能够完美达到用户所需的性能。

(3)系统的安全性

工程仿真,被应用在航空航天、土木工程等关键行业,稳定安全必不可少。

因此在我们的解决方案中,通过统一的集群监控管理,作业调度,结合高性能计算服务器,从各个方面保证了整套系统的稳定性,大大提高了用户的使用稳定性并且减少了故障率,能够让工程仿真领域用户在无后顾之忧的前提下专心做计算。

仿真工程2.png

工程仿真HPC架构 


3.方案优势

(1)专业的集群故障解决

我们拥有一支专业化的技术团队,娴熟掌握linux服务器系统以及集群的搭建运用,当出现故障时,能以最快的速度进行解决。

(2)节点的统一管理

高性能计算集群一直都因为节点较多而难以管理,因此我们在构建集群的时候提供单一的系统镜像,能够提供更高效的集群管理效率。

(3)稳定的分布式文件系统

在我们的方案中,有专用的存储节点构建Lustre或者ceph分布式文件系统,这样能让每个客户在每个节点上进行软件的计算而不相互影响。除此之外我们还考虑到用户的数据安全,数据备份等,并为这些可能出现的问题都做了充足地准备,包括搭建具有容错性地阵列等。

此外这两种分布式系统都具有相当不错的容错性能和在线扩容性能,能够实时满足客户的需求。

(4)任务优先级管理

在使用高性能集群的时候,经常会遇到一些紧急的任务需要马上计算。而我们的优先级管理的功能能够保证当资源不足,紧急项目或任务可以获得更高的优先级从而提前执行。

(5)节点并行能力

高性能计算集群拥有很多节点,因此效率最好的计算方法就是多节点的并行计算。景派科技的高性能计算集群采用公认的计算方法,支持多种MPI和网络协议。力求达到每个节点都不会出现资源浪费,最大限度提升集群效率。

景派科技丨超算丨HPC