速度和规模是使系统能够实现组织寻求实现的最终结果的核心。规模有助于解决更大的问题或处理更多问题,而速度有助于更快地获得结果。以下是有助于提高应用程序或系统级别的速度和规模的功能示例,以及提高整体系统效率的元素。
大规模
- Moab HPC Suite 管理世界
上一些最大的计算环境 Moab 已用于世界上一些最大的计算环境。它们是以下大小的第一个或第一个系统:1、2、10 和 100 petaflops。
- 在多个位置跨多个系统扩展资源并平衡工作负载管理
通过整合工作负载管理来统一多个集群的容量。网格使用户、组和项目能够更轻松地共享资源和数据。
- 使用 Nitro 加快大量小型作业的启动时间 – 高吞吐量管理器
Nitro 帮助用户提交数千到数百万个小任务。Nitro 不是提交许多小的单个任务,而是将这些许多任务打包成一个组请求,然后以比传统调度程序快数百倍的速度启动任务。它可以为 SOA 工作负载请求提供服务。
优化异构集群
- 通过高级资源管理满足不同用户和应用程序的需求
随着集群的扩展以满足多个组的需求,这些组的应用程序需求不可避免地需要不同的资源配置来优化其应用程序性能。Moab 的高级资源管理功能和节点分配策略、节点集资源分组、NUMA 和其他策略有助于在异构资源环境中保持高效利用。
- 通过内存和 GPU 感知作业放置提高应用程序性能
由于更好的内存访问,正确的 NUMA 感知作业放置可以将运行时间提高多达 250%,并且可以将 GPU 数据传输提高多达 300%。
- GPU/加速器扩展应用程序和系统性能
自动检测和扩展/加速应用程序,支持加速器,例如 NVIDIA GPU 和 Intel Xeon Phi (MIC)。基于模板自动将应用程序应用到加速器。
- 通过电源管理/绿色计算提高系统电源效率
使您的集群能够使用 Moab 的电源管理在电源限制范围内执行。它可以减少空闲节点的电源状态以回收不必要的能源使用。它还可以使用时钟速度和 P 状态管理在每个应用程序的基础上管理使用的功率。