Torque资源管理器

TORQUE 可以与Moab®集成,Moab®是一种工作负载管理器,可智能地放置工作负载并调整资源,以优化应用程序性能、提高系统利用率并实现组织目标。它可针对每个系统的特定情况进行定制,并提供对批处理作业和分布式计算资源的控制。

TORQUE 在可扩展性、可靠性和功能性方面取得了重大进展,目前已在全球数以万计的领先政府、学术和商业网站上使用。

  • 易于使用的作业提交和管理:通过易于使用的作业提交门户简化最终用户的工作负载提交流程,其中包括应用程序模板、脚本构建器、作业详细信息和基于 Web 的文件管理等功能。
  • 多组或异构硬件:满足多组的需求,在复杂或异构的环境中优化资源,保证SLA,实现业务目标。
  • 模块化插件:通过强大的插件功能获得额外的控制,如基于门户的作业提交、会计、网格和电源管理、高吞吐量提交等。

功能集

TORQUE 是一种行业标准的资源管理器解决方案,其采用率高于任何其他资源管理产品。它在以下领域提供了优于其他资源管理器的增强功能:

容错

  • 检查/处理的其他故障条件
  • 节点健康检查脚本支持

调度接口

  • 扩展查询接口,为调度程序提供更多更准确的信息
  • 扩展控制接口允许调度程序增加对作业行为和属性的控制
  • 允许收集已完成作业的统计信息

可扩展性

  • 显着改进了服务器到 MOM 的通信模型
  • 能够处理具有数万个节点和作业的大型集群
  • 能够处理跨越数十万个处理器的大型作业
  • 多线程和基于 TCP 的通信具有高响应性和可靠性

可用性

  • 广泛的日志记录添加
  • 更具人类可读性的日志记录(即,不再有“命令 42 上的错误 15038”)