Intel Cluster Toolkit Compiler Edition 3.1 (群集工具套件)

  • 软件大小|Size:456MB
  • 软件语言|Language:3
  • 运行环境|Platform:/Linux
  • 使用方式|License:浮动License
  • 更新时间|Release:2014-03-22
  • 软件评价|Rank:
  • 历史版本|Version:1
  • 下载次数|Counts:
  • 标 签|Tag:Intel   Cluster   Toolkit   

软件介绍|Description ——介绍来源于互联网,具体功能以官方为准。

英特尔® 集群工具套件 3.1 为我们带来 20 多项实用的新功能!英特尔® 集群工具套件将所有主要的新版本英特尔® 集群工具都捆绑到一个软件包中。这个由多个组件组成的软件工具包中包含了一些核心库和工具,可有效地开发、优化、运行和分布并行应用程序,适用于包含英特尔® 处理器的集群。

特性


使用集成的英特尔® 集群工具套件软件,可加快并行计算程序的开发,还可提升集群系统的性能。此工具套件具备以下特性:

  • 整合为一的软件包
  • 英特尔® MPI 库 3.1
  • 英特尔® 数学核心函数库集群版(英特尔® MKL 集群版)10.0
  • 英特尔® 跟踪分析器和跟踪采集器 7.1
  • 英特尔® MPI 性能指标评测 3.1
  • 兼容当前业界标准以及英特尔® 工具和架构

整合为一的软件包

英特尔® 群集工具套件在一个集成的捆绑软件中提供了多个集群软件解决方案,仅需一个许可证、一个安装程序和提供一项支持服务。

  • 安装简便:主安装程序支持分布式安装选项,只需一个操作即可在集群的头节点和计算节点上提供安装。
  • 轻松管理许可证:英特尔® 群集工具套件是一个集成的软件包,仅需一个许可证即可使用一套工具。获取支持服务仅需在Intel® Premier Support上注册一次。


英特尔® MPI 库 3.1

英特尔® MPI 库为分布式内存(distributed-memory)应用提供了出色的性能和灵活性。英特尔® MPI 库的特性包括:

  • 简化的产品设置:
    • 提供了作为 root 用户或使用普通用户 ID 进行安装的能力,从而使 Linux* 用户能快速入门并运行。
    • 实施 mpivars.sh 和 mpivars.csh 脚本以方便路径设置。
  • 简化的进程管理:
    • 采用使 MPD 启动和清除自动化的 mpirun 脚本大幅降低人工编码的工作强度。
  • 用于运行时控制的环境变量:
    • 通过具备拓朴意识 (topology-aware) 的集合操作来优化集合操作的性能,从而优化应用程序。
    • 采用特定平台的细粒 (fine-grain) 计时器来获取更加精确的度量值。
  • 增强了对操作系统和编译器的支持:
    • Red Hat Enterprise Linux 4.0
    • SUSE Linux Enterprise Server* 9 和 10
    • o 英特尔® 编译器 Linux 10.0 和 9.1 版
  • 提高了互操作性:
    • 能使用符合 DAPL* 1.1 和 1.2 的 Direct Access Program Library(DAPL)提供程序
    • Platform LSF* 6.1 及更高版本
    • PBS Pro* 7.1 及更高版本
    • Torque* 1.2.0 及更高版本
    • Allinea Distributed Debugging Tool (DDT*) 1.9.2 及更高版本
    • Etnus TotalView* 7.1.0 及更高版本
    • 英特尔® 调试器
    • 通过英特尔® 跟踪分析器和跟踪采集器提供内部英特尔 MPI 库状态跟踪

    图 1. 英特尔® MPI 库和基于 DAPL 的互联

  • 通过新增以下各项更新 MPI 软件代码:
    • 进程衍生和连接(仅限于 sock 设备)。
    • 被动和主动目标单向通信。
    • 通用请求。
    • 紧密集成 ROMIO 组件。
    • 全线程支持

英特尔® 数学核心函数库集群版(英特尔® MKL 集群版)10.0

英特尔® 数学核心函数库(英特尔® MKL)提供经过高度优化、能够确保线程安全的数学例程,它们专门针对性能要求很高的科学、工程及金融等领域的应用程序而设计。英特尔® MKL 集群版包括对 ScaLAPACK 和分布式内存快速傅立叶变换(FFT)的支持。

线性代数 - BLAS 与 LAPACK
部署针对英特尔处理器进行过高度优化的 BLAS 和 LAPACK 例程,它们提供的性能改善非常显著,远远超出诸如 ATLAS* 等其他替代版本。

线性代数 - ScaLAPACK
在集群中使用预编译的 ScaLAPACK 的英特尔® MKL 实施能够提供非常显著的性能改善,远远超出标准 NETLIB 实施。

线性代数 - 稀疏矩阵解算器
在共享内存多处理器上使用“PARDISO 直接稀疏矩阵解算器”解算大型、稀疏、对称及不对称线性系统方程,该解算器采用巴塞尔大学(University of Basel)授权使用的线性代数解算器,并由英特尔进行过优化,具有线程安全、性能优异、内存效率极高等优点。英特尔® MKL 还包括了一个带有灵活的反向通信接口的共轭梯度迭代解算器(Conjugate Gradient iterative solver)。

快速傅立叶变换
部署多维 FFT 例程(1 维到最多 7 维,混合基数支持),并提供一个先进易用的 C/Fortran 接口。英特尔® MKL 还提供一系列模拟 FFTW 2.x 和 3.1 接口的 C 语言例程(wrapper),从而使目前的 FFTW 的用户能够轻松地对英特尔® MKL 的性能进行比较。英特尔® MKL 集群版包括对分布式内存 FFT 的支持,因此通过将工作分配给大量处理器,可进一步提升您的 FFT 性能。

矢量随机数生成器
利用我们的矢量随机数生成器加速模拟。大量的连续概率和离散概率的分布类型也包括在内。

向量数学库
可提高带有计算密集型核心数学函数(幂函数、三角函数、指数函数、双曲函数、对数函数等)的矢量实施的应用的速度。

英特尔® 跟踪分析器和跟踪采集器 7.1

在基于英特尔处理器的集群上分析、优化和部署高性能的应用程序。英特尔® 跟踪分析器和跟踪采集器是详细了解复杂并行程序的行为信息所必备的一个工具。英特尔® 跟踪分析器和跟踪采集器可提供:

易于使用的图形用户界面(GUI):

  • 基于时间、处理器数量和例程或方法数量的可扩展性特性。
  • 通过多个高质量的视图显示事件时间线。
  • 函数分析、点对点以及集群通信。


图 2. 时间线视图和并行显示

显著的性能提升:

  • 有效的内存处理使在台式机上分析大型跟踪成为可能。
  • 一致、直观的 GUI 具备分层视图和图表概念。
  • 引入了高级过滤器和聚集机制。

广泛的平台支持:

  • Linux 和 Windows* 支持(英特尔® 跟踪分析器 GUI 在 Linux 和 Windows XP 上均受支持)。
  • 利用基于英特尔® 架构的多核心平台。

跟踪特性:

  • 跟踪任意分布式应用程序(libVTcs),失效的 MPI 应用程序(libVTfs)和 OS 活动(例如,CPU 的使用率)
  • 二进制替换和测试覆盖插入(Binary instrumentation),对尚未链接到英特尔® 跟踪采集器的可执行文件进行函数分析及 MPI 跟踪(通过 itcinstrument)(仅限于 IA-32 和英特尔® 64 位架构);共享版本的 VT 库可用于插入英特尔跟踪采集器语义(semantics)而无需重新链接(通过 LD_PRELOAD)

英特尔® MPI 性能指标评测 3.1

英特尔® MPI 性能指标评测——之前所称的“Pallas MPI 性能指标评测(PMB)” - 是一套精简易用的 MPI 性能指标评测。它对各种计算平台或 MPI 实现的性能进行比较。它检查多种 MPI 通信模式,自动检测集群并报告集群内和集群间的性能。性能指标评测专用于检测重要的 MPI 功能,如:

  • 点对点消息传递
  • 全局数据移动和计算例程
  • 单向通信
  • 文件输入/输出

此版本中的新增功能

英特尔® 集群工具套件附带的所有软件工具都进行了重要修订,力图提供最佳的并行性能分析工具,以便在集群软件开发中使用。下表列出了此最新版本中包括的一些新特性,请注意,这只是众多新特性中的一小部分。

英特尔® 集群工具套件 3.1

与 Red Hat Enterprise Linux 4 和 SUSE Linux Enterprise Server 10.0 兼容的主安装程序使您可快速入门。

含有指向文档的超链接的 HTML 文档索引文件用于:

  • 英特尔® 跟踪分析器和跟踪采集器 7.1
  • 英特尔® MPI 库 3.1
  • 英特尔® MKL 集群版 10.0
  • 英特尔® MPI 性能指标评测 3.1

英特尔® MPI 性能指标评测

  • 通过调用“MPI_Init_thread”函数来确定 MPI 线程环境。每次执行英特尔® MPI 性能指标评测应用程序时,系统都会向用户报告 MPI 线程环境。
  • 通过调用“MPI_Get_version”函数,可报告三个性能指标评测应用程序所链接至的 MPI 库实施的版本
  • “Alltoallv”性能指标评测
  • 命令行标志“-h[elp]”用于显示每个性能指标评测应用程序的调用顺序
  • 删除过时的 Makefile 模板。目前有三个完整的 makefile,分别称为 Makefile、make_ict 和 make_mpich
  • 更好地检查用户参数,清除消息并断开多数无效的用户参数

英特尔® 调试器支持

  • 并行英特尔® 调试器目前能够调试使用英特尔® MPI 库 3.1 的 MPI 应用程序。对于 8.1 版的英特尔编译器,请确保已经安装了 8.1-23 版或更高版本的英特尔® 调试器。对于 9.1 版的英特尔编译器,请确保已经安装了 9.1-23 版或更高版本的英特尔® 调试器。
  • 《英特尔® 集群工具套件 3.1 用户指南》的第 10 章讨论了如何结合使用英特尔® 调试器与英特尔® MPI 库 3.1

英特尔® MPI 库 3.1

提升了应用程序性能
  • DAPL 节点内通信模式
  • 进一步优化了集群
  • 智能进程锁定
  • 可伸缩作业启动协议


提升了可操作性
  • MPI_THREAD_MULTIPLE 级的其他线程安全库
  • 通过集成主导作业调度程序简化了进程管理
  • 支持 Etnus* TotalView*、DDT* 和英特尔调试器


扩展了编译器支持
  • 英特尔® C++/Fortran 编译器 9.1 Linux 版
  • GNU* Fortran 95 编译器 Linux 4.0 及更高版本


扩展了操作系统支持
  • SUSE Linux Enterprise Edition 10.0


英特尔® 跟踪分析器和跟踪采集器 7.1

  • 比较特性提供两个跟踪文件和/或区域的逐项比较。
  • 计数器时间线用于帮助您对通过所提供的 PAPI 和 OS 模块或通过手动使用英特尔® 跟踪采集器 API 收集的计数器数据进行分析。
  • 提高的可用性通过字体自定义和撤销操作特性得以实现
  • 二进制替换和测试覆盖插入用于 IA-32 和英特尔® 64 位架构

英特尔® 数学核心函数库集群版 10.0

此版本的英特尔® 数学核心函数库侧重于面向英特尔® 至强® 5100 系列处理器 (原代号为 Woodcrest)提供最优性能,并确保多线程性能的实现。

英特尔® 至强® 处理器 5100(原代号为 Woodcrest)的更多性能优化
其他优化进一步提升了英特尔® 至强® 5100 系列处理器上英特尔® MKL 8.1 的性能。

增强的快速傅立叶变换性能
英特尔® MKL 10.0 的优化将 FFT 性能提高到前所未有的水平。

稀疏矩阵 BLAS 中的其他线程支持
以下稀疏矩阵 BLAS 三角解算器是采用 OpenMP* 进行线程处理的。

  • mkl_dcsrmm - 压缩稀疏矩阵行格式的 3 级三角解算器
  • mkl_dcscmm - 压缩稀疏矩阵列格式的 3 级三角解算器
  • mkl_dcoomm - 坐标格式的 3 级三角解算器

新迭代解算器
实现了新的 RCI Flexible Generalized Minimal RESidual (FGMRES) 迭代解算器。

新 VSL 功能

  • 该库提供了快速/精确的分布生成模式。
  • 该库支持根据用户定义的拟随机数生成器的参数来生成拟随机序列。

新 VML 功能和线程支持

  • VML 目前支持将单精度复数和双精度复数用于以下函数:Acos、Acosh、Asin、Asinh、Atan、Atanh、Cos、Cosh、Exp、Ln、Log10、Pow、Powx、Sin、Sinh、Sqrt、Tan、Tanh。
  • 新的单精度和双精度最接近整数的函数:Trunc、Ceil、Floor、Round、NearbyInt、Rint。
  • 还增加了另外三个单精度和双精度参数的函数:ErfInv、Hypot 和 Modf。
  • VML 函数目前已采用 OpenMP 进行线程处理。

::::::English Description::::::

Intel® Cluster Toolkit 3.1 provides exceptional value at a significantly discounted price for clusters running either Linux* or Microsoft Windows* Compute Cluster Server by bundling Intel® Trace Analyzer and Collector, Intel® Math Kernel Library (Intel® MKL), Intel® MPI Library, and Intel® MPI Benchmarks into a single package. Easy to install and easy to use, this software package helps you develop, analyze and optimize performance of parallel applications for clusters using IA-32, IA-64, and Intel® 64 architectures.

A new Intel® Cluster Toolkit Compiler Edition is also available. In addition to all of the Cluster Tools, the Compiler Edition also includes the Intel® C++ Compiler, Intel® Fortran Compiler, and Intel® Debugger.

Features

Adding support for Microsoft Windows Compute Cluster Server as well as for Linux clusters, the Intel Cluster Toolkit 3.1 assures industry wide compatibility AND fully tested interoperability of these best in class tools:
  • Intel® MPI Library 3.1 - outstanding performance, flexibility and ease of use
  • Intel® Trace Analyzer and Collector 7.1 – A leading MPI performance analysis product
  • Intel® Math Kernel Library 10.0 – The flagship of high performance math libraries. Extensively threaded, highly optimized, core math functions including BLAS, LAPACK, ScaLAPACK, Sparse Solvers, Fast Fourier Transforms, Vector Math, and more
  • Intel® MPI Benchmarks 3.1 – easy performance comparison of MPI functions and patterns

The latest releases of all the Cluster Tools have increased performance and ease-of use while improving interoperability, scalability, and the number of user options. In one install session, Intel Cluster Toolkit 3.1 saves time by providing a single interface for installation of multiple packages on both the head node and compute nodes. Help is available in the extensive documentation, online help, manuals, and white papers.

New in This Release

All the software tools included with Intel Cluster Toolkit have undergone a major revision to give you the best parallel performance analysis tools for cluster software development. The following list contains just a few of the many new features included in this latest version.

Intel® MPI Library 3.1
  • Multiple usability improvements
    • Simplified variable names, options, and diagnostics
    • Unified Intel memory management support (i_malloc)
    • PVFS and PANFS file system support (Linux only)
    • Lightweight statistics gathering
    • Enhanced documentation
  • Improved application performance
    • Improved default performance settings
    • Automated performance tuning on Linux
    • Intelligent process layout and pinning
    • Scalable application startup/termination
    • Event driven mode for the shared memory and socket transfers
  • Extended interoperability
    • Support for Windows Computer Cluster Server and Red Hat Enterprise Linux 5.0
    • Intel® C++ and Fortran Compiler 10.1 support
    • TotalView* and IDB process attachment support (Linux only)

Intel® Trace Analyzer and Collector 7.1
  • Multiple usability improvements
    • More reports, more graphics, more analysis, more filtering, more powerful!
    • MPI Correctness Checking - check MPI parameters, data types, buffers, communicators, messages, and collective operations, detect deadlocks and corruption
    • Command line integration to Trace Analyzer
    • Automatic instrumentation of user binaries for all supported platforms and OS
    • Distributed memory checking, advanced data handling (large and aggregated data)
  • Improved performance
    • Accelerated data caching to reduce runtime overhead and memory consumption
    • Lightweight statistics gathering
    • Optimized stack unwinding for linking trace information back to source code
  • Extended interoperability
    • Thread safe tracing with extended tracing support for Cluster OpenMP*, Global Arrays (GA), and non-MPI applications
    • Support for Microsoft Windows* (XP, Server 2003, and Compute Cluster Server)
    • Compatible with Microsoft and Intel® compilers and Visual Studio*
    • Support for MPI-1, SHMEM, MPI-IO, and ROMIO
    • Automatic compiler-driven instrumentation with Intel and GNU compilers

Intel® Math Kernel Library 10.0
  • New functions
    • Sparse BLAS zero-based indexing and support for real data
    • PARDISO/DSS (Parallel Direct Sparse Solver) support for Out-of-core (OOC) memory
    • Iterative Sparse Solver support extended with ILUT preconditioner, Sparse 0-based indexing, and new mkl_scsrgemv function
    • Vector Math arithmetic functions (Mul, Conj, MulbyConj, CIS, Abs)
  • Multiple usability improvements
    • Greatly enhanced User’s Guide
    • New user callable threading functions allowing greater control
    • Extended Java* support with many examples in documentation
  • Improved application performance
    • Multi-core multithreading optimization
    • New Vector Math “Enhanced Performance” accuracy mode
    • Faster FFTs DftiCommitDescriptor function which allocates less memory
    • Numerous optimizations for small BLAS/LAPACK/FFT problem sizes
  • Extended interoperability
    • Cluster enabled capability available in single MKL product
    • New layered architecture to better support Microsoft and GCC compiler threading
    • Debian* and Ubuntu* support
    • Improved support for multiple compiler environments, threading libraries, and interfaces through restructuring of the library files

Intel® MPI Benchmarks 3.1
  • Multiple usability improvements
    • New benchmarks (Gather(v), Scatter(v))
  • Improved application performance
    • New Command line flags to control cache reuse and to limit memory usage
    • Options for cold cache operation mode, maximum buffer size setting and dynamic iteration count determination
    • Run time improvements for collectives like Alltoall(v) on large clusters
  • Extended interoperability
    • Support for Windows Compute Cluster Server

下载说明|Download Note

    1.所有资源均收集于互联网,仅供学习交流使用,带积分的可直接下载,如无法下载请报告我们。
    2.本站可通过交换换取积分,所有捐赠均无发票,具体请咨询我们。
字母|Letters A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 顶部[TOP]