本书汇集Euro-Par 2014会议精选论文,聚焦并行与分布式计算领域的最新进展。内容涵盖高性能架构、编译器优化、调度与负载均衡、绿色计算及数据管理等核心主题。书中探讨了GPU加速、多核系统自动调优、云计算环境下的资源管理等关键技术,并提出多种创新模型与算法,如基于现场分析的追踪框架ScalaJack、面向能效的调度策略及RDMA增强型MapReduce性能优化方案。通过理论分析与实验验证相结合,展示了当前高性能计算在能效、可扩展性和系统协同方面的突破。本书适合从事计算机科学、并行处理、分布式系统及相关工程应用的研究人员与技术人员阅读,是了解当代并行计算发展趋势的重要参考资料。
2025-11-05 14:42:51 56.62MB Parallel Computing High Performance
1
mfem:轻量,通用,可扩展的C ++库,用于有限元方法
1
有向无环图的并行DFS 根据, 是DFS遍历的并行算法的C ++实现。 该算法下的思想克服了基于DFS的标准标记方法的并行实现问题。 这是因为DFS在边缘访问和某些全局变量的使用方面要求严格的顺序,这在需要并行处理时代表了很大的局限性。 该算法为有向无环图(DAG)的DFS遍历提供了不超过3次BFS访问的有效解决方案,从而可以找到DAG节点之间的前序,后序和父级关系。 BFS的首次访问旨在将DAG转换为DT(图B); 下次访问是在DT上完成的,它的作用是为每个节点找到子树的大小,子树的大小定义为可从其到达的节点数加上自身(图C); 进行第三次访问时,可以获取根据DFS访问顺序先前应访问的节点,查看当前节点的先前同级和父级先前同级的子树大小(图D)。 从先前计算出的值开始,我们获得后顺序和前顺序(在此实现中未计算后顺序,但是只需对代码进行很小的更改即可轻松完成)(图E)。 请注意
2023-04-07 18:52:11 71KB cpp graph async parallel-computing
1
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
2023-02-19 08:11:13 16.57MB CUDA
1
并行计算的经典书籍。有几个链接下载下来后发现打开后都无法显示,索性自己找一个供大家使用。
2023-02-02 10:54:59 6MB Parallel Computing,并行计算
1
Introduction to Parallel Computing From Algorithms toProgramming
2022-12-17 11:04:42 8.02MB EDA Algoritms
1
CUDA(Compute Unified Device Architecture),是显卡厂商NVIDIA推出的运算平台。 CUDA™是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。 它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。 开发人员现在可以使用C语言来为CUDA™架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序于是就可以在支持CUDA™的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN。
2022-12-15 20:03:48 16.58MB GPUS CUDA
1
BLAST(基本局部比对搜索工具)是一种局部比对算法,具有很高的准确度,被广泛使用。 它可以在保持高精度的同时减少程序的运行时间,但是在比较大型基因数据集时却存在性能瓶颈和低效率。 因此,提出了一种基于Spark的分布式并行方法Spark_BLAST。 该方法利用Spark内存计算来识别和划分任务,并实现了BLAST算法的分布式并行计算。 最后,该方法在5个节点的Spark集群上实现。 与单机比较表明,Spark .cluster的加速可以达到约4,而不会改变比较结果的准确性。 该方法为生物信息学提供了一种有效的比对方法。
2022-11-02 15:55:19 732KB Spark Parallel computing Bioinformatics
1
http://www.hsafoundation.com/standards/ The contents of this document are provided in connection with the HSA Foundation specifications. This specification is protected by copyright laws and contains material proprietary to the HSA Foundation. It or any components may not be reproduced, republished, distributed, transmitted, displayed, broadcast or otherwise exploited in any manner without the express prior written permission of HSA Foundation. You may use this specification for implementing the functionality therein, without altering or removing any trademark, copyright or other notice from the specification, but the receipt or possession of this specification does not convey any rights to reproduce, disclose, or distribute its contents, or to manufacture, use, or sell anything that it may describe, in whole or in part.
2022-10-31 20:39:44 8.15MB HSA Parallel Computing
1
Kokkos:核心库 Kokkos Core 在 C++ 中实现了一个编程模型,用于编写针对所有主要 HPC 平台的高性能便携式应用程序。 为此,它为代码的并行执行和数据管理提供了抽象。 Kokkos 旨在针对具有 N 级内存层次结构和多种类型执行资源的复杂节点架构。 它目前可以使用 CUDA、HPX、OpenMP 和 Pthreads 作为后端编程模型,以及其他几个正在开发的后端。 Kokkos Core 是 Kokkos C++ 性能可移植性编程生态系统的一部分,该生态系统还提供数学内核 ( ),以及分析和调试工具 ( )。 了解 Kokkos 可以在 Wiki 上找到编程指南,API 参考正在开发中。 如有问题,请在 Slack 上找到我们: : 或打开 github 问题。 对于非公开问题,请发送电子邮件至 crtrott(at)sandia.gov 可以在下找到包含
1