### 可定制计算:片上网络的技术探索 #### 核心知识点概述 《可定制计算》一书由Yu-Ting Chen、Jason Cong、Michael Gill、Glenn Reinman 和 Bingjun Xiao 共同编著,是Synthesis Lectures on Computer Architecture系列的一部分,由Margaret Martonosi担任系列编辑,并由Morgan & Claypool Publishers出版。本书主要介绍了可定制计算领域的最新研究成果和技术进展,特别是在片上网络(NoC)方面。 #### 片上网络技术基础 片上网络(Network-on-Chip, NoC)是一种用于在大规模集成电路(SoC)中实现模块间通信的架构。随着芯片集成度的不断提高,传统的总线结构已经无法满足日益增长的通信需求。NoC作为一种新兴的替代方案,通过在网络中采用类似于互联网的数据包交换机制来提高通信效率和可扩展性。NoC的核心优势包括但不限于: 1. **高可扩展性**:NoC架构可以轻松地扩展到包含数百个甚至数千个处理单元。 2. **模块化设计**:NoC使得系统设计更加模块化,便于功能块之间的独立设计与测试。 3. **灵活性**:NoC能够支持多种通信模式,如广播、多播等。 4. **可靠性**:通过路由选择和拥塞控制机制,NoC能够提供更加可靠的数据传输服务。 #### 可定制计算的关键概念 1. **定义**:可定制计算是指根据特定应用或工作负载的需求来设计和优化硬件系统的过程。这种定制化的硬件可以显著提升性能并降低功耗。 2. **目标**:可定制计算的目标是在满足功能、性能和成本要求的前提下,设计出最适合特定应用场景的计算机架构。 3. **关键技术**: - **硬件加速器**:针对特定任务设计的专用硬件,可以大幅提升处理速度。 - **现场可编程门阵列(FPGA)**:一种高度灵活的可编程硬件平台,可用于快速原型验证和硬件加速。 - **片上网络(NoC)**:作为连接各个硬件模块的骨干网络,NoC的设计对于实现高性能、低延迟的通信至关重要。 4. **应用场景**: - **高性能计算(HPC)**:在超级计算机中使用可定制计算技术可以显著提高计算效率。 - **嵌入式系统**:通过定制化的硬件设计,可以有效降低功耗,延长电池寿命。 - **云计算与数据中心**:通过优化服务器架构,提高资源利用率,减少能耗。 #### 技术发展趋势 随着计算需求的不断变化,可定制计算技术也在持续演进和发展。未来的研究方向主要包括但不限于: 1. **异构集成**:结合不同类型的处理器和加速器,构建更加强大且灵活的计算平台。 2. **自适应与动态重构**:开发能够在运行时根据工作负载自动调整配置的系统。 3. **节能与热管理**:研究新的技术和方法来降低功耗并有效管理散热问题。 4. **安全性增强**:随着攻击手段的多样化,如何确保数据安全成为重要的研究课题之一。 《可定制计算》不仅为读者提供了深入理解片上网络技术的基础知识,还探讨了该领域内其他关键技术的发展现状及未来趋势,对于从事计算机架构设计的研究人员和工程师来说具有极高的参考价值。
2025-11-12 14:50:55 13.89MB 片上网络
1
和声2 PAT-Noxim - NoC 模拟器 欢迎使用 PAT-Noxim,循环精确的片上网络 (NoC) 模拟器。 描述 片上网络 (NoC) 已被证明在众核架构中具有低延迟和高度可扩展性。 由于可扩展性的重要性,设计人员尝试优化整个网络的延迟、功率和温度。 因此,开发一种精确的工具来计算上述属性至关重要。 设计人员需要在 NoC 模拟环境中评估他们提出的技术。 因此,我们提出 PAT-Noxim 来解决设计和后期设计阶段的缺点。 基于 Access-Noxim 开发的 PAT-Noxim 提供了一个环境来模拟 NoC 的功耗、面积、延迟和温度模型。 PAT-Noxim 旨在支持多种预定义和自定义架构。 它可以根据 GPL 许可条款下载。 如果您在研究中使用 PAT-Noxim,我们将感谢在其贡献的任何出版物中引用以下内容: A. Norollah、D. Derafshi、H. Beitollahi 和 A. Patooghy,“PAT-Noxim:精确的功率和热循环精确 NoC 模拟器”,2018 年第 31 届 IEEE 国际片上系统会议 (SOCC),弗吉尼亚州阿灵顿,美国,
2024-03-23 14:54:57 344KB 系统开源
1
在单芯片多核系统中,NoC已成为主流片上通信架构。有效的任务调度是挖掘计算并行性的重要方法。在经典静态列表调度基础上,针对HEFT算法中节点排序会得出较多的优先级相同节点的问题,提出一种节点二次排序的调度方法。在边的调度上应用了ALAP原则,改进算法有效提高了调度效果。实验表明,新方法对bl、blcomp、blio等节点优先权算法得出的任务列表均有良好的调度效果,适应性较好;对于2D Mesh同构NoC架构,改进算法对三种节点优先权算法有1.15倍的平均加速比,最大可有1.27倍加速比。
1
针对传统NoC容错算法中容错粒度过粗造成资源浪费的问题, 提出了一种细粒度的自适应容错路由算法, 对带有部分故障的节点重新利用。算法将各种故障映射为一种功能故障模型, 结合新提出的路由端口优先级策略和嵌入的奇偶转向模型, 实现数据包的无死锁容错路由。实验表明, 随着负载和故障数目的增加, 该算法具有更优越的容错性能, 证明了算法的有效性。
2023-10-23 22:18:41 1.29MB 片上网络(NoC) 容错 故障模型 优先级
1
传统用于总线系统或互联网的仲裁方法已不能很好地适应NoC应用环境。围绕NoC系统性能的关键影响因素——拥塞状态,提出了一种基于全局和本地拥塞预测的仲裁策略(GLCA),以改善NoC网络延迟。实验结果表明,相对于RR方法,新仲裁算法使得网络平均包延迟和平均吞吐量最大分别可改善20.5%和8%,并且在不同负载条件下都保持了其优势。综合结果显示, GLCA与RR方法相比,路由器仅在组合逻辑上有少许增加(25.7%)。
2023-10-23 22:17:33 729KB 片上网络 仲裁方法 拥塞 延迟 拥塞区域
1
提出一种功耗限制下测试端口选择优化的方法,从而缩短测试时间。以系统功耗确定测试端口对数,以内核测试占用网络资源最少和测试时间最短为目标,为被测核选择端口位置。利用云进化算法对不同端口位置组合寻优,快速收敛到适应值最佳的测试端口组合,完成测试方法研究。以ITC’02基准电路作为实验对象,针对不同规模NoC,实验结果表明,这种方法提高了测试效率,缩短了测试时间,降低了测试代价。
2023-10-23 22:17:10 1.15MB 片上网络 选择优化 云进化算法
1
针对NoC任务映射问题中时延难以预测和启发式算法效率低的问题, 提出一个时延改进模型和近邻随机遗传算法。该模型从宏观的链路负载分布和单个节点的排队时延两方面来构建NoC映射的时延模型, 通过引入时延因子、权重系数来刻画不同映射方案对时延性能的影响, 避免了NoC通信时延精确建模的难题。提出近邻随机思想来构建遗传算法的初始种群, 并且运用该算法实现了面向时延的NoC映射, 在达到全局最优的情况下, 比经典遗传算法效率提升将近20%。实验结果表明, 该算法优于现有的经典遗传算法和随机映射方案。
1
传统的自适应片上网络(NoC)容错路由算法采用一步一比较的方式来确定最优端口, 未能有效降低传输延迟。根据数据包在2D Mesh NoC前若干连续的跳数内最优端口固定的特点, 提出了一种基于报文检测的快速(FPIB)自适应容错路由算法。算法采用跳步比较的方式来减少数据包的路由时间, 并使用模糊优先级策略来进行容错路由计算。实验结果表明, 与uLBDR容错路由算法相比, 该算法能有效地降低平均延迟, 且实现算法的硬件开销更低。
2023-10-23 22:16:28 1.21MB 片上网络 容错 报文检测 模糊优先级
1
针对片上网络的死锁问题,提出一种片上网络自适应路由算法——虚拟网络(VN)路由算法,该算法根据报文源地址和目的地址将网络分成4个虚拟网络。一旦报文在某个给定的虚拟网络中路由,所有属于最小路径的通道都可用于路由。但是,报文不能被传到另一个虚拟网络。显然,通道间没有环相关,从而避免了死锁。通过OPNET仿真,得出此算法吞吐量大、网络延迟小。
2022-11-05 14:50:59 923KB 片上网络 VN路由算法 死锁
1
面向能耗和热分布的片上网络多目标优化映射算法研究.pdf
2022-07-12 14:08:46 1.42MB 文档资料