片上网路原理与设计
《片上网路原理与设计》是于2017年1月机械工业出版社出版的一本图书,作者是王志英。
基本介绍
- 书名:片上网路原理与设计
- 作者:王志英
- 出版社:机械工业出版社
- 出版时间:2017年1月
内容简介
国内首部片上网路领域学术专着
国防科技大学王志英教授领衔撰写,全景呈现其科研团队国际领先的研究方法和研究成果
面对众核处理器时代的新挑战,片上网路将报文交换思想引入晶片内部,这已成为事实上的片上通信标準,并且直接决定着未来计算机体系结构的发展方向。本书基于以通信为核心的跨层次最佳化方法,涵盖大量有趣的课题,既阐明了片上网路的基本原理,也为解决当下的设计难题带来了启示。
作者简介
王志英 国防科技大学计算机学院教授、博士生导师,1992年成为国家级突出贡献中青年专家并享受政府特殊津贴。现任教育部计算机类专业教学指导委员会副主任、全国高校计算机教育研究会理事长、中国计算机学会教育专委会副主任。
图书目录
第1章 绪论2
1.1 众核处理器时代2
1.2 以通信为核心的跨层次最佳化3
1.3 片上网路简介5
1.3.1拓扑结构6
1.3.2 路由算法7
1.3.3 流控机制8
1.3.4 路由器微结构10
1.3.5 性能评价指标13
1.4 片上网路研究现状14
1.4.1 拓扑结构的研究14
1.4.2 单播通信路由的研究15
1.4.3 聚合通信路由的研究16
1.4.4 流控机制的研究17
1.4.5 路由器微结构的研究18
1.5 真实处理器的片上网路19
1.5.1 MIT RAW处理器19
1.5.2 Tilera TILE64处理器21
1.5.3 Sony/Toshiba/IBM Cell处理器23
1.5.4 U. T. Austion TRIPS处理器24
1.5.5 Intel Teraflops处理器26
1.5.6 Intel SCC处理器27
1.5.7 Intel Larrabee处理器29
1.5.8 Intel Knights Corner处理器30
1.5.9 真实处理器片上网路特性总结32
1.6 全书内容概述34
1.7 参考文献36
第二部分 逻辑层实现
第2章 单周期翼通道路由器结构48
2.1 引言48
2.2 翼通道路由器体系结构50
2.2.1 翼通道单周期路由器总体结构50
2.2.2 翼通道工作原理55
2.3 路由器微体系结构设计58
2.3.1 通道分配部件58
2.3.2 快速仲裁部件60
2.3.3 SIG管理单元和SIG控制单元61
2.4 实验评估62
2.4.1 模拟环境62
2.4.2 流水线延迟分析63
2.4.3 延迟与吞吐率64
2.4.4 面积与功耗67
2.5 本章小结68
2.6 参考文献69
第3章 动态虚通道路由器71
3.1 引言71
3.2 拥塞感知的动态虚通道结构72
3.2.1 动态虚通道72
3.2.2 拥塞缓解策略74
3.3 拥塞感知的多连线埠共享缓冲结构75
3.3.1 多连线埠共享缓冲的动态虚通道75
3.3.2 拥塞缓解策略78
3.4 DVC路由器微结构78
3.4.1 虚通道控制部件79
3.4.2 拥塞缓解电路81
3.4.3 虚通道仲裁部件与开关仲裁部件82
3.5 HiBB路由器微结构84
3.5.1 虚通道控制部件85
3.5.2 虚通道仲裁部件与输出连线埠仲裁部件86
3.5.3 虚通道调整结构88
3.6 实验评估89
3.6.1 DVC路由器评估89
3.6.2 HiBB路由器评估92
3.7 本章小结95
3.8 参考文献96
第4章 虚拟汇流排拓扑结构98
4.1 引言98
4.2 相关研究99
4.3 研究动机100
4.3.1 基本片上通信网路100
4.3.2 片上网路问题分析101
4.3.3 基于事务的汇流排通信优势103
4.4 虚拟汇流排片上网路103
4.4.1 拓扑结构103
4.4.2 虚拟汇流排机制105
4.4.3 饿死与死锁避免111
4.4.4 VBON路由器结构111
4.5 实验评估112
4.5.1 模拟框架113
4.5.2 合成流量评估115
4.5.3 真实套用评估118
4.5.4 功耗分析119
4.5.5 开销分析119
4.6 本章小结120
4.7 参考文献120
第三部分 网路层路由和流控设计
第5章 区域隔离路由算法124
5.1 引言124
5.2 相关研究126
5.3 研究动机127
5.3.1 局部自适应算法的局限性128
5.3.2 应用程式内部的干扰129
5.3.3 应用程式之间的干扰130
5.4 区域隔离路由算法131
5.4.1 拥塞信息传播网路132
5.4.2 DBAR路由器微结构134
5.4.3 路由函式设计136
5.5 实验评估139
5.5.1 路由函式评估140
5.5.2 单区域性能142
5.5.3 多区域性能145
5.5.4 集中型格线网路性能148
5.6 硬体开销讨论151
5.6.1 连线资源151
5.6.2 路由器开销151
5.6.3 功耗和能量延迟积151
5.7 进一步讨论152
5.7.1 拥塞信息传播网路频宽152
5.7.2 DBAR的可扩展性153
5.7.3 拥塞信息传播延迟153
5.8 本章小结153
5.9 参考文献153
第6章 完全自适应路由算法的流控机制158
6.1 引言158
6.2 相关研究161
6.2.1 死锁避免理论161
6.2.2 完全自适应路由算法设计162
6.3 研究动机162
6.3.1 虚通道分配策略162
6.3.2 路由灵活性163
6.4 流控和路由设计165
6.4.1 全报文传送165
6.4.2 逃逸虚通道的积极分配策略168
6.4.3 完全自适应路由算法171
6.4.4 路由器微结构171
6.5 合成流量模式评测173
6.5.1 合成流量模式结果174
6.5.2 路由算法的快取利用率176
6.5.3 敏感性分析178
6.6 真实应用程式评测181
6.6.1 实验方法和实验配置182
6.6.2 PARSEC测试集结果182
6.7 流控机制的详细分析183
6.7.1 快取利用率的详细分析183
6.7.2 流控机制的公平性分析187
6.8 进一步讨论189
6.8.1 报文长度和虚通道深度189
6.8.2 DAMQ和混合流控机制190
6.9 本章小结190
6.10 参考文献190
第7章 切片气泡流控机制195
7.1引言195
7.2传统设计的局限197
7.2.1dateline197
7.2.2本地气泡策略198
7.2.3关键气泡策略198
7.2.4处理变长报文的低效性199
7.3切片气泡流控机制及策略200
7.3.1理论描述200
7.3.2本地切片气泡策略202
7.3.3关键切片气泡策略202
7.3.4饿死现象203
7.4路由器流水线和微结构205
7.4.1FBFC路由器205
7.4.2VCT路由器206
7.5实验方法207
7.6一维Torus网路性能评测208
7.6.1性能208
7.6.2快取利用率210
7.6.3短报文和长报文的传输延迟211
7.7二维Torus网路性能评测212
7.7.14×4 Torus网路性能212
7.7.2单切片报文比例敏感性分析214
7.7.3快取数量敏感性分析215
7.7.48×8 Torus网路可扩展性分析216
7.7.5饿死现象分析217
7.7.6PARSEC测试集实验结果219
7.7.7大规模系统和讯息传递编程模式220
7.8开销:功耗和面积221
7.8.1测试方法学222
7.8.2功耗222
7.8.3面积225
7.8.4与格线网路的比较226
7.9进一步讨论和相关工作229
7.9.1进一步讨论229
7.9.2相关工作229
7.10本章小结230
7.11参考文献231
第8章 高效能与公平性流控235
8.1基于当值快取高效能路由器设计235
8.1.1引言235
8.1.2高效能路由器236
8.1.3实验设计240
8.1.4实验评估241
8.1.5小结243
8.2基于报文剩余跳数的自适应流控244
8.2.1引言244
8.2.2报文之间的相互作用245
8.2.3公平性流控246
8.2.4实验评估249
8.2.5小结252
8.3参考文献253
第四部分 软体层编程模式支持
第9章 一致性协定聚合通信支持256
9.1引言256
9.2归约讯息组合框架259
9.2.1讯息组合表格式260
9.2.2讯息组合实例260
9.2.3讯息组合表项的不足262
9.3均衡自适应多播路由算法262
9.4路由器流水线和微结构264
9.5实验评估266
9.5.1性能267
9.5.2BAM和RPM多播虚拟网路性能271
9.5.3讯息组合表大小272
9.5.4敏感性分析274
9.6功耗和能量延迟积分析276
9.7相关研究277
9.7.1讯息组合277
9.7.2片上网路多播路由算法278
9.8本章小结278
9.9参考文献279
第10章 MPI原语的定製通信架构283
10.1引言283
10.2研究背景284
10.3研究动机286
10.3.1在NoC上实现MPI286
10.3.2MPI函式最佳化286
10.4定製通信架构287
10.4.1体系结构概述287
10.4.2定製的片上网路设计:VBON288
10.4.3MPI原语实现:MU288
10.5实验评估295
10.5.1方法295
10.5.2实验结果297
10.6本章小结303
10.7参考文献304
第11章 MPI通信协定最佳化308
11.1引言308
11.2研究背景309
11.2.1MPI的通信协定309
11.2.2现存问题310
11.2.3相关工作313
11.3研究动机314
11.4自适应通信协定315
11.4.1目标与方法315
11.4.2基本MPI加速的片上网路设计316
11.4.3ADCM结构的支持318
11.4.4与理想协定的比较323
11.5实验评估324
11.5.1方法324
11.5.2合成流量结果326
11.5.3真实应用程式328
11.5.4敏感性分析330
11.5.5硬体开销331
11.6本章小结331
11.7参考文献332
第五部分 后记
第12章 结语与展望336
12.1结语336
12.2展望338