中文 英语
首页
技术论文

启用hbm的基于fpga的图形处理加速器

受欢迎程度

弗吉尼亚大学和三星的研究人员发表了一篇题为“ACTS: A Near-Memory FPGA Graph Processing Framework”的技术论文。

文摘:
尽管如今的近内存加速器提供了高芯片外带宽和芯片上并行性,但由于可用内存带宽利用率不足,基于软件的(CPU和GPU)图处理框架仍然受到性能下降的影响,因为图遍历通常表现出较差的局域性。新兴的基于fpga的图形加速器通过设计专门的图形处理管道和特定于应用程序的内存子系统来最大限度地利用带宽和有效地利用高速片上内存来解决这一挑战。为了有效地使用有限的片上(BRAM)内存,同时处理更大的图尺寸,一些基于fpga的解决方案在预处理期间采用某种形式的图切片或分区,将顶点属性数据送入BRAM。虽然这种方法对于较小的图具有性能优势,但对于较大的图就不适用了。例如,GraphLily[19],一个最近的基于fpga的高性能图形加速器,在具有3M顶点的图和具有28M顶点的图之间,性能下降高达11倍。这使得先前的FPGA方法对于大型图形不切实际。

我们提出ACTS,一种支持hbm的FPGA图形加速器,来解决这个问题。我们不是离线划分图来改善空间局部性,而是在活动边处理后在线生成的顶点更新消息(基于目标顶点id)进行分区。这可以优化读带宽,即使图的大小在扩大。我们将ACTS与Gunrock(一种最先进的GPU图形处理加速器)和GraphLily(一种最近基于fpga的图形加速器,也使用HBM内存)进行比较。我们的结果显示几何平均加速为1.5倍,比Gunrock的最大加速为4.6倍,比GraphLily的几何加速为3.6倍,最大加速为16.5倍。我们的结果还显示,与Gunrock相比,几何平均功率降低了50%,能量延迟乘积平均降低了88%。”

找到开放获取这里是技术文件.2023年2月出版。

Wole Jaiyeoba, Nima Elyasi, Changho Choi, Kevin Skadron, 2023年。ACTS:一个近内存FPGA图形处理框架。2023年ACM/SIGDA现场可编程门阵列(FPGA ' 23)国际研讨会论文集,2023年2月12日至14日,美国加州蒙特利。ACM,纽约,纽约,美国,11页。https://doi.org/10.1145/3543622.3573180。



留下回复


(注:此名称将公开显示)

Baidu