本文讨论了将一些重要的基本数据库操作(即扫描、筛选和项目)卸载到计算存储中所带来的预期性能收益。我们使用TPC-DS工作负载和运行在Hadoop集群上的两个数据库引擎:SPARK- SQL和Presto来评估性能评估模型。
本文的组织结构如下:在介绍了以前的计算存储数据库卸载工作之后,我们解释了OLAP工作负载的选择,以及我们的两个集群的配置。在第四节中,我们将深入研究TPC-DS的特性,并检查在两个Hadoop集群上运行的总体性能,这是我们实验的重点。在第五节中,我们解释了建模方法,在第六节中,我们描述并分析了建模的结果。具体来说,我们展示了计算存储优化的显著加速是如何依赖于多个因素的。最后,我们简要地讨论了其他适用于计算存储下推的SQL构建块,并进行总结。
点击在这里阅读更多。
留下回复