内存容量已经超过了TLB报道,大数据应用程序遭受频繁的页表走。我们研究两种互补的技术解决这个成本:减少访问所需的数量,减少每个访问的延迟。第一种方法完成传统上“压扁”页表:合并两个级别的传统的4 KB页表节点为一个2 MB节点,从而减少表的深度和间接的数量需要遍历。第二个是通过偏置缓存置换算法保持页表条目TLB错过率高的时期,这段时期也看到小姐高数据率,因此更有可能受益于更小的页表的缓存比遭受增加数据缓存错过。
我们评估这些方法对于本机和虚拟系统和一系列现实的记忆碎片场景,描述所需的有限变化在我们的内核实现和硬件设计,识别并解决相关挑战自参照页表和内核内存分配,并比较结果在服务器和移动系统使用学术和工业模拟器的鲁棒性。
我们发现压扁并减少所需的访问页面上行走(1.0),但其性能影响(+ 2.3%)是由于小沃克页面缓存(已经1.5访问)。优先级缓存(+ 6.8%),有更大的影响和+ 9.2%的结合提高了性能。压扁在虚拟化系统更有效(4.4到2.8访问,+ 7.1%的性能),由于2 d页面走。通过结合两种技术我们展示最先进的动态缓存+ 14.0%性能和-8.7%能源和-4.7%的动态DRAM虚拟执行非常简单的硬件和软件的改变。
作者:
Chang Hyun公园
瑞典乌普萨拉大学
伊利亚斯Vougioukas
手臂的研究中,英国
安德烈亚斯•桑德伯格
手臂的研究中,英国
大卫Black-Schaffer
瑞典乌普萨拉大学
imec的计算路线图;美国目标华为;美印。特遣部队;China-Bolivia交易;力量发泄白光干涉测量系统;三星量化可持续性;麦肯锡标识在美国工厂建设问题;发光二极管。
留下一个回复