中文 英语

每次行走都是一次命中:让页面行走单访问缓存命中


由于内存容量超过了TLB的覆盖范围,大数据应用程序遭受频繁的页表遍历。我们研究了解决这一成本的两种互补技术:减少所需的访问数量和减少每次访问的延迟。第一种方法是通过机会主义地“扁平化”页表来实现的:合并两层传统的4 KB p…»阅读更多

基于pcm主存的移动平台的节能DRAM缓存架构


“长电池寿命是移动设备的一流设计目标,而主存占总能耗的很大一部分。此外,随着对带宽和容量的需求不断增长,来自内存的能量消耗预计将进一步增加。具有DRAM和PCM的混合内存系统是提供额外容量的有吸引力的解决方案。»阅读更多

SMASH:来自JavaScript的同步多面Rowhammer攻击


作者:Finn de Ridder,苏黎世联邦理工学院和阿姆斯特丹自由大学;Pietro Frigo, Emanuele Vannacci, Herbert Bos和Cristiano Giuffrida,阿姆斯特丹自由大学;Kaveh Razavi, ETH Zurich摘要:“尽管在dram中有目标行刷新(TRR)缓解,但一些最新的DDR4模块仍然容易受到多面Rowhammer位翻转的影响。虽然这些位翻转是可从本机代码利用的,三…»阅读更多

TimeCache:共享软件时利用时间消除缓存侧通道


“抽象计时侧通道已被用于提取加密密钥和敏感文档,甚至是从受信任的飞地。具体来说,在内存层次结构中重用共享代码或数据所创建的缓存侧通道已经被几种已知的攻击所利用,例如evict+reload用于恢复RSA密钥,Spectre变体用于泄漏推测加载的数据。在这篇论文中,我们……»阅读更多

驯服不可预测系统


半导体系统的可预测性如何?该行业的目标是创建可预测的系统,但当一个胡萝卜被悬挂起来,提供更快、更便宜或其他收益的可能性时,决策者总是决定一定程度的不确定性是必要的。理解不确定性至少是做出明智决策的第一步,但是需要新的工具来评估不确定性。»阅读更多

“就地执行”怎么了?


直接从存储代码的非易失性存储器执行代码,极大地简化了计算体系结构——特别是对于简单的嵌入式设备,如微控制器(mcu)。然而,记忆和逻辑过程的分歧使这在今天几乎不可能实现。术语“就地执行”或“XIP”起源于mcu中的嵌入式NOR内存,使XIP可行. ...»阅读更多

CodaCache:帮助打破记忆墙


随着人工智能(AI)和自动驾驶汽车系统越来越复杂,系统性能需求开始与延迟和功耗需求发生冲突。这种困境迫使半导体工程师重新架构他们的片上系统(SoC)设计,以提供更可扩展的性能、灵活性、效率和集成度。从边缘到数据……»阅读更多

最后一级缓存


Arteris IP营销副总裁Kurt Shuler解释了如何使用最后一级缓存来减少延迟和提高性能,以避免将大量数据发送到外部内存,以及如何通过考虑资源争用来确保芯片上的服务质量。»阅读更多

AI、性能、功率、安全聚焦最后一级缓存


在现代系统中,内存对性能的限制一直很重要,但在使用人工智能方法的汽车安全关键应用程序中,内存限制已成为一个特别重要的问题。一方面,检测和报告潜在的碰撞或其他安全问题必须非常快。任何纠正措施都受物理约束,必须提前采取,以避免问题. ...»阅读更多

芯片设计中的网络存储优化


ClioSoft的技术客户经理Prathna Sekar解释了如何管理大量数据,如何在同事在设计过程中检入数据时迅速失控,以及如何减少需要存储的数据量。»阅读更多

←老帖子
Baidu