中文 英语

作者最新文章


通过定制指示进行创新,但不要破坏生态系统


本白皮书回顾了SoC设计师在部署硬件加速器时的设计考虑因素,以及软件开发人员如何访问使用Arm自定义指令实现的加速器。点击这里阅读更多。»阅读更多

PLANAR:用于近内存数据重排的可编程加速器


许多应用程序采用不规则和稀疏的内存访问,无法利用高性能处理器中现有的缓存层次结构。为了解决这个问题,数据布局转换(DLT)技术将稀疏数据重新排列为密集表示,提高局部性和缓存利用率。然而,之前在这一领域的提案未能提供一个设计(i)与m…»阅读更多

关键字转换器:关键字发现的自注意模型


Transformer架构在许多领域都取得了成功,包括自然语言处理、计算机视觉和语音识别。在关键字发现中,自我注意主要用于卷积或循环编码器之上。我们研究了一系列使Transformer架构适应关键字发现的方法,并介绍了关键字转换器(KWT),一个完全…»阅读更多

Arm架构同步概述及案例研究


本白皮书的目的是分享Arm架构的知识。本文档的目标读者是那些使用Arm架构进行同步工作的人。[警告]当我们处理锁定优化时,我们必须非常注意正确性。由同步引起的错误通常很难找到根本原因,优化后的代码可能会在其他cpu上崩溃。»阅读更多

Arm Cortex-M55处理器简介


这份白皮书涵盖了Arm Cortex-M55处理器的技术细节,包括流水线、浮点支持和特性。Arm Cortex-M55处理器是Arm最支持人工智能的Cortex-M处理器,也是首个采用Arm Helium矢量处理技术的处理器,带来了增强的、节能的信号处理和机器学习(ML)性能。点击这里阅读更多。»阅读更多

每次行走都是一次命中:让页面行走单访问缓存命中


由于内存容量超过了TLB的覆盖范围,大数据应用程序遭受频繁的页表遍历。我们研究了解决这一成本的两种互补技术:减少所需的访问数量和减少每次访问的延迟。第一种方法是通过机会主义地“扁平化”页表来实现的:合并两层传统的4 KB p…»阅读更多

功能安全应用的组件和工具


功能安全在各种市场中都很重要,包括汽车、工业、医疗和铁路部门,在消费电子产品中也很常见。然而,功能安全所需的嵌入式软件的复杂性正在增长,由于连接性要求,安全问题也在上升。这可能导致安全关键系统的故障,并导致…»阅读更多

Arm Neoverse N1核心:性能分析方法


Arm Neoverse生态系统正在大幅增长,许多Arm硬件和软件合作伙伴正在开发应用程序,并将其工作负载移植到基于Arm的云实例上。随着基于Neoverse N1的系统被广泛使用,与传统系统相比,许多实际工作负载显示出非常有竞争力的性能和显著的成本节约。最近的一些例子包括:……»阅读更多

ML推断加速器的侧信道带宽利用率


用于机器学习(ML)推理的加速器比cpu提供了更大的性能优势。在实际应用中,确保推理中的机密模型不受片外侧信道攻击是利用性能优势的关键。数据和内存地址加密最近被提出来防御芯片外攻击。在本文中,我们证明了带宽…»阅读更多

Post-Quantum密码学


量子计算越来越被视为对通信安全的威胁:实现实用量子计算机的快速进展引起了人们对这种机器长期以来被理解的潜力的关注,这种机器可以打破当代密码基础设施的基本原理。虽然这种可能性到目前为止还只是理论上的,但密码学社区正在为这种可能性做准备。»阅读更多

←老帖子
Baidu