中文 英语

将浮点8解决AI /毫升开销?


而追求媒体关于图灵Test-busting ChatGPT的结果,工程师们正在关注硬件运行大型语言模型和其他的挑战深度学习网络。毫升的穿孔列表是如何运行模型更有效地使用更少的力量,尤其是在关键应用程序像无人驾驶车辆延迟成为了生死的问题。人工智能已经……»阅读更多

使用硅光子学减少延迟在边缘设备上


一个新的技术论文题为“非定域化的光子深度学习在互联网上的优势”是由麻省理工学院的研究人员和诺基亚公司出版的。“每当你想要运行一个神经网络,你需要运行这个程序,你可以运行程序和速度取决于你如何快速管道从内存中的程序。我们的管子是巨大的——它对应于发送一个完整的feature-leng……»阅读更多

AI FP8:跨行业硬件规范培训和推理(手臂、英特尔、英伟达)


手臂、英特尔和Nvidia提出了规范一个8位浮点(FP8)格式,可以提供一个通用的可互换格式适用于人工智能训练和推理,让人工智能模型和跨硬件平台的执行操作。找到技术论文题为“深度学习FP8格式”。2022年9月出版。文摘:“FP8是一种天然的p…»阅读更多

卷积神经网络:合作设计的硬件体系结构和压缩算法


进程大学的研究人员(韩国)发表“调查效率卷积神经网络和硬件加速”。Abstract: "Over the past decade, deep-learning-based representations have demonstrated remarkable performance in academia and industry. The learning capability of convolutional neural networks (CNNs) originates from a combination of various feature extraction...»阅读更多

深度学习分类,建立结构属性预测PeakForce QNM原子力显微镜


机器学习,具体来说,深度学习,是一个功能强大的工具来建立微观结构相关性的存在(或缺乏)大部分属性与充实的能力,否则很难建立关系和趋势。本应用笔记讨论深度学习工具的使用,探索AFM阶段和PeakForce定量Nanomechanics (QNM)我……»阅读更多

DNN-Opt,小说深层神经网络(款)基于黑盒为模拟分级优化框架


这个技术论文题为“DNN-Opt: RL启发优化模拟电路规模使用深层神经网络”是共同在奥斯汀的德克萨斯大学的研究人员,英特尔,格拉斯哥大学。这篇论文是一个最好的候选人在2021 DAC。”在这篇文章中,我们目前的DNN-Opt,小说深层神经网络(款)黑盒优化框架为基础模拟sizi……»阅读更多

对人工智能芯片的新用途


人工智能被部署的新应用程序,从提高性能和减少在各种终端设备发现违规数据移动出于安全原因。虽然大多数人都熟悉使用机器学习和深度学习区分猫和狗,新兴应用程序显示如何使用这种能力……»阅读更多

低功率HW加速器FP16矩阵乘法在RISC-V紧密集成核


这种新技术论文题为“RedMulE:紧凑FP16适应深度学习矩阵乘法加速器RISC-V-Based超低功耗soc”被博洛尼亚大学的研究人员发表,苏黎世联邦理工学院。根据他们的简介:“绊倒石头的关键是对并行浮点操作的需要,被认为是负担不起子- 100 mW extre……»阅读更多

模拟深度学习处理器(麻省理工学院)


麻省理工学院的一组研究人员正致力于人工智能硬件,用更少的权力提供了更快的计算。模拟深度学习技术包括发送质子通过固体以极快的速度。“设备的工作机制是最小的离子电化学插入,质子,变成一个绝缘氧化物调节其电子导电率……»阅读更多

蒸馏四个DAC主题演讲的本质


芯片设计和验证正面临越来越多的挑战。将如何解决,特别是他们的机器学习EDA行业是一个主要的问题,这是一个共同的主题在四个主题演讲者在本月的设计自动化会议。DAC返回为一个生活事件,今年的主题演讲涉及系统的领导人comp……»阅读更多

←旧的文章
Baidu