中文 英语
18lickc新利
的意见

基于超快算法的医学超声诊断创新

使用自适应计算架构实现非常高的数据速率算法。

受欢迎程度

医学超声是所有诊断成像系统中最具吸引力的,因为它的微创性和没有任何辐射。随着医用超声因其非侵入性和观察软组织图像的能力在更广泛的应用中不断增长,在超声波束形成、多维可视化和应用人工智能辅助诊断严重疾病方面支持先进成像技术的需求也在不断增长。

然而,今天,医疗超声在实时使用方面仍然受到限制,这是由于诸如连续数据采集、低帧率(每秒10到50帧)和次优图像焦点(只能在单一深度获得)等挑战。

在标准顺序成像中,完整的图像是逐行获得的。每条线都是通过取一组点来扫描的,从左到右,用一束聚焦在给定点上的透射光束。然后在接收期间使用动态聚焦在任何横向位置产生一条线。下一步,再深入一点,再次扫描。您可以多次重复此过程以构建完整的映像。

为了提高超声图像质量,采用不同的发射焦深度,将不同深度对应的局部图像进行重组得到最终图像。

此外,超声波成像受到声速限制,即每秒1540米。因此,它需要200微秒才能下潜到15厘米深的地方,并接收回信号,每秒测量5000次。对于分辨率为100到200行的图像,这将导致帧率为每秒10到50帧(fps),对应于100ms到20ms。

以心脏成像为例,主动脉瓣(存在于人类心脏和大多数动物心脏中)的切换时间范围为200毫秒。因此,您只能得到10个运动阀门的快照(200ms/20ms=10)。这对于实时成像需求是不够的。

因此,在关键超声诊断中,顺序数据采集不足以达到预期的帧率和图像质量。

超快成像技术

解决这些挑战的一种方法是使用超快成像技术。超快成像是一种范式转变,从正常的连续采集到使用球面波或平面波的整个平面的完全并行采集。这提供了在图像中的任何地方进行最佳聚焦的能力,并能够每秒获得数千张图像,从而获得高图像质量、精度和扫描深度。我们还可以对高速和低速进行高精度的功能成像。完整的数据集为我们提供了更准确的回顾性测量的可能性。

但是,UltraFast技术仅限于研究扫描仪,并且由于计算、系统大小和功耗方面的巨大资源需求,已被证明很难在商业上可行的扫描仪上实现。

自适应soc的优点

现在,让我们来探索AMD-Xilinx的自适应片上系统(soc)如何进一步创新超快成像。

Xilinx基于versal的自适应soc是最新一代自适应计算加速平台(ACAP)设备,具有紧密耦合的多处理器、FPGA和新的“智能引擎”或AI引擎(AIE),具有高度并行的SIMD-VLIW架构。SIMD代表“单指令多数据”,VLIW是“超长指令字”。各个块使用NoC或“片上网络”架构紧密耦合,允许数据在不同块之间快速移动。

AIE是超快算法(如平面波和合成孔径算法)的主要计算单元。它是一个连接在网格中的SIMD/VLIW处理器的大矩阵(请参阅下面的图1)。每个处理器都有自己的指令和数据内存,每个处理器都可以与其邻居共享内存。所有处理器都连接在具有每秒几兆位元组带宽的创新互连上。这种结构允许实现这种算法所需的前所未有的并行性。

下图1显示了新AI引擎在Versal SoC中的架构。

图1

借助AIE系统的这种新型自适应计算架构,医疗设备制造商可以实现非常高的数据速率算法,例如,在并行软件波谱转换器中实现实时扫描或3D/4D可视化,AI-ML用于感兴趣区域选择,数据推断辅助和图像重建卸载内窥镜,机器人手术和放射学,使用单个完全嵌入式设备。

使用这种新型自适应SoC, AMD-Xilinx在丹麦科技大学Joergen Jensen博士的帮助下开始构建一个实用的UltraFast波束形成器。Jensen博士帮助开发了算法,AMD-Xilinx与我们的合作伙伴一起,在一个示例设计中实现了该波束形成器,以及用于Versal自适应SoC的软件库。

下面的框图(图2)是一个在单个Versal自适应SoC上的示例UltraFast波束形成器的高级表示,结合了FPGA、CPU和用于人工智能和数字信号处理的硬件加速器。

图2

该设备的FPGA部分管理传感器并获取回声,将数据存储在外部DDR4存储器中,并可以使用PCIe与主机系统通信,或通过精确时间协议和10/25Gigabit以太网通道扩展和同步另一个模块。

主要优势包括:

  • 使用单个Versal自适应SoC处理基于ultrafast的波束形成器并产生极高的性能。
  • 在Xilinx Vitis软件开发环境中使用高级编程语言(如C/ c++)实现一个完整的软件波束形成器
  • 启用Vitis加速库,可以在医疗设备设计中使用,也可以作为示例设计使用,以实现医疗设备制造商自己的算法。

由于许多科学家使用Matlab来设计他们的系统,我们可以通过Model Composer提供Matlab支持,这是一个基于模型的设计工具,可以在Matlab和Simulink环境中进行快速设计,并通过自动代码生成加速在Versal自适应SoC设备上进行生产。通过一组c++模板来加强这一点,这些模板包装了AI引擎的基本API(如下面的图3所示)。

图3

下面的图4显示了用于“超快”超声成像的加速库的Vitis统一软件环境。

图4

现实技术演示

AMD-Xilinx在北美放射学会(RSNA) 2021 107上强调了这种超声波束形成器的全部功能的真实演示th年会将于2021年12月在芝加哥举行。演示器使用的是Versal AI核心系列VCK190评估板连接到AMD工作站。选择了一台配备RX6900XT AMD GPU的戴尔Alienware工作站来渲染图像。超声波数据由无线探头实时提供,以显示准确的性能,或者也可以使用大多数超声成像科学家使用的Field II这样的模拟器来提供,以使用参考图像验证算法。

我们测量并生成了基于“UltraFast”的波束形成器的性能基准,用于Versal自适应SoC和一个竞争的GPU。我们介绍了两种应用的数据,腹部成像和小部位成像。用于Versal设备的软件环境是Vitis 2021.2(支持未来版本)和用于GPU的CUDA。

下面的表1和2总结了Xilinx Versal自适应SoC、GPU RTX 2020 (Nvidia)和运行i7处理器的PC (Intel)使用64个活动元素和200行分辨率的单个波束形成器的fps(帧/秒)性能结果。

表1:小零件成像

表2:腹部影像

线性和匹配滤波器插值结果是为浮点32 (FP32)和整数16 (Int16)数据类型。正如上面的数字所示,Versal平台不仅可以使用“UltraFast”技术实现完整的波束形成器,而且性能显著优于游戏GPU和PC。结果表明,在GPU上的一些关键算法中,整数线性插值的增益为44倍,浮点数增益为27倍。Catmull-Rom样条插值是最具挑战性的实现之一,显示了Versal进一步提高了其性能优势,从GPU的91倍提高到160倍。

通过这项新创新,单个嵌入式SoC设备现在可以使用“UltraFast”算法实现商业上可行的实时超声波束形成器。这将在严重疾病诊断中产生新的能力,通过创建在图像中获得最佳聚焦图像的能力,并在每秒获得数千张图像,从而获得高图像质量和准确性。



留下回复


(注:此名称将公开显示)

Baidu