理大创新科研利用先进记忆提示技术克服超声波影像难题
心血管疾病是香港主要健康问题之一,不少市民会定期进行心脏检查,以便及早发现及治疗。作为重要的诊断影像工具,超声波心动图在评估心脏功能方面非常重要,能以非侵入性方式洞察心血管健康状况,有助及时介入治疗。然而,由于影像中常出现斑点噪声与模糊边界等问题,要人工解读这些超声波影像极具挑战,需要大量的专业知识和时间。因此,常规的年度身体检查计划中,较少涵盖心脏相关检查。
香港理工大学护理学院秦璟教授与团队开发了一项名为「MemSAM」的创新模型,透过改良Meta AI的人工智能(AI)模型「Segment Anything Model(SAM)」配合医学影像的特定需求,从而革新超音波心动图影片分割技术。
MemSAM透过时间感知与抗噪声提示方案,引入了一套独特的超声波心动图影片分割方法。由Meta AI推出的SAM,是专门用于影像分割的先进AI模型,可以快速识别并分割任何影像中的元素。
虽然传统的SAM应用在自然影像分割方面表现出色,但由于缺乏时间一致性,并且有显著的噪声,限制其在医学影像中的直接应用。针对这些问题,MemSAM加入了一套时空记忆机,可以同时捕捉空间及时间信息,确保跨影片画面分割的一致性与准确度。
引入MemSAM有望大幅降低成本及解读影像所需的专业知识门坎,从而减轻漫长从而等待高级心脏影像设备的负担。此外,该技术还能将简易心脏评估纳入常规健康筛查,不仅提升检查的便利性,并有助提高疾病的早期发现率。
众所周知,超声波心动图影片的分割存在许多固有挑战,难度极高。影像中大量斑点噪声和伪影,加上心脏结构边界的模糊性,令分割过程更加复杂。
此外,由于心脏运动的动态特性,导致目标对象在不同画面之间会出现显著差异。MemSAM采用了记忆强化机制,利用预测屏蔽加强记忆提示的质素,可有效减轻噪声的不良影响,并改善分割精准度。
MemSAM的一大特色,是能够在标注数据有限的情况下仍能展现顶尖表现。在临床实务中,超声音波心动图影片的标注工作需要大量人力,通常会导致标注稀疏,一般仅限于收缩末期和舒张末期等关键画面。MemSAM在半监督设定下表现出色,其表现媲美完全监督模型,同时所需的标注及提示远少于后者。
MemSAM的效用已在CAMUS及EchoNet-Dynamic两个公共数据集上,进行了严格测试,表现比现有模型更为优胜。值得注意的一点,该模型能够以最少的提示保持高度的分割准确率,对简化临床工作流程及减轻医护专业人员负担方面,显示出莫大潜力。
MemSAM所采用的技术,源自SAM模型与先进记忆提示技术的融合。SAM以其强大的影像理解与分割能力闻名,经改良后,可解决医学影片的独特难题。其核心创新在于时间感知提示方案,透过时空记忆引导分割过程。该记忆机制包含了空间及时间线索,使模型能够维持在不同画面之间保持一致,并避免由屏蔽传播而导致的错误识别问题。
记忆强化机制是MemSAM的另一项关键设计。由于超声波影像经常会受到复杂的噪声影响,因而降低影像嵌入的质素。为了解决这问题,MemSAM采用了一种强化策略,利用分割结果突显前景特征,并降低背景噪声的影响。该方法不仅提升特征显示的辨识度,还防止传播错误信息以及在记忆中累积。
MemSAM的架构建基于医学基础模型SAMUS,而SAMUS则是建基于SAM,针对医学影像的优化模型。该模型会逐个画面顺序处理影片,处理后续画面时不用依靠外部提示,而是靠记忆提示。这个设计大幅降低对密集标注及外部提示的需要,特别适合半监督作业。
虽然 MemSAM可视为超声波心动图像影片分割领域的一大突破,未来的研究目标是提升模型的稳健性,尤其是针对初始画面质素较差的情况。此外,探索MemSAM在其他医学影像领域的应用,以及提升其运算效率,将会是未来的重要发展方向。
MemSAM不仅解决了超声波影片分割存在已久的难题,还为先进机器学习技术与医学影像的融合树立新基准。透过弥合尖端技术与临床应用之间的差距,MemSAM有望改善心血管护理的诊断准确度与患者预后。这个创新模型体现了人工智能在革新医护行业的潜力,让人窥见自动化、准确及高效的诊断工具成为常态的未来。
数据源: Innovation Digest