딥러닝이 의료 영상 분석에 적용된 이후, 합성곱 신경망(CNN)과 비전 트랜스포머(ViT)는 의료 영상 분류 작업의 핵심 아키텍처가 되었습니다. 그러나 CNN은 국소 수용 영역에 제한되어 있어 의료 영상에서의 장거리 문맥 의존적 상관관계를 효과적으로 모델링할 수 없으며, ViT는 자기 주의 메커니즘의 이차 계산 복잡도로 인해 고해상도 의료 영상 작업에 배치 시 어려움이 있습니다. Mamba로 대표되는 상태 공간 모델(SSM)은 선형 복잡도를 갖는 새로운 해결책을 제공하지만, 직접적인 의료 영상 응용에서 중복된 방향성 모델링과 낮은 파라미터 효율성 문제를 겪습니다. 본 연구는 SS2D-Top2 적응형 방향 스캐닝 메커니즘(SSM 서브모듈 FLOPs 약 37% 감소)과 G-SSM 그룹화 파라미터 공유 모듈(3–4% 파라미터 압축 및 정규화를 통해 4.4% 정확도 향상)을 통합한 효율적 상태 공간 향상 프레임워크(MedMamba-ESS)를 제안합니다. 14개의 공개 데이터셋(9가지 영상 모달리티, 9가지 해부학적 부위, 24만 장 이상의 이미지)에서 검증한 결과, MedMamba-ESS는 2.0G FLOPs에서 우수한 성능을 달성했습니다: non-MedMNIST 데이터셋에서는 기본 MedMamba-Tiny 대비 전체 정확도(OA)가 3% 높고(다른 주류 모델 대비 3.13% 높음), MedMNIST 데이터셋에서는 3% 높으며(기타 대비 1% 향상), 절제 실험을 통해 두 모듈이 시너지 효과로 1.05% 파라미터를 줄이고 정확도를 4.6% 향상시킴을 확인했습니다. 본 연구는 의료 영상 응용에서 전통적인 SSM의 기술적 한계를 극복하며, 모델 성능과 계산 효율성을 동시에 향상시키는 시너지 개선을 이뤘습니다. 이는 SSM의 의료 영상 분석 구현에서 실용성과 일반화를 결합한 아키텍처 최적화 솔루션을 제공합니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
H. Gao
Yuxin Zhang
Kun Hu
Building similarity graph...
Analyzing shared references across papers
Loading...
Gao 등(토,)은 이 질문을 연구했습니다.
www.synapsesocial.com/papers/69a52de5f1e85e5c73bf11c2 — DOI: https://doi.org/10.3390/app16052348
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: