論文の概要: Interpretable Unsupervised Deformable Image Registration via Confidence-bound Multi-Hop Visual Reasoning
- arxiv url: http://arxiv.org/abs/2602.00211v1
- Date: Fri, 30 Jan 2026 14:41:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.055166
- Title: Interpretable Unsupervised Deformable Image Registration via Confidence-bound Multi-Hop Visual Reasoning
- Title(参考訳): 信頼結合型マルチホップビジュアル推論による解釈不能な変形画像登録
- Authors: Zafar Iqbal, Anwar Ul Haq, Srimannarayana Grandhi,
- Abstract要約: 教師なしの変形可能な画像登録には、参照ラベルなしで複雑な解剖学的構造を整列する必要がある。
既存のディープラーニング手法は精度は高いが透明性を欠くことが多く、誤りの漂流と臨床信頼の低下につながる。
本稿では,段階的推論プロセスとして登録を再構成する新しいマルチホップ・ビジュアル・チェイン・オブ・推論・フレームワークを提案する。
- 参考スコア(独自算出の注目度): 1.6939372704265414
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised deformable image registration requires aligning complex anatomical structures without reference labels, making interpretability and reliability critical. Existing deep learning methods achieve considerable accuracy but often lack transparency, leading to error drift and reduced clinical trust. We propose a novel Multi-Hop Visual Chain of Reasoning (VCoR) framework that reformulates registration as a progressive reasoning process. Inspired by the iterative nature of clinical decision-making, each visual reasoning hop integrates a Localized Spatial Refinement (LSR) module to enrich feature representations and a Cross-Reference Attention (CRA) mechanism that leads the iterative refinement process, preserving anatomical consistency. This multi-hop strategy enables robust handling of large deformations and produces a transparent sequence of intermediate predictions with a theoretical bound. Beyond accuracy, our framework offers built-in interpretability by estimating uncertainty via the stability and convergence of deformation fields across hops. Extensive evaluations on two challenging public datasets, DIR-Lab 4D CT (lung) and IXI T1-weighted MRI (brain), demonstrate that VCoR achieves competitive registration accuracy while offering rich intermediate visualizations and confidence measures. By embedding an implicit visual reasoning paradigm, we present an interpretable, reliable, and clinically viable unsupervised medical image registration.
- Abstract(参考訳): 教師なしの変形可能な画像登録には、参照ラベルなしで複雑な解剖学的構造を整列する必要があるため、解釈可能性と信頼性が重要である。
既存のディープラーニング手法は精度は高いが透明性を欠くことが多く、誤りの漂流と臨床信頼の低下につながる。
本稿では,段階的推論プロセスとして登録を再構成する新しいマルチホップ・ビジュアル・チェイン・オブ・推論(VCoR)フレームワークを提案する。
臨床的意思決定の反復性に触発され、各視覚的推論ホップは、特徴表現を豊かにするための局所的空間リファインメント(LSR)モジュールと、解剖学的整合性を保つために反復的洗練プロセスを導く相互参照アテンション(CRA)機構を統合する。
このマルチホップ戦略は、大きな変形の堅牢なハンドリングを可能にし、理論的な境界を持つ中間予測の透過的なシーケンスを生成する。
精度を超えて、我々のフレームワークはホップ間の変形場の安定性と収束性を通じて不確実性を推定することにより、組み込みの解釈可能性を提供する。
DIR-Lab 4D CT (lung) と IXI T1-weighted MRI (brain) の2つの挑戦的な公開データセットに対する大規模な評価は、VCoRがリッチな中間視覚化と信頼性測定を提供しながら、競合登録精度を達成することを実証している。
暗黙的な視覚的推論パラダイムを組み込むことで、解釈可能で信頼性があり、臨床的に可能な医用画像登録を提示する。
関連論文リスト
- TransFIRA: Transfer Learning for Face Image Recognizability Assessment [73.61309363885552]
TransFIRAは軽量でアノテーションのないフレームワークで、埋め込みスペースで直接認識できる。
顔以外の新しい拡張には、エンコーダで座屈した説明可能性があり、これは、劣化と被写体固有の要因が認識可能性にどのように影響するかを示す。
実験では、顔に対する最先端の結果、身体認識に対する強い堅牢性、およびデータセット間のシフトの下で確認された。
論文 参考訳(メタデータ) (2025-10-07T18:16:21Z) - Self-Supervised Cross-Encoder for Neurodegenerative Disease Diagnosis [6.226851122403944]
縦型MRIスキャンにおける時間的連続性を利用した自己監督型クロスエンコーダフレームワークを提案する。
このフレームワークは、学習した表現を2つのコンポーネントに分解する: 静的表現は、対照的な学習によって制約され、安定した解剖学的特徴を捉え、動的表現は、時間的変化を反映する入力漸進正規化によってガイドされる。
アルツハイマー病神経画像イニシアチブデータセットの実験結果から,本手法は分類精度が向上し,解釈性が向上することが示された。
論文 参考訳(メタデータ) (2025-09-09T11:52:24Z) - Decentralized LoRA Augmented Transformer with Context-aware Multi-scale Feature Learning for Secured Eye Diagnosis [2.1358421658740214]
本稿では、コンテキスト認識型マルチスケールパッチ埋め込み、ローランド適応(LoRA)、知識蒸留、フェデレーション学習を統合し、これらの課題に統一的に対処する新しいデータ効率画像変換器(DeiT)ベースのフレームワークを提案する。
提案モデルでは,マルチスケールパッチ表現と局所的および大域的注意機構を活用することで,局所的および大域的網膜特徴を効果的に捉えている。
論文 参考訳(メタデータ) (2025-05-11T13:51:56Z) - VICCA: Visual Interpretation and Comprehension of Chest X-ray Anomalies in Generated Report Without Human Feedback [1.5839621757142595]
本稿では,AI生成医療報告のセマンティックアライメントと位置決め精度の向上を目的とした新しいフレームワークを提案する。
元の画像と生成された画像の特徴を比較することにより、デュアルスコーリングシステムを導入する。
このアプローチは既存の手法よりも優れており、病理の局在化やテキスト・ツー・イメージのアライメントにおいて最先端の結果が得られている。
論文 参考訳(メタデータ) (2025-01-29T16:02:16Z) - Bayesian Unsupervised Disentanglement of Anatomy and Geometry for Deep Groupwise Image Registration [59.062085785106234]
本稿では,マルチモーダル群画像登録のための一般ベイズ学習フレームワークを提案する。
本稿では,潜在変数の推論手順を実現するために,新しい階層的変分自動符号化アーキテクチャを提案する。
心臓、脳、腹部の医療画像から4つの異なるデータセットを含む,提案された枠組みを検証する実験を行った。
論文 参考訳(メタデータ) (2024-01-04T08:46:39Z) - Attribute Regularized Soft Introspective Variational Autoencoder for
Interpretable Cardiac Disease Classification [2.4828003234992666]
臨床医が人工知能モデルの理解と信頼を確実にするためには、解釈可能性が不可欠である。
本稿では,逆向きに訓練された変分オートエンコーダのフレームワーク内で,潜在空間の属性正規化を組み合わす新しい解釈可能な手法を提案する。
論文 参考訳(メタデータ) (2023-12-14T13:20:57Z) - Improving Multiple Sclerosis Lesion Segmentation Across Clinical Sites:
A Federated Learning Approach with Noise-Resilient Training [75.40980802817349]
深層学習モデルは、自動的にMS病変を分節する約束を示しているが、正確な注釈付きデータの不足は、この分野の進歩を妨げている。
我々は,MS病変の不均衡分布とファジィ境界を考慮したDecoupled Hard Label Correction(DHLC)戦略を導入する。
また,集約型中央モデルを利用したCELC(Centrally Enhanced Label Correction)戦略も導入した。
論文 参考訳(メタデータ) (2023-08-31T00:36:10Z) - Towards Reliable Medical Image Segmentation by Modeling Evidential Calibrated Uncertainty [57.023423137202485]
医用画像のセグメンテーションの信頼性に関する懸念が臨床医の間で続いている。
本稿では,医療画像セグメンテーションネットワークにシームレスに統合可能な,実装が容易な基礎モデルであるDEviSを紹介する。
主観的論理理論を活用することで、医用画像分割の確率と不確実性を明示的にモデル化する。
論文 参考訳(メタデータ) (2023-01-01T05:02:46Z) - Trusted Multi-View Classification with Dynamic Evidential Fusion [73.35990456162745]
信頼型マルチビュー分類(TMC)と呼ばれる新しいマルチビュー分類アルゴリズムを提案する。
TMCは、様々な視点をエビデンスレベルで動的に統合することで、マルチビュー学習のための新しいパラダイムを提供する。
理論的および実験的結果は、精度、堅牢性、信頼性において提案されたモデルの有効性を検証した。
論文 参考訳(メタデータ) (2022-04-25T03:48:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。