論文の概要: General Vision Encoder Features as Guidance in Medical Image Registration
- arxiv url: http://arxiv.org/abs/2407.13311v1
- Date: Thu, 18 Jul 2024 09:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-19 16:00:23.984163
- Title: General Vision Encoder Features as Guidance in Medical Image Registration
- Title(参考訳): 医用画像登録における一般ビジョンエンコーダの特徴
- Authors: Fryderyk Kögl, Anna Reithmeir, Vasiliki Sideri-Lampretsa, Ines Machado, Rickmer Braren, Daniel Rückert, Julia A. Schnabel, Veronika A. Zimmer,
- Abstract要約: 医用画像登録における異種度指標において,一般的な視覚エンコーダの特徴がどの程度有効かを検討する。
心血管MRIデータに関する広範な実験では、従来の指標の付加的なガイダンスとして機能を使用することで、登録品質が向上することが判明した。
- 参考スコア(独自算出の注目度): 3.7713533540423785
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: General vision encoders like DINOv2 and SAM have recently transformed computer vision. Even though they are trained on natural images, such encoder models have excelled in medical imaging, e.g., in classification, segmentation, and registration. However, no in-depth comparison of different state-of-the-art general vision encoders for medical registration is available. In this work, we investigate how well general vision encoder features can be used in the dissimilarity metrics for medical image registration. We explore two encoders that were trained on natural images as well as one that was fine-tuned on medical data. We apply the features within the well-established B-spline FFD registration framework. In extensive experiments on cardiac cine MRI data, we find that using features as additional guidance for conventional metrics improves the registration quality. The code is available at github.com/compai-lab/2024-miccai-koegl.
- Abstract(参考訳): DINOv2やSAMのような一般的な視覚エンコーダはコンピュータビジョンを変換した。
自然画像で訓練されているにもかかわらず、そのようなエンコーダモデルは医療画像、例えば分類、セグメンテーション、登録において優れている。
しかし、医学登録のための様々な最先端の一般ビジョンエンコーダの詳細な比較は行われていない。
本研究では,医用画像登録のための異種度指標において,一般的な視覚エンコーダの特徴がどの程度有効であるかを検討する。
我々は、自然画像で訓練された2つのエンコーダと、医療データで微調整された1つのエンコーダを探索した。
確立されたB-スプラインFFD登録フレームワークに特徴を適用した。
心血管MRIデータに関する広範な実験では、従来の指標の付加的なガイダンスとして機能を使用することで、登録品質が向上することが判明した。
コードはgithub.com/compai-lab/2024-miccai-koeglで入手できる。
関連論文リスト
- General Purpose Image Encoder DINOv2 for Medical Image Registration [11.148125068936434]
本稿では、画像特徴抽出のための汎用画像エンコーダDINOv2を活用する、トレーニング不要な変形可能な画像登録手法DINO-Regを提案する。
我々の知る限り、医用画像登録における一般ビジョン基盤モデルの適用はこれが初めてである。
論文 参考訳(メタデータ) (2024-02-24T02:15:30Z) - G-CASCADE: Efficient Cascaded Graph Convolutional Decoding for 2D
Medical Image Segmentation [8.550528610846456]
我々は、新しいグラフ畳み込みに基づくデコーダ、すなわちカスケードグラフ畳み込みアテンションデコーダ(G-CASCADE)を提案する。
G-CASCADEは、効率的なグラフ畳み込みブロックを持つ階層変換器エンコーダによって生成される多段特徴写像を徐々に洗練する。
我々のデコーダは他の階層エンコーダと簡単に使用でき、汎用的セマンティックおよび医用画像セグメンテーションタスクに利用できる。
論文 参考訳(メタデータ) (2023-10-24T20:41:04Z) - VNVC: A Versatile Neural Video Coding Framework for Efficient
Human-Machine Vision [59.632286735304156]
コード化された表現をピクセルに復号することなく直接拡張・解析することがより効率的である。
再構成と直接拡張/分析の両方をサポートするために,コンパクト表現の学習を目標とする汎用型ニューラルビデオ符号化(VNVC)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-19T03:04:57Z) - AutoSAM: Adapting SAM to Medical Images by Overloading the Prompt
Encoder [101.28268762305916]
この作業では、Segment Anything Modelを同じ入力イメージで動作するエンコーダに置き換える。
複数の医用画像とビデオのベンチマークで最先端の結果を得る。
内部の知識を検査し、軽量なセグメンテーションソリューションを提供するために、浅いデコンボリューションネットワークによってマスクに復号化することを学ぶ。
論文 参考訳(メタデータ) (2023-06-10T07:27:00Z) - On the Importance of Image Encoding in Automated Chest X-Ray Report
Generation [4.843654097048771]
胸部X線は、そのアクセシビリティと有効性から最も人気のある医用画像モダリティの1つである。
これらの画像を解釈し、患者の状態を診断できる、よく訓練された放射線科医の慢性的な不足がある。
自動放射線診断レポート生成は 臨床実践において 非常に有用なツールです
論文 参考訳(メタデータ) (2022-11-24T08:02:52Z) - Attentive Symmetric Autoencoder for Brain MRI Segmentation [56.02577247523737]
視覚変換器(ViT)をベースとした3次元脳MRIセグメンテーションタスクのための新しいアテンテーティブシンメトリオートエンコーダを提案する。
事前学習の段階では、提案するオートエンコーダがより注意を払って、勾配測定値に従って情報パッチを再構築する。
実験の結果,提案手法は最先端の自己教師付き学習法や医用画像分割モデルよりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T09:43:19Z) - Focused Decoding Enables 3D Anatomical Detection by Transformers [64.36530874341666]
集束デコーダと呼ばれる3次元解剖学的構造検出のための新しい検出変換器を提案する。
Focused Decoderは、解剖学的領域のアトラスからの情報を活用して、クエリアンカーを同時にデプロイし、クロスアテンションの視野を制限する。
提案手法を利用可能な2つのCTデータセットに対して評価し、フォーカスドデコーダが強力な検出結果を提供するだけでなく、大量の注釈付きデータの必要性を軽減し、注意重みによる結果の例外的で直感的な説明性を示すことを示した。
論文 参考訳(メタデータ) (2022-07-21T22:17:21Z) - Double Encoder-Decoder Networks for Gastrointestinal Polyp Segmentation [19.338350044289736]
本稿では,一般的なエンコーダ・デコーダネットワークを直接拡張した意味的セグメンテーションに基づく内視鏡画像からの消化管ポリープのデライン化手法を提案する。
提案手法では,2つの事前学習エンコーダデコーダネットワークを順次積み重ねる。
二重エンコーダ・デコーダネットワークは、すべてのケースにおいて、それぞれのエンコーダ・デコーダネットワークよりも明らかに優れている。
論文 参考訳(メタデータ) (2021-10-05T11:07:42Z) - Atrous Residual Interconnected Encoder to Attention Decoder Framework
for Vertebrae Segmentation via 3D Volumetric CT Images [1.8146155083014204]
本稿では,3次元容積CT画像を用いた新しい椎骨分割法を提案する。
提案モデルは,ミニバッチトレーニング性能の最適化にレイヤ正規化を用いた,エンコーダからデコーダへの構造に基づく。
実験の結果,本モデルは他の医学的意味セグメンテーション法と比較して競争力が得られた。
論文 参考訳(メタデータ) (2021-04-08T12:09:16Z) - TransUNet: Transformers Make Strong Encoders for Medical Image
Segmentation [78.01570371790669]
医用画像のセグメンテーションは医療システムの開発に必須の前提条件である。
様々な医療画像セグメンテーションタスクにおいて、U-Netとして知られるu字型アーキテクチャがデファクトスタンダードとなっている。
医用画像セグメンテーションの強力な代替手段として,トランスフォーマーとU-Netの両方を有効活用するTransUNetを提案する。
論文 参考訳(メタデータ) (2021-02-08T16:10:50Z) - Towards Coding for Human and Machine Vision: A Scalable Image Coding
Approach [104.02201472370801]
圧縮モデルと生成モデルの両方を活用することにより,新しい画像符号化フレームワークを考案した。
高度な生成モデルを導入することで、コンパクトな特徴表現と参照画素から画像を再構成するフレキシブルネットワークを訓練する。
実験により、人間の視覚的品質と顔のランドマーク検出の両方において、我々の枠組みが優れていることが示された。
論文 参考訳(メタデータ) (2020-01-09T10:37:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。