論文の概要: iCBIR-Sli: Interpretable Content-Based Image Retrieval with 2D Slice Embeddings
- arxiv url: http://arxiv.org/abs/2501.01642v1
- Date: Fri, 03 Jan 2025 05:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-06 15:11:56.301223
- Title: iCBIR-Sli: Interpretable Content-Based Image Retrieval with 2D Slice Embeddings
- Title(参考訳): iCBIR-Sli:2次元スライス埋め込みによる解釈可能なコンテンツベース画像検索
- Authors: Shuhei Tomoshige, Hayato Muraki, Kenichi Oishi, Hitoshi Iyatomi,
- Abstract要約: 脳MR画像検索の現在の手法は、テキストベースのアプローチに依存している。
我々は,iCBIR-Sli という脳MR画像の解釈可能なCBIR法を提案する。
iCBIR-Sliはスライス情報を効果的に集約することで2Dスライスを使用する際の課題に対処する。
- 参考スコア(独自算出の注目度): 2.0936724675062406
- License:
- Abstract: Current methods for searching brain MR images rely on text-based approaches, highlighting a significant need for content-based image retrieval (CBIR) systems. Directly applying 3D brain MR images to machine learning models offers the benefit of effectively learning the brain's structure; however, building the generalized model necessitates a large amount of training data. While models that consider depth direction and utilize continuous 2D slices have demonstrated success in segmentation and classification tasks involving 3D data, concerns remain. Specifically, using general 2D slices may lead to the oversight of pathological features and discontinuities in depth direction information. Furthermore, to the best of the authors' knowledge, there have been no attempts to develop a practical CBIR system that preserves the entire brain's structural information. In this study, we propose an interpretable CBIR method for brain MR images, named iCBIR-Sli (Interpretable CBIR with 2D Slice Embedding), which, for the first time globally, utilizes a series of 2D slices. iCBIR-Sli addresses the challenges associated with using 2D slices by effectively aggregating slice information, thereby achieving low-dimensional representations with high completeness, usability, robustness, and interoperability, which are qualities essential for effective CBIR. In retrieval evaluation experiments utilizing five publicly available brain MR datasets (ADNI2/3, OASIS3/4, AIBL) for Alzheimer's disease and cognitively normal, iCBIR-Sli demonstrated top-1 retrieval performance (macro F1 = 0.859), comparable to existing deep learning models explicitly designed for classification, without the need for an external classifier. Additionally, the method provided high interpretability by clearly identifying the brain regions indicative of the searched-for disease.
- Abstract(参考訳): 脳MR画像検索の現在の手法はテキストベースのアプローチに依存しており、コンテンツベース画像検索(CBIR)システムに対する重要なニーズを浮き彫りにしている。
機械学習モデルに直接3Dの脳MR画像を適用することは、脳の構造を効果的に学習する利点を提供するが、一般化されたモデルを構築するには大量のトレーニングデータが必要である。
深度方向を考慮し連続的な2次元スライスを利用するモデルは3次元データを含むセグメンテーションおよび分類タスクに成功しているが、懸念は残る。
具体的には、一般的な2次元スライスを用いることで、深さ方向情報における病理的特徴や不連続性の監視につながる可能性がある。
さらに、著者の知る限りでは、脳の構造情報を全て保存する実用的なCBIRシステムの開発は試みられていない。
本研究では,脳MR画像の解釈可能なCBIR法であるiCBIR-Sli (Interpretable CBIR with 2D Slice Embedding)を提案する。
iCBIR-Sliはスライス情報を効果的に集約することで2Dスライスの使用に関わる課題に対処し、CBIRに不可欠な高完全性、ユーザビリティ、堅牢性、相互運用性を備えた低次元表現を実現する。
アルツハイマー病と認知正常の5つの公用脳MRデータセット(ADNI2/3, OASIS3/4, AIBL)を用いた検索評価実験において、iCBIR-Sliは、外部分類器を必要とせず、明示的に分類するために設計された既存のディープラーニングモデルに匹敵するトップ1検索性能(macro F1 = 0.859)を示した。
さらに、検索対象疾患を示す脳領域を明確に同定し、高い解釈性を提供した。
関連論文リスト
- Knowledge-Guided Prompt Learning for Lifespan Brain MR Image Segmentation [53.70131202548981]
本稿では,脳MRIにKGPL(Knowledge-Guided Prompt Learning)を用いた2段階のセグメンテーションフレームワークを提案する。
具体的には,大規模データセットと準最適ラベルを用いたトレーニング前セグメンテーションモデルについて述べる。
知識的プロンプトの導入は、解剖学的多様性と生物学的プロセスの間の意味的関係を捉えている。
論文 参考訳(メタデータ) (2024-07-31T04:32:43Z) - Brain3D: Generating 3D Objects from fMRI [76.41771117405973]
被験者のfMRIデータを入力として利用する新しい3Dオブジェクト表現学習手法であるBrain3Dを設計する。
我々は,人間の視覚系の各領域の異なる機能的特徴を,我々のモデルが捉えていることを示す。
予備評価は、Brain3Dがシミュレーションシナリオで障害した脳領域を正常に識別できることを示唆している。
論文 参考訳(メタデータ) (2024-05-24T06:06:11Z) - fMRI-PTE: A Large-scale fMRI Pretrained Transformer Encoder for
Multi-Subject Brain Activity Decoding [54.17776744076334]
本稿では,fMRI事前学習のための革新的オートエンコーダであるfMRI-PTEを提案する。
我々のアプローチでは、fMRI信号を統合された2次元表現に変換し、次元の整合性を確保し、脳の活動パターンを保存する。
コントリビューションには、fMRI-PTEの導入、革新的なデータ変換、効率的なトレーニング、新しい学習戦略、そして我々のアプローチの普遍的な適用性が含まれる。
論文 参考訳(メタデータ) (2023-11-01T07:24:22Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Class Anchor Margin Loss for Content-Based Image Retrieval [97.81742911657497]
距離学習パラダイムに該当する新しいレペラ・トラクタ損失を提案するが、ペアを生成する必要がなく、直接L2メトリックに最適化する。
CBIRタスクにおいて,畳み込みアーキテクチャと変圧器アーキテクチャの両方を用いて,少数ショットおよびフルセットトレーニングの文脈で提案した目的を評価する。
論文 参考訳(メタデータ) (2023-06-01T12:53:10Z) - 3-Dimensional Deep Learning with Spatial Erasing for Unsupervised
Anomaly Segmentation in Brain MRI [55.97060983868787]
我々は,MRIボリュームと空間消去を組み合わせた空間文脈の増大が,教師なしの異常セグメンテーション性能の向上に繋がるかどうかを検討する。
本稿では,2次元変分オートエンコーダ(VAE)と3次元の相違点を比較し,3次元入力消去を提案し,データセットサイズが性能に与える影響を体系的に検討する。
入力消去による最高の3D VAEは、平均DICEスコアが31.40%となり、2D VAEは25.76%となった。
論文 参考訳(メタデータ) (2021-09-14T09:17:27Z) - Leveraging 3D Information in Unsupervised Brain MRI Segmentation [1.6148039130053087]
Unsupervised Anomaly Detection (UAD) 法を提案し,Variational Autoencoder (VAE) を用いて学習した健常モデルの異常を検出する。
本稿では,UADを3D方式で実行し,2Dと3DのVAEを比較することを提案する。
サイドコントリビューションとして、堅牢なトレーニングを保証する新しい損失機能を紹介します。
学習は、健康な脳MRIの多心性データセットを使用して行われ、白マター高輝度および腫瘍病変のセグメント化性能が推定される。
論文 参考訳(メタデータ) (2021-01-26T10:04:57Z) - Attention-Guided Version of 2D UNet for Automatic Brain Tumor
Segmentation [2.371982686172067]
グリオーマは脳腫瘍の中でも最も一般的で攻撃的であり、高い成績で寿命が短くなる。
深層畳み込みニューラルネットワーク(DCNN)は脳腫瘍のセグメンテーションにおいて顕著な性能を発揮している。
しかし, グリオーマの強度や外観に変化があるため, この課題は依然として困難である。
論文 参考訳(メタデータ) (2020-04-04T20:09:06Z) - ACEnet: Anatomical Context-Encoding Network for Neuroanatomy
Segmentation [1.7080853582489066]
2次元深層学習法はその計算効率に好適である。
既存の2次元深層学習法では、3次元空間的情報を効果的に捉えることができない。
我々は2次元畳み込みニューラルネットワーク(CNN)に3次元空間および解剖コンテキストを組み込む解剖コンテキストネットワーク(ACEnet)を開発した。
提案手法は,脳構造セグメンテーションにおける最先端の代替手法と比較して,有望な性能を実現する。
論文 参考訳(メタデータ) (2020-02-13T20:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。