論文の概要: Attention-based Dynamic Subspace Learners for Medical Image Analysis
- arxiv url: http://arxiv.org/abs/2206.09068v1
- Date: Sat, 18 Jun 2022 00:44:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-22 17:10:27.177583
- Title: Attention-based Dynamic Subspace Learners for Medical Image Analysis
- Title(参考訳): 医用画像解析のための注意に基づく動的サブスペース学習
- Authors: Sukesh Adiga V, Jose Dolz, Herve Lombaert
- Abstract要約: 学習類似性は、特にレコメンデーションシステムや画像中の解剖学的データの解釈を明らかにする際に重要な側面である。
既存のほとんどの手法は、単一のメートル法学習器を用いて画像集合上の埋め込み空間でそのような類似性を学ぶ。
本研究は,学習者の数を把握し,学習中に新たなサブスペース学習者を集約することで,複数の学習者を動的に活用することを提案する。
- 参考スコア(独自算出の注目度): 9.289524646688244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning similarity is a key aspect in medical image analysis, particularly
in recommendation systems or in uncovering the interpretation of anatomical
data in images. Most existing methods learn such similarities in the embedding
space over image sets using a single metric learner. Images, however, have a
variety of object attributes such as color, shape, or artifacts. Encoding such
attributes using a single metric learner is inadequate and may fail to
generalize. Instead, multiple learners could focus on separate aspects of these
attributes in subspaces of an overarching embedding. This, however, implies the
number of learners to be found empirically for each new dataset. This work,
Dynamic Subspace Learners, proposes to dynamically exploit multiple learners by
removing the need of knowing apriori the number of learners and aggregating new
subspace learners during training. Furthermore, the visual interpretability of
such subspace learning is enforced by integrating an attention module into our
method. This integrated attention mechanism provides a visual insight of
discriminative image features that contribute to the clustering of image sets
and a visual explanation of the embedding features. The benefits of our
attention-based dynamic subspace learners are evaluated in the application of
image clustering, image retrieval, and weakly supervised segmentation. Our
method achieves competitive results with the performances of multiple learners
baselines and significantly outperforms the classification network in terms of
clustering and retrieval scores on three different public benchmark datasets.
Moreover, our attention maps offer a proxy-labels, which improves the
segmentation accuracy up to 15% in Dice scores when compared to
state-of-the-art interpretation techniques.
- Abstract(参考訳): 学習の類似性は、医学画像解析において、特に推奨システムや画像における解剖データの解釈を明らかにする上で重要な側面である。
既存のほとんどの手法は、単一のメートル法学習器を用いて画像集合上の埋め込み空間でそのような類似性を学ぶ。
しかし画像には、色、形、アーティファクトなど、さまざまなオブジェクト属性がある。
そのような属性を単一のメトリック学習者でエンコーディングすることは不十分であり、一般化に失敗する可能性がある。
代わりに、複数の学習者は、包括的な埋め込みのサブスペースにおけるこれらの属性の別々の側面に集中できる。
しかしこれは、新しいデータセットごとに経験的に見つかる学習者の数を意味する。
この研究であるDynamic Subspace Learnersは、トレーニング中に学習者の数を知り、新しいサブスペース学習者を集約することで、複数の学習者を動的に活用することを提案する。
さらに,本手法に注意モジュールを組み込むことにより,サブスペース学習の視覚的解釈性が強化される。
この統合注意機構は、画像集合のクラスタリングに寄与する識別的画像特徴の視覚的な洞察と、埋め込み特徴の視覚的説明を提供する。
注意に基づく動的サブスペース学習者の利点は,画像クラスタリング,画像検索,弱教師付きセグメンテーションの適用において評価される。
提案手法は,複数の学習者のベースラインのパフォーマンスと競合する結果を得るとともに,3つの公開ベンチマークデータセットのクラスタリングと検索スコアにおいて,分類ネットワークを著しく上回っている。
さらにアテンションマップにはプロキシラベルが提供されており,最先端の解釈手法と比較して,diceスコアのセグメンテーション精度が最大15%向上する。
関連論文リスト
- Learning Transferable Pedestrian Representation from Multimodal
Information Supervision [174.5150760804929]
VAL-PATは、移動可能な表現を学習し、様々な歩行者分析タスクをマルチモーダル情報で強化する新しいフレームワークである。
まず、LUPerson-TAデータセットで事前トレーニングを行い、各画像にはテキストと属性アノテーションが含まれている。
次に、学習した表現を、人物のreID、人物属性認識、テキストベースの人物検索など、さまざまな下流タスクに転送する。
論文 参考訳(メタデータ) (2023-04-12T01:20:58Z) - Localized Region Contrast for Enhancing Self-Supervised Learning in
Medical Image Segmentation [27.82940072548603]
本稿では,地域コントラスト(LRC)を統合した新しいコントラスト学習フレームワークを提案する。
提案手法では,Felzenszwalbのアルゴリズムによるスーパーピクセルの同定と,新しいコントラッシブサンプリング損失を用いた局所コントラスト学習を行う。
論文 参考訳(メタデータ) (2023-04-06T22:43:13Z) - Self-Supervised Visual Representation Learning with Semantic Grouping [50.14703605659837]
我々は、未ラベルのシーン中心のデータから視覚表現を学習する問題に取り組む。
本研究では,データ駆動型セマンティックスロット,すなわちSlotConによる協調型セマンティックグルーピングと表現学習のためのコントラスト学習を提案する。
論文 参考訳(メタデータ) (2022-05-30T17:50:59Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Self-supervised Contrastive Learning for Cross-domain Hyperspectral
Image Representation [26.610588734000316]
本稿では,アノテートが本質的に困難であるハイパースペクトル画像に適した自己教師型学習フレームワークを提案する。
提案するフレームワークアーキテクチャは、クロスドメインCNNを利用して、異なるハイパースペクトル画像から表現を学習する。
実験結果は、スクラッチや他の移動学習法から学習したモデルに対して、提案した自己教師型表現の利点を示す。
論文 参考訳(メタデータ) (2022-02-08T16:16:45Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - Hierarchical Semantic Segmentation using Psychometric Learning [17.417302703539367]
我々は,心理測定テストに基づいて,専門家からセグメンテーションアノテーションを収集する手法を開発した。
本手法は, 心理測定試験, アクティブクエリ選択, クエリ強化, ディープメトリック学習モデルから構成される。
本稿では, 合成画像, 空中画像, 組織像について評価し, 提案手法の有用性を示す。
論文 参考訳(メタデータ) (2021-07-07T13:38:33Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z) - Distilling Localization for Self-Supervised Representation Learning [82.79808902674282]
コントラスト学習は教師なし表現学習に革命をもたらした。
現在のコントラストモデルでは、前景オブジェクトのローカライズには効果がない。
本稿では,背景変化を学習するためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2020-04-14T16:29:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。