論文の概要: Deep Co-Attention Network for Multi-View Subspace Learning
- arxiv url: http://arxiv.org/abs/2102.07751v1
- Date: Mon, 15 Feb 2021 18:46:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:32:53.153386
- Title: Deep Co-Attention Network for Multi-View Subspace Learning
- Title(参考訳): マルチビューサブスペース学習のためのDeep Co-Attention Network
- Authors: Lecheng Zheng, Yu Cheng, Hongxia Yang, Nan Cao and Jingrui He
- Abstract要約: マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
- 参考スコア(独自算出の注目度): 73.3450258002607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world applications involve data from multiple modalities and thus
exhibit the view heterogeneity. For example, user modeling on social media
might leverage both the topology of the underlying social network and the
content of the users' posts; in the medical domain, multiple views could be
X-ray images taken at different poses. To date, various techniques have been
proposed to achieve promising results, such as canonical correlation analysis
based methods, etc. In the meanwhile, it is critical for decision-makers to be
able to understand the prediction results from these methods. For example,
given the diagnostic result that a model provided based on the X-ray images of
a patient at different poses, the doctor needs to know why the model made such
a prediction. However, state-of-the-art techniques usually suffer from the
inability to utilize the complementary information of each view and to explain
the predictions in an interpretable manner.
To address these issues, in this paper, we propose a deep co-attention
network for multi-view subspace learning, which aims to extract both the common
information and the complementary information in an adversarial setting and
provide robust interpretations behind the prediction to the end-users via the
co-attention mechanism. In particular, it uses a novel cross reconstruction
loss and leverages the label information to guide the construction of the
latent representation by incorporating the classifier into our model. This
improves the quality of latent representation and accelerates the convergence
speed. Finally, we develop an efficient iterative algorithm to find the optimal
encoders and discriminator, which are evaluated extensively on synthetic and
real-world data sets. We also conduct a case study to demonstrate how the
proposed method robustly interprets the predictions on an image data set.
- Abstract(参考訳): 多くの実世界のアプリケーションは、複数のモダリティからのデータを含み、ビューの不均一性を示す。
たとえば、ソーシャルメディア上のユーザーモデリングは、基礎となるソーシャルネットワークのトポロジとユーザーの投稿の内容の両方を活用する可能性があります。医療領域では、複数のビューは、異なるポーズで撮影されたX線画像である可能性があります。
これまで, 正準相関解析に基づく手法など, 期待できる結果を得るために様々な手法が提案されてきた。
一方,意思決定者は,これらの手法による予測結果を理解することが重要である。
例えば、異なるポーズの患者のX線画像に基づくモデルを提供する診断結果を考えると、医師はモデルがなぜそのような予測をしたのかを知る必要がある。
しかし、最先端技術は、通常、それぞれのビューの補完的な情報を利用し、解釈可能な方法で予測を説明することができない。
このような問題に対処するため,本稿では,共通情報と相補的情報の両方を対角的に抽出する多視点サブスペース学習のためのディープ・コアテンション・ネットワークを提案し,コアテンション・メカニズムを通じてエンドユーザに予測の背後にあるロバストな解釈を提供する。
特に,新しいクロスレコンストラクション損失を用い,ラベル情報を利用して,モデルに分類器を組み込むことで潜在表現の構築を導く。
これにより潜在表現の品質が向上し、収束速度が向上する。
最後に、最適なエンコーダと判別器を見つけるための効率的な反復アルゴリズムを開発し、合成および実世界のデータセット上で広く評価する。
また,提案手法が画像データセットの予測をいかに強固に解釈するかを示すケーススタディも実施する。
関連論文リスト
- A Textbook Remedy for Domain Shifts: Knowledge Priors for Medical Image Analysis [48.84443450990355]
ディープネットワークは、医学的なスキャンに適用すると、例外のない状況で失敗することが多いため、自然画像の解析において広く成功している。
胸部X線や皮膚病変画像の文脈において、異なる病院から採取したデータや、性別、人種などの人口統計学的変数によって構築されたデータなど、ドメインシフトに対するモデル感度に焦点をあてる。
医学教育からインスピレーションを得て,自然言語で伝達される明示的な医学知識を基盤としたディープネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-23T17:55:02Z) - Robust and Interpretable Medical Image Classifiers via Concept
Bottleneck Models [49.95603725998561]
本稿では,自然言語の概念を用いた堅牢で解釈可能な医用画像分類器を構築するための新しいパラダイムを提案する。
具体的には、まず臨床概念をGPT-4から検索し、次に視覚言語モデルを用いて潜在画像の特徴を明示的な概念に変換する。
論文 参考訳(メタデータ) (2023-10-04T21:57:09Z) - Improving Explainability of Disentangled Representations using
Multipath-Attribution Mappings [12.145748796751619]
下流タスク予測に解釈不能な不整合表現を利用するフレームワークを提案する。
提案手法の有効性を,総合ベンチマークスイートと2つの医療データセットで実証する。
論文 参考訳(メタデータ) (2023-06-15T10:52:29Z) - Multimodal Explainability via Latent Shift applied to COVID-19 stratification [0.7831774233149619]
本稿では,モダリティの再構築とサンプル分類を共同で学習するディープアーキテクチャを提案する。
AIforCOVIDデータセットを使用して、COVID-19パンデミックの文脈でのアプローチを検証する。
論文 参考訳(メタデータ) (2022-12-28T20:07:43Z) - Ultrasound Signal Processing: From Models to Deep Learning [64.56774869055826]
医用超音波画像は、信頼性と解釈可能な画像再構成を提供するために、高品質な信号処理に大きく依存している。
データ駆動方式で最適化されたディープラーニングベースの手法が人気を集めている。
比較的新しいパラダイムは、データ駆動型ディープラーニングの活用とドメイン知識の活用という2つのパワーを組み合わせたものだ。
論文 参考訳(メタデータ) (2022-04-09T13:04:36Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Convolutional Motif Kernel Networks [1.104960878651584]
我々のモデルは、小さなデータセットでしっかりと学習でき、関連する医療予測タスクで最先端のパフォーマンスを達成できることを示す。
提案手法はDNAおよびタンパク質配列に利用することができる。
論文 参考訳(メタデータ) (2021-11-03T15:06:09Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Explaining Predictions of Deep Neural Classifier via Activation Analysis [0.11470070927586014]
本稿では,畳み込みニューラルネットワーク(CNN)に基づく深層学習システムを実行する人間専門家に対して,意思決定プロセスの説明と支援を行う新しいアプローチを提案する。
以上の結果から,本手法は既存のアトラスから最も類似した予測を識別できる別個の予測戦略を検出することができることが示された。
論文 参考訳(メタデータ) (2020-12-03T20:36:19Z) - Medical Image Harmonization Using Deep Learning Based Canonical Mapping:
Toward Robust and Generalizable Learning in Imaging [4.396671464565882]
多様な取得条件のデータを共通参照領域に"調和"する新しいパラダイムを提案する。
我々は,MRIによる脳年齢予測と統合失調症の分類という,2つの問題に対して本手法を検証した。
論文 参考訳(メタデータ) (2020-10-11T22:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。