論文の概要: Deep Co-Attention Network for Multi-View Subspace Learning
- arxiv url: http://arxiv.org/abs/2102.07751v1
- Date: Mon, 15 Feb 2021 18:46:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:32:53.153386
- Title: Deep Co-Attention Network for Multi-View Subspace Learning
- Title(参考訳): マルチビューサブスペース学習のためのDeep Co-Attention Network
- Authors: Lecheng Zheng, Yu Cheng, Hongxia Yang, Nan Cao and Jingrui He
- Abstract要約: マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
- 参考スコア(独自算出の注目度): 73.3450258002607
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world applications involve data from multiple modalities and thus
exhibit the view heterogeneity. For example, user modeling on social media
might leverage both the topology of the underlying social network and the
content of the users' posts; in the medical domain, multiple views could be
X-ray images taken at different poses. To date, various techniques have been
proposed to achieve promising results, such as canonical correlation analysis
based methods, etc. In the meanwhile, it is critical for decision-makers to be
able to understand the prediction results from these methods. For example,
given the diagnostic result that a model provided based on the X-ray images of
a patient at different poses, the doctor needs to know why the model made such
a prediction. However, state-of-the-art techniques usually suffer from the
inability to utilize the complementary information of each view and to explain
the predictions in an interpretable manner.
To address these issues, in this paper, we propose a deep co-attention
network for multi-view subspace learning, which aims to extract both the common
information and the complementary information in an adversarial setting and
provide robust interpretations behind the prediction to the end-users via the
co-attention mechanism. In particular, it uses a novel cross reconstruction
loss and leverages the label information to guide the construction of the
latent representation by incorporating the classifier into our model. This
improves the quality of latent representation and accelerates the convergence
speed. Finally, we develop an efficient iterative algorithm to find the optimal
encoders and discriminator, which are evaluated extensively on synthetic and
real-world data sets. We also conduct a case study to demonstrate how the
proposed method robustly interprets the predictions on an image data set.
- Abstract(参考訳): 多くの実世界のアプリケーションは、複数のモダリティからのデータを含み、ビューの不均一性を示す。
たとえば、ソーシャルメディア上のユーザーモデリングは、基礎となるソーシャルネットワークのトポロジとユーザーの投稿の内容の両方を活用する可能性があります。医療領域では、複数のビューは、異なるポーズで撮影されたX線画像である可能性があります。
これまで, 正準相関解析に基づく手法など, 期待できる結果を得るために様々な手法が提案されてきた。
一方,意思決定者は,これらの手法による予測結果を理解することが重要である。
例えば、異なるポーズの患者のX線画像に基づくモデルを提供する診断結果を考えると、医師はモデルがなぜそのような予測をしたのかを知る必要がある。
しかし、最先端技術は、通常、それぞれのビューの補完的な情報を利用し、解釈可能な方法で予測を説明することができない。
このような問題に対処するため,本稿では,共通情報と相補的情報の両方を対角的に抽出する多視点サブスペース学習のためのディープ・コアテンション・ネットワークを提案し,コアテンション・メカニズムを通じてエンドユーザに予測の背後にあるロバストな解釈を提供する。
特に,新しいクロスレコンストラクション損失を用い,ラベル情報を利用して,モデルに分類器を組み込むことで潜在表現の構築を導く。
これにより潜在表現の品質が向上し、収束速度が向上する。
最後に、最適なエンコーダと判別器を見つけるための効率的な反復アルゴリズムを開発し、合成および実世界のデータセット上で広く評価する。
また,提案手法が画像データセットの予測をいかに強固に解釈するかを示すケーススタディも実施する。
関連論文リスト
- Multimodal Explainability via Latent Shift applied to COVID-19
stratification [1.1129469448121927]
本稿では,モダリティの再構築とサンプル分類を共同で学習する,設計による説明が可能な深いアーキテクチャを提案する。
AIforCOVIDデータセットを使用して、COVID-19パンデミックの文脈でのアプローチを検証する。
論文 参考訳(メタデータ) (2022-12-28T20:07:43Z) - Utilising Bayesian Networks to combine multimodal data and expert
opinion for the robust prediction of depression and its symptoms [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - Ultrasound Signal Processing: From Models to Deep Learning [83.00618699971432]
医用超音波画像は、信頼性と解釈可能な画像再構成を提供するために、高品質な信号処理アルゴリズムに大きく依存している。
手作りの再現法は、しばしば基礎となる測定モデルの近似に基づいており、実際は有用であるが、画質の面では遅れている。
ディープラーニングベースの手法が人気を集め、データ駆動方式で最適化されている。
論文 参考訳(メタデータ) (2022-04-09T13:04:36Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - TorchEsegeta: Framework for Interpretability and Explainability of
Image-based Deep Learning Models [0.0]
臨床医はしばしば自動画像処理アプローチ、特にディープラーニングに基づく手法の適用に懐疑的である。
本稿では,アルゴリズムの決定に最も影響を及ぼす解剖学的領域を記述することによって,ディープラーニングアルゴリズムの結果の解釈と説明を支援するアプローチを提案する。
ディープラーニングモデルに様々な解釈可能性および説明可能性技術を適用するための統合フレームワークであるTorchEsegetaを提案する。
論文 参考訳(メタデータ) (2021-10-16T01:00:15Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z) - Proactive Pseudo-Intervention: Causally Informed Contrastive Learning
For Interpretable Vision Models [103.64435911083432]
PPI(Proactive Pseudo-Intervention)と呼ばれる新しい対照的な学習戦略を提案する。
PPIは、因果関係のない画像の特徴を保護するために積極的に介入する。
また,重要な画像画素を識別するための,因果的に通知された新たなサリエンスマッピングモジュールを考案し,モデル解釈の容易性を示す。
論文 参考訳(メタデータ) (2020-12-06T20:30:26Z) - Explaining Predictions of Deep Neural Classifier via Activation Analysis [0.11470070927586014]
本稿では,畳み込みニューラルネットワーク(CNN)に基づく深層学習システムを実行する人間専門家に対して,意思決定プロセスの説明と支援を行う新しいアプローチを提案する。
以上の結果から,本手法は既存のアトラスから最も類似した予測を識別できる別個の予測戦略を検出することができることが示された。
論文 参考訳(メタデータ) (2020-12-03T20:36:19Z) - Medical Image Harmonization Using Deep Learning Based Canonical Mapping:
Toward Robust and Generalizable Learning in Imaging [4.396671464565882]
多様な取得条件のデータを共通参照領域に"調和"する新しいパラダイムを提案する。
我々は,MRIによる脳年齢予測と統合失調症の分類という,2つの問題に対して本手法を検証した。
論文 参考訳(メタデータ) (2020-10-11T22:01:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。