論文の概要: Uncertainty-Aware Multi-View Representation Learning
- arxiv url: http://arxiv.org/abs/2201.05776v1
- Date: Sat, 15 Jan 2022 07:16:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 15:54:46.807379
- Title: Uncertainty-Aware Multi-View Representation Learning
- Title(参考訳): 不確実性を考慮したマルチビュー表現学習
- Authors: Yu Geng, Zongbo Han, Changqing Zhang, Qinghua Hu
- Abstract要約: 動的不確実性認識ネットワーク(DUA-Nets)と呼ばれる新しい教師なし多視点学習手法を考案する。
生成視点から推定されるデータの不確実性により、複数の視点からの固有情報が統合され、ノイズのない表現が得られる。
本モデルでは, 広範囲な実験において優れた性能を示し, ノイズの多いデータに対するロバスト性を示す。
- 参考スコア(独自算出の注目度): 53.06828186507994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning from different data views by exploring the underlying complementary
information among them can endow the representation with stronger expressive
ability. However, high-dimensional features tend to contain noise, and
furthermore, the quality of data usually varies for different samples (even for
different views), i.e., one view may be informative for one sample but not the
case for another. Therefore, it is quite challenging to integrate multi-view
noisy data under unsupervised setting. Traditional multi-view methods either
simply treat each view with equal importance or tune the weights of different
views to fixed values, which are insufficient to capture the dynamic noise in
multi-view data. In this work, we devise a novel unsupervised multi-view
learning approach, termed as Dynamic Uncertainty-Aware Networks (DUA-Nets).
Guided by the uncertainty of data estimated from the generation perspective,
intrinsic information from multiple views is integrated to obtain noise-free
representations. Under the help of uncertainty, DUA-Nets weigh each view of
individual sample according to data quality so that the high-quality samples
(or views) can be fully exploited while the effects from the noisy samples (or
views) will be alleviated. Our model achieves superior performance in extensive
experiments and shows the robustness to noisy data.
- Abstract(参考訳): それらの間の相補的な情報を探索することで、異なるデータビューから学ぶことは、表現力の強い表現を与えることができる。
しかし、高次元の特徴はノイズを含む傾向があり、さらに、データの品質は(異なるビューであっても)異なるサンプルに対して異なり、あるビューは1つのサンプルに対して有益であるが、別のサンプルの場合はそうではないかもしれない。
したがって、マルチビューノイズデータを教師なし設定で統合することは極めて困難である。
従来のマルチビュー法は、各ビューを同じ重要性で扱うか、異なるビューの重みを固定値に調整するかのどちらかであり、マルチビューデータの動的ノイズを捉えるには不十分である。
本研究では,動的不確実性認識ネットワーク(DUA-Nets)と呼ばれる,教師なしのマルチビュー学習手法を提案する。
生成視点から推定されるデータの不確実性により、複数の視点からの固有情報が統合され、ノイズのない表現が得られる。
不確実性の助けを借りて、DUA-Netはデータ品質に応じて個々のサンプルのビューを計測し、高品質なサンプル(またはビュー)をフル活用し、ノイズの多いサンプル(またはビュー)の効果を緩和する。
本モデルは広範な実験において優れた性能を達成し,ノイズデータに対するロバスト性を示す。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Dual-View Data Hallucination with Semantic Relation Guidance for Few-Shot Image Recognition [49.26065739704278]
本稿では、意味的関係を利用して、画像認識のための二重視点データ幻覚を導出するフレームワークを提案する。
インスタンスビューデータ幻覚モジュールは、新規クラスの各サンプルを幻覚して新しいデータを生成する。
プロトタイプビューデータ幻覚モジュールは、意味認識尺度を利用して、新しいクラスのプロトタイプを推定する。
論文 参考訳(メタデータ) (2024-01-13T12:32:29Z) - VDC: Versatile Data Cleanser based on Visual-Linguistic Inconsistency by Multimodal Large Language Models [46.72546879204724]
現実の世界では、データセットには、バックドア攻撃による毒サンプル、クラウドソーシングにおけるノイズの多いラベル、さらにはそれらのハイブリッドなど、汚れたサンプルが含まれている。
既存の検出器は、他のドメインの汚れたサンプルを扱う場合、しばしば一般化が弱くなるような、有毒なサンプルやノイズのあるラベルを検出することのみに焦点を当てている。
マルチモーダル大規模言語モデル(MLLM)の超越した機能を利用した多目的データクリーニング(VDC)を提案する。
論文 参考訳(メタデータ) (2023-09-28T07:37:18Z) - Learning Noise-Robust Joint Representation for Multimodal Emotion Recognition under Incomplete Data Scenarios [23.43319138048058]
実践シナリオにおけるマルチモーダル感情認識(MER)は、欠落したデータや不完全なデータの存在によって著しく困難である。
従来の手法では、データを捨てたり、データセグメントをゼロベクトルで置換することで、これらの不完全性を近似することが多い。
本稿では,雑音データから頑健なマルチモーダル関節表現を効果的に学習する新しいノイズローバストMERモデルを提案する。
論文 参考訳(メタデータ) (2023-09-21T10:49:02Z) - Investigating and Mitigating the Side Effects of Noisy Views for Self-Supervised Clustering Algorithms in Practical Multi-View Scenarios [35.32285779434823]
マルチビュークラスタリング(MVC)は,マルチビューデータのカテゴリ構造を自己管理的に探索することを目的としている。
ノイズの多いビューは、実際のマルチビューシナリオでビューがノイズの多いときに、深刻な縮退する可能性がある。
この問題に対処するために理論的に基礎をおくディープMVC法(別名MVCAN)を提案する。
論文 参考訳(メタデータ) (2023-03-30T09:22:17Z) - Credible Remote Sensing Scene Classification Using Evidential Fusion on
Aerial-Ground Dual-view Images [6.817740582240199]
マルチビュー(マルチソース、マルチモーダル、マルチパースペクティブなど)データはリモートセンシングタスクで頻繁に使用される。
データ品質の問題はさらに明確になり、マルチビューデータの潜在的なメリットが制限される。
深層学習は空中二視点リモートセンシングシーン分類の課題に導入される。
論文 参考訳(メタデータ) (2023-01-02T12:27:55Z) - Reliable Shot Identification for Complex Event Detection via
Visual-Semantic Embedding [72.9370352430965]
本稿では,映像中の事象検出のための視覚的意味的誘導損失法を提案する。
カリキュラム学習に動機付け,高い信頼性の事例で分類器の訓練を開始するために,負の弾性正規化項を導入する。
提案する非ネット正規化問題の解法として,代替最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-10-12T11:46:56Z) - Deep Partial Multi-View Learning [94.39367390062831]
クロスパーシャル・マルチビュー・ネットワーク(CPM-Nets)と呼ばれる新しいフレームワークを提案する。
我々はまず、多視点表現に対する完全性と汎用性の形式的な定義を提供する。
そして、理論的に学習された潜在表現の多元性を証明する。
論文 参考訳(メタデータ) (2020-11-12T02:29:29Z) - Fully Unsupervised Diversity Denoising with Convolutional Variational
Autoencoders [81.30960319178725]
完全畳み込み変分オートエンコーダ(VAE)に基づく復調手法であるDivNoisingを提案する。
まず, 撮像ノイズモデルをデコーダに明示的に組み込むことにより, 教師なしの雑音発生問題をVAEフレームワーク内に定式化する手法を提案する。
このようなノイズモデルは、ノイズの多いデータから測定したり、ブートストラップしたり、トレーニング中に共同学習したりすることが可能である。
論文 参考訳(メタデータ) (2020-06-10T21:28:13Z) - Noise Estimation Using Density Estimation for Self-Supervised Multimodal
Learning [10.151012770913624]
マルチモーダルデータに対するノイズ推定は,マルチモーダル密度推定タスクに還元可能であることを示す。
我々は,我々のノイズ推定を広範に統合し,最先端の性能に匹敵する結果が得られることを実証する。
論文 参考訳(メタデータ) (2020-03-06T13:25:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。