論文の概要: Hierarchical Optimal Transport for Robust Multi-View Learning
- arxiv url: http://arxiv.org/abs/2006.03160v2
- Date: Mon, 8 Jun 2020 14:54:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 09:33:16.317947
- Title: Hierarchical Optimal Transport for Robust Multi-View Learning
- Title(参考訳): ロバスト多視点学習のための階層的最適輸送
- Authors: Dixin Luo, Hongteng Xu, Lawrence Carin
- Abstract要約: 2つの仮定は実際には疑わしいが、これは多視点学習の適用を制限する。
本稿では,これら2つの仮定への依存性を軽減するために,階層的最適輸送法を提案する。
HOT法は教師なし学習と半教師付き学習の両方に適用でき、実験結果から、合成タスクと実世界のタスクの両方で堅牢に動作することが示された。
- 参考スコア(独自算出の注目度): 97.21355697826345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traditional multi-view learning methods often rely on two assumptions: ($i$)
the samples in different views are well-aligned, and ($ii$) their
representations in latent space obey the same distribution. Unfortunately,
these two assumptions may be questionable in practice, which limits the
application of multi-view learning. In this work, we propose a hierarchical
optimal transport (HOT) method to mitigate the dependency on these two
assumptions. Given unaligned multi-view data, the HOT method penalizes the
sliced Wasserstein distance between the distributions of different views. These
sliced Wasserstein distances are used as the ground distance to calculate the
entropic optimal transport across different views, which explicitly indicates
the clustering structure of the views. The HOT method is applicable to both
unsupervised and semi-supervised learning, and experimental results show that
it performs robustly on both synthetic and real-world tasks.
- Abstract(参考訳): 伝統的な多視点学習法は、しばしば2つの仮定に依拠する: (i$) 異なるビューのサンプルは整列し、(ii$) 潜在空間におけるそれらの表現は同じ分布に従う。
残念なことに、この2つの仮定は実際には疑わしい場合があり、マルチビュー学習の適用が制限される。
本研究では,これら2つの仮定への依存性を軽減するために,階層的最適輸送法を提案する。
不整合多視点データにより、HOT法は異なるビューの分布間のスライスされたワッサーシュタイン距離をペナルティ化する。
これらのスライスされたワッサースタイン距離は、ビューのクラスタリング構造を明確に示す異なるビュー間のエントロピー最適移動を計算するために地上距離として使用される。
HOT法は教師なしと半教師付きの両方の学習に適用でき、実験結果から、合成と実の両方のタスクで堅牢に動作することが示されている。
関連論文リスト
- Propensity Score Alignment of Unpaired Multimodal Data [3.8373578956681555]
マルチモーダル表現学習技術は通常、共通の表現を学ぶためにペア化されたサンプルに依存する。
本稿では,マルチモーダル表現学習において,異なるモダリティにまたがるアンペア化サンプルの整列化という課題に対処するアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-02T02:36:21Z) - 360 Layout Estimation via Orthogonal Planes Disentanglement and Multi-view Geometric Consistency Perception [56.84921040837699]
既存のパノラマ配置推定ソリューションは、垂直圧縮されたシーケンスから部屋の境界を復元し、不正確な結果をもたらす傾向にある。
そこで本稿では,直交平面不整合ネットワーク(DOPNet)を提案し,あいまいな意味論を識別する。
また,水平深度と比表現に適した教師なし適応手法を提案する。
本手法は,単分子配置推定と多視点レイアウト推定の両タスクにおいて,他のSoTAモデルよりも優れる。
論文 参考訳(メタデータ) (2023-12-26T12:16:03Z) - Hierarchical Mutual Information Analysis: Towards Multi-view Clustering
in The Wild [9.380271109354474]
この研究は、データリカバリとアライメントを階層的に一貫した方法で融合し、異なるビュー間の相互情報を最大化するディープMVCフレームワークを提案する。
私たちの知る限りでは、これは欠落したデータ問題と不整合データ問題に異なる学習パラダイムで別々に対処する最初の試みになるかもしれません。
論文 参考訳(メタデータ) (2023-10-28T06:43:57Z) - ProbVLM: Probabilistic Adapter for Frozen Vision-Language Models [69.50316788263433]
本稿では,事前学習された視覚言語モデルの埋め込みに対する確率分布を推定する確率的アダプタProbVLMを提案する。
本稿では,検索タスクにおける不確実性埋め込みのキャリブレーションを定量化し,ProbVLMが他の手法よりも優れていることを示す。
本稿では,大規模な事前学習型潜伏拡散モデルを用いて,埋め込み分布を可視化する新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-01T18:16:06Z) - Linking data separation, visual separation, and classifier performance
using pseudo-labeling by contrastive learning [125.99533416395765]
最終分類器の性能は、潜在空間に存在するデータ分離と、射影に存在する視覚的分離に依存すると論じる。
本研究は,ヒト腸管寄生虫の5つの現実的課題の画像データセットを1%の教師付きサンプルで分類し,その結果を実証する。
論文 参考訳(メタデータ) (2023-02-06T10:01:38Z) - MORI-RAN: Multi-view Robust Representation Learning via Hybrid
Contrastive Fusion [4.36488705757229]
多視点表現学習は、クラスタリングや分類といった多くの多視点タスクに不可欠である。
ラベルのないデータから堅牢なビュー-共通表現を抽出するハイブリッドコントラスト融合アルゴリズムを提案する。
実験の結果,提案手法は実世界の4つのデータセットにおいて,12の競合的マルチビュー手法よりも優れていた。
論文 参考訳(メタデータ) (2022-08-26T09:58:37Z) - Variational Distillation for Multi-View Learning [104.17551354374821]
我々は,多視点表現学習における2つの重要な特徴を利用するために,様々な情報ボトルネックを設計する。
厳密な理論的保証の下で,本手法は,観察とセマンティックラベルの内在的相関の把握を可能にする。
論文 参考訳(メタデータ) (2022-06-20T03:09:46Z) - Consistency Regularization for Deep Face Anti-Spoofing [69.70647782777051]
顔認証システムでは、顔認証(FAS)が重要な役割を担っている。
このエキサイティングな観察によって、異なる視点の特徴整合性を促進することが、FASモデルを促進するための有望な方法かもしれないと推測する。
FASにおけるEPCR(Embeddding-level and Prediction-level Consistency Regularization)とEPCR(Embeddding-level Consistency Regularization)を併用した。
論文 参考訳(メタデータ) (2021-11-24T08:03:48Z) - Orthogonal Multi-view Analysis by Successive Approximations via
Eigenvectors [7.870955752916424]
このフレームワークは、複数のビューに相関関係、教師付き識別能力、距離保存を統合する。
特殊ケースとして既存のモデルがいくつか含まれているだけでなく、新しいモデルにもインスピレーションを与えている。
多視点識別分析と多視点多ラベル分類のための実世界のデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2020-10-04T17:16:15Z) - CO-Optimal Transport [19.267807479856575]
最適輸送(OT)は、2つの分布の対応関係を見つけ、類似性を測定するための強力なツールである。
我々は,CO-Optimal Transport のための COOT という新しいOT 問題を提案し,サンプルと特徴の2つのトランスポートマップを同時に最適化する。
ヘテロジニアス領域適応とコクラスタリング/データ要約における2つの機械学習アプリケーションを用いて、その汎用性を実証する。
論文 参考訳(メタデータ) (2020-02-10T13:33:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。