論文の概要: Disentangled Representation Learning through Geometry Preservation with the Gromov-Monge Gap
- arxiv url: http://arxiv.org/abs/2407.07829v1
- Date: Wed, 10 Jul 2024 16:51:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 15:43:17.780686
- Title: Disentangled Representation Learning through Geometry Preservation with the Gromov-Monge Gap
- Title(参考訳): Gromov-Monge Gapを用いた幾何保存による遠方表現学習
- Authors: Théo Uscidda, Luca Eyring, Karsten Roth, Fabian Theis, Zeynep Akata, Marco Cuturi,
- Abstract要約: 不整合表現を教師なしで学習することは、機械学習における根本的な課題である。
本稿では,2次最適輸送に基づく不整合表現学習の新たな視点を提案する。
また, 幾何保存は, 標準的な再構成目的を伴わずとも, 教師なしの絡み合いを助長できることを示す。
- 参考スコア(独自算出の注目度): 65.73194652234848
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning disentangled representations in an unsupervised manner is a fundamental challenge in machine learning. Solving it may unlock other problems, such as generalization, interpretability, or fairness. While remarkably difficult to solve in general, recent works have shown that disentanglement is provably achievable under additional assumptions that can leverage geometrical constraints, such as local isometry. To use these insights, we propose a novel perspective on disentangled representation learning built on quadratic optimal transport. Specifically, we formulate the problem in the Gromov-Monge setting, which seeks isometric mappings between distributions supported on different spaces. We propose the Gromov-Monge-Gap (GMG), a regularizer that quantifies the geometry-preservation of an arbitrary push-forward map between two distributions supported on different spaces. We demonstrate the effectiveness of GMG regularization for disentanglement on four standard benchmarks. Moreover, we show that geometry preservation can even encourage unsupervised disentanglement without the standard reconstruction objective - making the underlying model decoder-free, and promising a more practically viable and scalable perspective on unsupervised disentanglement.
- Abstract(参考訳): 不整合表現を教師なしで学習することは、機械学習における根本的な課題である。
これを解決することで、一般化、解釈可能性、公平性といった他の問題を解き放つことができる。
一般に解くのは非常に難しいが、最近の研究は、局所等長法のような幾何学的制約を活用できる追加の仮定の下で、解離は証明可能であることを示した。
そこで本研究では,2次最適輸送に基づく非交叉表現学習の新たな視点を提案する。
具体的には、異なる空間で支持される分布間の等尺写像を求めるGromov-Monge設定の問題を定式化する。
本稿では,Gromov-Monge-Gap (GMG)を提案する。これは,異なる空間上で支持される2つの分布間の任意のプッシュフォワード写像の幾何保存を定量化する正規化器である。
4つの標準ベンチマークにおいて, GMG正則化の有効性を示す。
さらに, 幾何保存は, 標準的な再構成目的を使わずに非教師付き非教師付き非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非管理者型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師型非教師
関連論文リスト
- Geometrically Aligned Transfer Encoder for Inductive Transfer in
Regression Tasks [5.038936775643437]
微分幾何学に基づく新しい移動法,すなわち幾何学的配向変換(GATE)を提案する。
すべての任意の点が重なり合う領域の局所平坦な座標に写像されることを保証するために、タスクのペア間の適切な微分同相性を見つけ、ソースからターゲットデータへの知識の伝達を可能にする。
GATEは従来の手法より優れ、様々な分子グラフデータセットの潜伏空間と外挿領域の両方で安定した振る舞いを示す。
論文 参考訳(メタデータ) (2023-10-10T07:11:25Z) - Joint graph learning from Gaussian observations in the presence of
hidden nodes [26.133725549667734]
本稿では,隠れ変数の存在を考慮した共同グラフ学習法を提案する。
従来の考察から得られた構造を利用して凸最適化問題を提案する。
提案したアルゴリズムを異なるベースラインで比較し、合成グラフと実世界のグラフ上での性能を評価する。
論文 参考訳(メタデータ) (2022-12-04T13:03:41Z) - Unveiling the Sampling Density in Non-Uniform Geometric Graphs [69.93864101024639]
グラフを幾何学グラフとみなす: ノードは基礎となる計量空間からランダムにサンプリングされ、その距離が指定された近傍半径以下であれば任意のノードが接続される。
ソーシャルネットワークでは、コミュニティは密集したサンプル領域としてモデル化でき、ハブはより大きな近傍半径を持つノードとしてモデル化できる。
我々は,未知のサンプリング密度を自己監督的に推定する手法を開発した。
論文 参考訳(メタデータ) (2022-10-15T08:01:08Z) - Geometry Contrastive Learning on Heterogeneous Graphs [50.58523799455101]
本稿では,幾何学コントラスト学習(Geometry Contrastive Learning, GCL)と呼ばれる,新しい自己指導型学習手法を提案する。
GCLはユークリッドと双曲的な視点からヘテロジニアスグラフを同時に見ることができ、リッチな意味論と複雑な構造をモデル化する能力の強い融合を目指している。
4つのベンチマークデータセットの大規模な実験は、提案手法が強いベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-25T03:54:53Z) - Semi-supervised Dense Keypoints Using Unlabeled Multiview Images [22.449168666514677]
本稿では,ラベルのないマルチビュー画像を用いて高密度なキーポイント検出器を学習するための,エンド・ツー・エンドの半教師付きフレームワークを提案する。
鍵となる課題は、複数のビューで密接なキーポイント間の正確な対応を見つけることである。
2つの望ましい性質を符号化する新しい確率的極性制約を導出する。
論文 参考訳(メタデータ) (2021-09-20T04:57:57Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Spatial Pyramid Based Graph Reasoning for Semantic Segmentation [67.47159595239798]
セマンティックセグメンテーションタスクにグラフ畳み込みを適用し、改良されたラプラシアンを提案する。
グラフ推論は、空間ピラミッドとして構成された元の特徴空間で直接実行される。
計算とメモリのオーバーヘッドの利点で同等のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-03-23T12:28:07Z) - Learning Flat Latent Manifolds with VAEs [16.725880610265378]
本稿では、ユークリッド計量がデータポイント間の類似性のプロキシとなる変分自動エンコーダのフレームワークの拡張を提案する。
我々は、変分オートエンコーダで一般的に使用されるコンパクトな以前のものを、最近発表されたより表現力のある階層型に置き換える。
提案手法は,ビデオ追跡ベンチマークを含む,さまざまなデータセットを用いて評価する。
論文 参考訳(メタデータ) (2020-02-12T09:54:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。