論文の概要: Object-centric architectures enable efficient causal representation
learning
- arxiv url: http://arxiv.org/abs/2310.19054v1
- Date: Sun, 29 Oct 2023 16:01:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 14:35:09.168844
- Title: Object-centric architectures enable efficient causal representation
learning
- Title(参考訳): 効率的な因果表現学習を可能にするオブジェクト指向アーキテクチャ
- Authors: Amin Mansouri, Jason Hartford, Yan Zhang, Yoshua Bengio
- Abstract要約: 観測対象が複数の物体である場合, 生成関数はもはや注入的ではなく, 実際に乱れは生じないことを示す。
スパース摂動からの弱い監督を利用して各オブジェクトのプロパティを乱すオブジェクト中心アーキテクチャを開発する。
このアプローチはユークリッド空間にエンコードする同等のアプローチよりもはるかに少ない摂動を必要とするという意味で、よりデータ効率が高い。
- 参考スコア(独自算出の注目度): 51.6196391784561
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Causal representation learning has showed a variety of settings in which we
can disentangle latent variables with identifiability guarantees (up to some
reasonable equivalence class). Common to all of these approaches is the
assumption that (1) the latent variables are represented as $d$-dimensional
vectors, and (2) that the observations are the output of some injective
generative function of these latent variables. While these assumptions appear
benign, we show that when the observations are of multiple objects, the
generative function is no longer injective and disentanglement fails in
practice. We can address this failure by combining recent developments in
object-centric learning and causal representation learning. By modifying the
Slot Attention architecture arXiv:2006.15055, we develop an object-centric
architecture that leverages weak supervision from sparse perturbations to
disentangle each object's properties. This approach is more data-efficient in
the sense that it requires significantly fewer perturbations than a comparable
approach that encodes to a Euclidean space and we show that this approach
successfully disentangles the properties of a set of objects in a series of
simple image-based disentanglement experiments.
- Abstract(参考訳): 因果表現学習(causal representation learning)は、(妥当な等価クラスまで)特定可能な保証によって潜在変数を分離できるさまざまな設定を示してきた。
これらのアプローチの共通点は、(1)潜伏変数が$d$次元ベクトルとして表現され、(2)観測がこれらの潜伏変数の射影関数の出力である、という仮定である。
これらの仮定は良性に見えるが、観測対象が複数の物体である場合、生成関数はもはや注入されなくなり、実際には乱れは失敗することを示す。
対象中心学習と因果表現学習の最近の発展を組み合わせることで、この失敗に対処することができる。
スロットアテンションアーキテクチャarxiv:2006.15055を変更することで、スパース摂動から弱い監督を生かして各オブジェクトの特性を乱すオブジェクト指向アーキテクチャを開発する。
このアプローチはユークリッド空間にエンコードする同等のアプローチよりも摂動をはるかに少なくするという意味では、よりデータ効率が高い。
関連論文リスト
- A Sparsity Principle for Partially Observable Causal Representation Learning [28.25303444099773]
因果表現学習は、知覚データから高レベルの因果変数を特定することを目的としている。
我々は、インスタンスに依存した部分的可観測パターンを持つデータセットから、未確認の観測から学ぶことに集中する。
提案手法は,推定された表現の間隔を小さくすることで,基礎となる因果変数を推定する2つの手法である。
論文 参考訳(メタデータ) (2024-03-13T08:40:49Z) - Explicitly Disentangled Representations in Object-Centric Learning [0.0]
本稿では, オブジェクト中心のモデルを, 密接な形状やテクスチャ成分に偏在させる新しいアーキテクチャを提案する。
特に, オブジェクト中心のモデルを, 密接な形状やテクスチャ成分に偏在させる新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-01-18T17:22:11Z) - Cycle Consistency Driven Object Discovery [75.60399804639403]
本研究では,シーンの各オブジェクトが異なるスロットに関連付けられなければならない制約を明示的に最適化する手法を提案する。
これらの一貫性目標を既存のスロットベースのオブジェクト中心手法に統合することにより、オブジェクト発見性能を大幅に改善することを示す。
提案手法は,オブジェクト発見を改善するだけでなく,下流タスクのよりリッチな機能も提供することを示唆している。
論文 参考訳(メタデータ) (2023-06-03T21:49:06Z) - Generative Models of Huge Objects [6.7086472013021305]
単一対象からの識別不可能性は、学習理論における生成モデルとグラフ理論における正規性補題の研究によって動機付けられる。
本研究では,いくつかの自然環境において,大きな識別不可能な物体に対する学習アルゴリズムを提案する。
結果は、学習理論、複雑性理論、暗号、ゲーム理論など、さまざまな分野の概念と技法に依存している。
論文 参考訳(メタデータ) (2023-02-24T18:58:11Z) - Object Representations as Fixed Points: Training Iterative Refinement
Algorithms with Implicit Differentiation [88.14365009076907]
反復的洗練は表現学習に有用なパラダイムである。
トレーニングの安定性とトラクタビリティを向上させる暗黙の差別化アプローチを開発する。
論文 参考訳(メタデータ) (2022-07-02T10:00:35Z) - Invariant Causal Mechanisms through Distribution Matching [86.07327840293894]
本研究では、因果的視点と不変表現を学習するための新しいアルゴリズムを提供する。
実験により,このアルゴリズムは様々なタスク群でうまく動作し,特にドメインの一般化における最先端のパフォーマンスを観察する。
論文 参考訳(メタデータ) (2022-06-23T12:06:54Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Generalization and Robustness Implications in Object-Centric Learning [23.021791024676986]
本稿では,5つの共通オブジェクトデータセット上で,最先端の教師なしモデルを訓練する。
実験結果から,ダウンストリームタスクに一般的に有用なオブジェクト中心表現が得られた。
論文 参考訳(メタデータ) (2021-07-01T17:51:11Z) - On Equivariant and Invariant Learning of Object Landmark Representations [36.214069685880986]
実例識別学習と空間識別学習を組み合わせた,シンプルで効果的な手法を開発した。
深層ネットワークが幾何学的および測光的変換に不変であるように訓練されると、その中間層から表現が出現し、物体のランドマークを高い精度で予測できることが示される。
論文 参考訳(メタデータ) (2020-06-26T04:06:56Z) - A Critical View of the Structural Causal Model [89.43277111586258]
相互作用を全く考慮せずに原因と効果を識別できることが示される。
本稿では,因果モデルの絡み合った構造を模倣する新たな逆行訓練法を提案する。
我々の多次元手法は, 合成および実世界の両方のデータセットにおいて, 文献的手法よりも優れている。
論文 参考訳(メタデータ) (2020-02-23T22:52:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。