論文の概要: Reconstruction Bottlenecks in Object-Centric Generative Models
- arxiv url: http://arxiv.org/abs/2007.06245v2
- Date: Tue, 24 Nov 2020 13:52:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 22:56:44.057029
- Title: Reconstruction Bottlenecks in Object-Centric Generative Models
- Title(参考訳): オブジェクト中心生成モデルにおける再構成ボトルネック
- Authors: Martin Engelcke, Oiwi Parker Jones, Ingmar Posner
- Abstract要約: 近年のVAEモデルであるgenESISにおけるシーン分解における「再構成ボトルネック」の役割について検討する。
このようなボトルネックが再構成やセグメンテーションの質を決定づけ、モデル行動に重大な影響を及ぼすことを示す。
- 参考スコア(独自算出の注目度): 24.430685026986524
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A range of methods with suitable inductive biases exist to learn
interpretable object-centric representations of images without supervision.
However, these are largely restricted to visually simple images; robust object
discovery in real-world sensory datasets remains elusive. To increase the
understanding of such inductive biases, we empirically investigate the role of
"reconstruction bottlenecks" for scene decomposition in GENESIS, a recent
VAE-based model. We show such bottlenecks determine reconstruction and
segmentation quality and critically influence model behaviour.
- Abstract(参考訳): 画像の解釈可能なオブジェクト中心表現を監督なしで学習するために、適切な帰納的バイアスを持つ方法が存在する。
しかし、これらは主に視覚的に単純な画像に限られており、現実世界の感覚データセットにおける堅牢な物体発見はいまだに解明されていない。
このような帰納バイアスの理解を深めるために,最近のvaeモデルであるgenesisにおけるシーン分解における"再構築ボトルネック"の役割を実証的に検討する。
このようなボトルネックが再構成やセグメンテーションの質を決定づけ、モデル行動に重大な影響を及ぼすことを示す。
関連論文リスト
- Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Unveiling the Ambiguity in Neural Inverse Rendering: A Parameter Compensation Analysis [36.353019226575576]
逆レンダリングは、マルチビュー画像のみからオブジェクトのシーン特性を再構築することを目的としている。
本稿では,最先端のニューラルネットワーク逆レンダリング手法であるNeural Microfacet Fields (NMF) を用いて,そのあいまいさを表現した。
論文 参考訳(メタデータ) (2024-04-19T11:56:29Z) - Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement [58.9768112704998]
遠方表現学習は、観測データ内の本質的要因を抽出する試みである。
我々は新しい視点と枠組みを導入し、クロスアテンションを持つ拡散モデルが強力な帰納バイアスとなることを示す。
これは、複雑な設計を必要とせず、クロスアテンションを持つ拡散モデルの強力な解離能力を明らかにする最初の研究である。
論文 参考訳(メタデータ) (2024-02-15T05:07:54Z) - Benchmarking and Analysis of Unsupervised Object Segmentation from
Real-world Single Images [6.848868644753519]
本研究では,既存の教師なしモデルが現実世界の画像に挑戦する上での有効性について検討する。
既存の教師なしモデルでは、実世界の画像にジェネリックオブジェクトを分割できないことがわかった。
我々の研究結果は、将来の研究はネットワーク設計におけるより明示的なオブジェクト指向バイアスを利用するべきであることを示唆している。
論文 参考訳(メタデータ) (2023-12-08T10:25:59Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Provably Learning Object-Centric Representations [25.152680199034215]
我々は、オブジェクト中心の表現がいつ、監督なしに確実に学習できるかを分析する。
そこで本研究では, 基本構造オブジェクト表現が可逆的, 構成的推論モデルによって識別可能であることを証明した。
我々は、既存の対象中心モデルに対して、我々の理論が予測力を持つ証拠を提供する。
論文 参考訳(メタデータ) (2023-05-23T16:44:49Z) - Robust and Controllable Object-Centric Learning through Energy-based
Models [95.68748828339059]
我々の研究は概念的にシンプルで一般的なアプローチであり、エネルギーベースモデルを通してオブジェクト中心の表現を学習する。
既存のアーキテクチャに容易に統合でき、高品質なオブジェクト中心表現を効果的に抽出できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:11:15Z) - Promising or Elusive? Unsupervised Object Segmentation from Real-world
Single Images [4.709764624933227]
本研究では,既存の教師なしモデルが現実世界の画像に挑戦する上での有効性について検討する。
既存の教師なしモデルは、実世界の画像にジェネリックオブジェクトを分割するのに失敗している。
我々の研究結果は、将来の研究はネットワーク設計におけるより明示的なオブジェクト指向バイアスを利用するべきであることを示唆している。
論文 参考訳(メタデータ) (2022-10-05T15:22:54Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Inductive Biases for Object-Centric Representations of Complex Textures [13.045904773946367]
我々はニューラルスタイルの転送を使用して、オブジェクトが深いテクスチャを持つようなデータセットを生成する。
モデルがトレーニング対象における形状と外観の重要性を効果的にバランスさせると、オブジェクトの分離性が向上し、より有用なオブジェクト表現を学習できることがわかった。
論文 参考訳(メタデータ) (2022-04-18T17:34:37Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。