論文の概要: GENESIS-V2: Inferring Unordered Object Representations without Iterative
Refinement
- arxiv url: http://arxiv.org/abs/2104.09958v1
- Date: Tue, 20 Apr 2021 14:59:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-21 13:54:42.276758
- Title: GENESIS-V2: Inferring Unordered Object Representations without Iterative
Refinement
- Title(参考訳): genESIS-V2: 反復的リファインメントのない未順序オブジェクト表現の推論
- Authors: Martin Engelcke, Oiwi Parker Jones, Ingmar Posner
- Abstract要約: 我々は、RNNや反復的精細化を使わずに、可変数のオブジェクト表現を推論できる新しいモデル GENESIS-V2 を開発した。
GENESIS-V2は、既存の合成データセット上で、監視されていない画像分割とオブジェクト中心のシーン生成の従来の方法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 26.151968529063762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in object-centric generative models (OCGMs) have culminated in the
development of a broad range of methods for unsupervised object segmentation
and interpretable object-centric scene generation. These methods, however, are
limited to simulated and real-world datasets with limited visual complexity.
Moreover, object representations are often inferred using RNNs which do not
scale well to large images or iterative refinement which avoids imposing an
unnatural ordering on objects in an image but requires the a priori
initialisation of a fixed number of object representations. In contrast to
established paradigms, this work proposes an embedding-based approach in which
embeddings of pixels are clustered in a differentiable fashion using a
stochastic, non-parametric stick-breaking process. Similar to iterative
refinement, this clustering procedure also leads to randomly ordered object
representations, but without the need of initialising a fixed number of
clusters a priori. This is used to develop a new model, GENESIS-V2, which can
infer a variable number of object representations without using RNNs or
iterative refinement. We show that GENESIS-V2 outperforms previous methods for
unsupervised image segmentation and object-centric scene generation on
established synthetic datasets as well as more complex real-world datasets.
- Abstract(参考訳): オブジェクト中心生成モデル(ocgms)の進歩は、教師なしオブジェクトセグメンテーションと解釈可能なオブジェクト中心シーン生成のための幅広い方法の開発で頂点に達した。
しかし、これらのメソッドは、視覚の複雑さが制限されたシミュレーションと実世界のデータセットに限定されている。
さらに、オブジェクト表現は、画像中のオブジェクトに不自然な順序を課すのを避けるが、固定数のオブジェクト表現の事前初期化を必要とする、大きな画像や反復的な改善にうまく対応しないRNNを用いて、しばしば推論される。
確立されたパラダイムとは対照的に,本研究では,確率的,非パラメトリックなスティックブレーキングプロセスを用いて,画素の埋め込みを異なる方法でクラスタ化する方法を提案する。
反復的洗練と同様に、このクラスタリング手順はランダムに順序付けられたオブジェクト表現をもたらすが、固定数のクラスタを事前に初期化する必要がない。
これは新しいモデル GENESIS-V2 の開発に使われ、RNN や反復的な洗練を使わずに、可変数のオブジェクト表現を推論できる。
genesis-v2は、確立された合成データセットやより複雑な実世界のデータセット上で、教師なし画像セグメンテーションやオブジェクト中心シーン生成の従来の手法を上回っている。
関連論文リスト
- Generalizable Single-view Object Pose Estimation by Two-side Generating and Matching [19.730504197461144]
本稿では,RGB画像のみを用いてオブジェクトのポーズを決定するために,新しい一般化可能なオブジェクトポーズ推定手法を提案する。
本手法は,オブジェクトの参照画像1枚で操作し,3次元オブジェクトモデルやオブジェクトの複数ビューの必要性を解消する。
論文 参考訳(メタデータ) (2024-11-24T14:31:50Z) - Segmenting objects with Bayesian fusion of active contour models and convnet priors [0.729597981661727]
本稿では,自然資源モニタリング(NRM)画像を対象とした新しい事例分割手法を提案する。
我々は、個々の物体の輪郭を学習する際に、形状、位置、位置の先行を組み込むベイズ最大値後部推論として問題を定式化する。
実験では、個々の枯木樹冠と正確な輪郭を分割する、挑戦的で現実的な問題に取り組む。
論文 参考訳(メタデータ) (2024-10-09T20:36:43Z) - Object-centric architectures enable efficient causal representation
learning [51.6196391784561]
観測対象が複数の物体である場合, 生成関数はもはや注入的ではなく, 実際に乱れは生じないことを示す。
スパース摂動からの弱い監督を利用して各オブジェクトのプロパティを乱すオブジェクト中心アーキテクチャを開発する。
このアプローチはユークリッド空間にエンコードする同等のアプローチよりもはるかに少ない摂動を必要とするという意味で、よりデータ効率が高い。
論文 参考訳(メタデータ) (2023-10-29T16:01:03Z) - Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement [75.9289887536165]
基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。
本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。
この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文 参考訳(メタデータ) (2023-03-20T18:19:36Z) - Semantics-Aware Dynamic Localization and Refinement for Referring Image
Segmentation [102.25240608024063]
画像の参照は、言語表現からのイメージセグメントを参照する。
そこで我々は,局所化中心からセグメンテーション言語へ移行するアルゴリズムを開発した。
比較すると,本手法はより汎用的で有効である。
論文 参考訳(メタデータ) (2023-03-11T08:42:40Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Hybrid Generative Models for Two-Dimensional Datasets [5.206057210246861]
2次元配列ベースのデータセットは、さまざまな領域で広く使われている。
生成モデリングの現在のアプローチは、通常、従来の画像データセットに限られている。
本稿では,計算を表現ベース空間に移動させることにより,2次元データセットを生成する新しい手法を提案する。
論文 参考訳(メタデータ) (2021-06-01T03:21:47Z) - CellSegmenter: unsupervised representation learning and instance
segmentation of modular images [0.0]
本稿では,教師なし表現学習とインスタンスセグメンテーションタスクのための構造化された深層生成モデルとアモータイズ推論フレームワークを提案する。
提案した推論アルゴリズムは、再帰的なメカニズムなしで畳み込み並列化されている。
細胞核イメージングデータセットで得られたセグメンテーション結果を示し,高品質なセグメンテーションを実現するための手法の有効性を示した。
論文 参考訳(メタデータ) (2020-11-25T02:10:58Z) - Neural Star Domain as Primitive Representation [65.7313602687861]
本稿では、ニューラルスター領域(NSD)と呼ばれる新しい原始的表現を提案し、恒星領域の原始的形状を学習する。
NSDは、恒星領域の普遍的な近似器であり、擬似的かつ意味的なだけでなく、暗黙的かつ明示的な形状表現でもある。
提案手法は,高分解能メッシュサンプリングにおける画像再構成タスク,セマンティック機能,速度と品質において,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-21T19:05:16Z) - Object-Centric Image Generation from Layouts [93.10217725729468]
複数のオブジェクトを持つ複雑なシーンを生成するレイアウト・ツー・イメージ生成法を開発した。
本手法は,シーン内のオブジェクト間の空間的関係の表現を学習し,レイアウトの忠実度の向上につながる。
本稿では,Fr'echet Inception Distanceのオブジェクト中心適応であるSceneFIDを紹介する。
論文 参考訳(メタデータ) (2020-03-16T21:40:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。