論文の概要: Sensitivity of Slot-Based Object-Centric Models to their Number of Slots
- arxiv url: http://arxiv.org/abs/2305.18890v1
- Date: Tue, 30 May 2023 09:44:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 17:11:05.168411
- Title: Sensitivity of Slot-Based Object-Centric Models to their Number of Slots
- Title(参考訳): スロットに基づく物体中心モデルのスロット数に対する感度
- Authors: Roland S. Zimmermann, Sjoerd van Steenkiste, Mehdi S. M. Sajjadi,
Thomas Kipf, Klaus Greff
- Abstract要約: スロットベースの手法のK$に対する感度と、それがデータ内のオブジェクトへの学習対応に与える影響について検討する。
トレーニング中、特にK$の誤った選択は、望ましい対象分解を得られない。
目的関数の選択とインスタンスレベルのアノテーションの導入によって、この振る舞いを適度に軽減できることを示す。
- 参考スコア(独自算出の注目度): 15.990209329609275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Self-supervised methods for learning object-centric representations have
recently been applied successfully to various datasets. This progress is
largely fueled by slot-based methods, whose ability to cluster visual scenes
into meaningful objects holds great promise for compositional generalization
and downstream learning. In these methods, the number of slots (clusters) $K$
is typically chosen to match the number of ground-truth objects in the data,
even though this quantity is unknown in real-world settings. Indeed, the
sensitivity of slot-based methods to $K$, and how this affects their learned
correspondence to objects in the data has largely been ignored in the
literature. In this work, we address this issue through a systematic study of
slot-based methods. We propose using analogs to precision and recall based on
the Adjusted Rand Index to accurately quantify model behavior over a large
range of $K$. We find that, especially during training, incorrect choices of
$K$ do not yield the desired object decomposition and, in fact, cause
substantial oversegmentation or merging of separate objects
(undersegmentation). We demonstrate that the choice of the objective function
and incorporating instance-level annotations can moderately mitigate this
behavior while still falling short of fully resolving this issue. Indeed, we
show how this issue persists across multiple methods and datasets and stress
its importance for future slot-based models.
- Abstract(参考訳): 近年,オブジェクト中心表現を学習するための自己教師型手法が,様々なデータセットに適用されている。
この進歩は、視覚シーンを意味のあるオブジェクトにクラスタリングする能力が、合成一般化と下流学習を大いに約束するスロットベースの手法に大きく支えられている。
これらの方法では、slot(クラスタ)$k$が通常、実際の設定では未知数であっても、データ内の接地オブジェクトの数にマッチするように選択される。
実際、スロットベースのメソッドのK$に対する感度と、それがデータ内のオブジェクトとの学習対応に与える影響は、文献でほとんど無視されている。
本研究では,スロットベース手法の体系的研究を通じてこの問題に対処する。
そこで我々は,適応乱数指数に基づく精度とリコールのためのアナログを用いて,広範囲にわたるモデル挙動を正確に定量化することを提案する。
特にトレーニング中は、k$ の誤った選択は、望ましいオブジェクトの分解を生じさせず、実際には、分離されたオブジェクトのかなりのオーバーセグメンテーションまたはマージを引き起こす(アンダーセグメンテーション)。
目的関数の選択とインスタンスレベルのアノテーションの導入は、この問題を完全に解決できないまま、この振る舞いを適度に軽減できることを示す。
実際、この問題は複数のメソッドやデータセットにまたがって持続し、将来のスロットベースモデルにおいてその重要性を強調している。
関連論文リスト
- Adaptive Slot Attention: Object Discovery with Dynamic Slot Number [64.45419820717754]
スロットアテンションを含むほとんどのオブジェクト中心モデルの大きな欠点は、スロットの数を事前に定義することに依存することである。
本フレームワークでは,最適スロット数を動的に決定するアダプティブスロットアテンション(AdaSlot)機構を導入する。
我々のフレームワークは、さまざまなデータセットでオブジェクト発見タスクを広範囲にテストし、パフォーマンスの整合性を示すか、上位の固定スロットモデルを超えるかを示す。
論文 参考訳(メタデータ) (2024-06-13T14:55:11Z) - Object-Centric Learning with Slot Mixture Module [45.62331048595689]
本研究はガウス混合モデルに基づく学習可能なクラスタリング手法を用いる。
他のアプローチとは異なり、スロットはクラスタの中心としてだけでなく、クラスタと割り当てられたベクトル間の距離に関する情報も含んでいる。
Slot Attentionの代わりにこのアプローチを使用することで、オブジェクト中心のシナリオのパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2023-11-08T12:34:36Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Enhancing Interpretable Object Abstraction via Clustering-based Slot
Initialization [17.25953277219166]
本稿では,スロットを用いたオブジェクト中心表現の新しい手法を提案する。
我々の手法は先行処理を一貫して上回ります。
様々なデータセットを用いたオブジェクト発見と新しいビュー合成タスクについて評価する。
論文 参考訳(メタデータ) (2023-08-22T11:48:43Z) - SupeRGB-D: Zero-shot Instance Segmentation in Cluttered Indoor
Environments [67.34330257205525]
本研究では,RGB-Dデータからゼロショットのインスタンスセグメンテーション(ZSIS)を探索し,意味的カテゴリに依存しない方法で未知のオブジェクトを識別する。
本稿では,注釈付きオブジェクトを用いて画素のオブジェクト性」を学習し,乱雑な屋内環境における未知のオブジェクトカテゴリに一般化する手法を提案する。
論文 参考訳(メタデータ) (2022-12-22T17:59:48Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Closing the Generalization Gap in One-Shot Object Detection [92.82028853413516]
強力な数ショット検出モデルの鍵は、高度なメトリック学習アプローチではなく、カテゴリの数をスケールすることにある。
将来的なデータアノテーションの取り組みは、より広範なデータセットに集中し、より多くのカテゴリにアノテートする必要がある。
論文 参考訳(メタデータ) (2020-11-09T09:31:17Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。