論文の概要: Cycle Consistency Driven Object Discovery
- arxiv url: http://arxiv.org/abs/2306.02204v1
- Date: Sat, 3 Jun 2023 21:49:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-06 19:37:38.526303
- Title: Cycle Consistency Driven Object Discovery
- Title(参考訳): サイクル一貫性駆動オブジェクト発見
- Authors: Aniket Didolkar, Anirudh Goyal, Yoshua Bengio
- Abstract要約: 本研究では,シーンの各オブジェクトを異なるスロットにマッピングする制約を明示的に最適化する手法を提案する。
これらの一貫性の目的を既存のスロットベースのオブジェクト中心手法に適用することにより、オブジェクト発見性能の大幅な向上を実証する。
- 参考スコア(独自算出の注目度): 100.80645060451997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing deep learning models that effectively learn object-centric
representations, akin to human cognition, remains a challenging task. Existing
approaches have explored slot-based methods utilizing architectural priors or
auxiliary information such as depth maps or flow maps to facilitate object
discovery by representing objects as fixed-size vectors, called ``slots'' or
``object files''. However, reliance on architectural priors introduces
unreliability and requires meticulous engineering to identify the correct
objects. Likewise, methods relying on auxiliary information are suboptimal as
such information is often unavailable for most natural scenes. To address these
limitations, we propose a method that explicitly optimizes the constraint that
each object in a scene should be mapped to a distinct slot. We formalize this
constraint by introducing consistency objectives which are cyclic in nature. We
refer to them as the \textit{cycle-consistency} objectives. By applying these
consistency objectives to various existing slot-based object-centric methods,
we demonstrate significant enhancements in object-discovery performance. These
improvements are consistent across both synthetic and real-world scenes,
highlighting the effectiveness and generalizability of the proposed approach.
Furthermore, our experiments show that the learned slots from the proposed
method exhibit superior suitability for downstream reinforcement learning (RL)
tasks.
- Abstract(参考訳): 人間の認知に似た、オブジェクト中心の表現を効果的に学習するディープラーニングモデルの開発は、依然として困難な課題である。
既存のアプローチでは、アーキテクチャ上の先行情報や深度マップやフローマップなどの補助情報を利用して、オブジェクトを固定サイズのベクトルとして表現することで、オブジェクトの発見を容易にする。
しかし、アーキテクチャ上の先行事項への依存は信頼性を損なうため、正しいオブジェクトを特定するには巧妙なエンジニアリングが必要である。
同様に、補助的な情報に依存する手法は、ほとんどの自然のシーンでは利用できないため、準最適である。
これらの制約に対処するため,シーンの各オブジェクトを別のスロットにマッピングする制約を明示的に最適化する手法を提案する。
我々は,本質的に循環する一貫性目標を導入することで,この制約を定式化する。
これを \textit{cycle-consistency} の目的と呼ぶ。
これらの一貫性を既存のスロットベースのオブジェクト中心手法に適用することにより、オブジェクト発見性能の大幅な向上を示す。
これらの改善は、合成シーンと実世界のシーンの両方で一貫しており、提案手法の有効性と一般化性を強調している。
さらに,提案手法から学習したスロットは,下流強化学習(RL)タスクに優れた適合性を示すことを示した。
関連論文リスト
- Efficient Exploration and Discriminative World Model Learning with an Object-Centric Abstraction [19.59151245929067]
エージェントにオブジェクト中心のマッピング(アイテムとその属性のセットを記述する)を与えることで、より効率的な学習が可能になるかどうかを検討する。
この問題は、ピクセルへの高レベルの状態抽象化でアイテムをモデル化することで、階層的に最もよく解決されている。
我々はこの手法を用いて、差別的な世界モデルを学ぶ完全モデルベースのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-21T17:59:31Z) - Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Object-Centric Conformance Alignments with Synchronization (Extended Version) [57.76661079749309]
対象中心のペトリネットが一対多の関係を捉える能力と,その同一性に基づいたオブジェクトの比較と同期を行う識別子を持つペトリネットの能力を組み合わせた,新たな形式主義を提案する。
我々は、満足度変調理論(SMT)の符号化に基づく、そのようなネットに対する適合性チェック手法を提案する。
論文 参考訳(メタデータ) (2023-12-13T21:53:32Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Boosting Object Representation Learning via Motion and Object Continuity [22.512380611375846]
物体の動きと連続性、すなわち、物体が存在の内外に現れないことを活用することを提案する。
結果のMotion and Object Continuityスキームは、任意のベースラインオブジェクト検出モデルを使用してインスタンス化することができる。
その結果,オブジェクト発見,収束速度,全般的な潜在オブジェクト表現の観点から,SOTAモデルの性能に大きな改善が見られた。
論文 参考訳(メタデータ) (2022-11-16T09:36:41Z) - Tackling Background Distraction in Video Object Segmentation [7.187425003801958]
ビデオオブジェクトセグメンテーション(VOS)は、ビデオ内の特定のオブジェクトを密に追跡することを目的としている。
このタスクの主な課題の1つは、ターゲットオブジェクトに類似したように見えるバックグラウンド・トラクタの存在である。
このような混乱を抑制するための3つの新しい戦略を提案する。
我々のモデルは,リアルタイムな性能であっても,現代の最先端手法に匹敵する性能を実現している。
論文 参考訳(メタデータ) (2022-07-14T14:25:19Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Object Pursuit: Building a Space of Objects via Discriminative Weight
Generation [23.85039747700698]
視覚学習と理解のためのオブジェクト中心表現を継続的に学習するフレームワークを提案する。
我々は、オブジェクト中心の表現を学習しながら、オブジェクトとそれに対応するトレーニング信号の多様なバリエーションをサンプリングするために、インタラクションを活用する。
提案するフレームワークの重要な特徴について広範な研究を行い,学習した表現の特徴を分析した。
論文 参考訳(メタデータ) (2021-12-15T08:25:30Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z) - Relevance-Guided Modeling of Object Dynamics for Reinforcement Learning [0.0951828574518325]
現在の深層強化学習(RL)アプローチでは、環境に関する最小限の事前知識が組み込まれている。
本稿では,最小限およびタスク固有のオブジェクト表現を迅速に決定するために,オブジェクトのダイナミクスと振る舞いを推論するフレームワークを提案する。
また、オブジェクト表現と標準RLと計画アルゴリズムを用いて、Atariゲームにおけるこのフレームワークの可能性を強調し、既存の深層RLアルゴリズムよりも劇的に高速に学習する。
論文 参考訳(メタデータ) (2020-03-03T08:18:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。