論文の概要: Multi-Part Object Representations via Graph Structures and Co-Part Discovery
- arxiv url: http://arxiv.org/abs/2512.18192v2
- Date: Fri, 26 Dec 2025 02:56:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-29 13:23:29.782069
- Title: Multi-Part Object Representations via Graph Structures and Co-Part Discovery
- Title(参考訳): グラフ構造による多部オブジェクト表現と共部分発見
- Authors: Alex Foo, Wynne Hsu, Mong Li Lee,
- Abstract要約: 本稿では,部分の明示的なグラフ表現を活用する新しい手法を提案する。
シミュレーション,現実的,実世界の画像による実験結果は,最先端の手法と比較して,発見対象の品質が著しく向上したことを示している。
また、検出したオブジェクト中心表現により、下流タスクにおける重要なオブジェクト特性をより正確に予測できることを示す。
- 参考スコア(独自算出の注目度): 24.418060973308908
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discovering object-centric representations from images can significantly enhance the robustness, sample efficiency and generalizability of vision models. Works on images with multi-part objects typically follow an implicit object representation approach, which fail to recognize these learned objects in occluded or out-of-distribution contexts. This is due to the assumption that object part-whole relations are implicitly encoded into the representations through indirect training objectives. We address this limitation by proposing a novel method that leverages on explicit graph representations for parts and present a co-part object discovery algorithm. We then introduce three benchmarks to evaluate the robustness of object-centric methods in recognizing multi-part objects within occluded and out-of-distribution settings. Experimental results on simulated, realistic, and real-world images show marked improvements in the quality of discovered objects compared to state-of-the-art methods, as well as the accurate recognition of multi-part objects in occluded and out-of-distribution contexts. We also show that the discovered object-centric representations can more accurately predict key object properties in a downstream task, highlighting the potential of our method to advance the field of object-centric representations.
- Abstract(参考訳): 画像からオブジェクト中心の表現を明らかにすることで、視覚モデルの堅牢性、サンプル効率、一般化性を大幅に向上させることができる。
マルチパートオブジェクトを持つイメージは、一般的に暗黙のオブジェクト表現アプローチに従うが、これら学習されたオブジェクトを隠蔽されたあるいは配布外のコンテキストで認識することができない。
これは、オブジェクトの部分的関係が間接的な訓練目的を通じて暗黙的に表現に符号化されるという仮定による。
本稿では,部分の明示的なグラフ表現を活用する新しい手法を提案することにより,この制限に対処し,コパートオブジェクト探索アルゴリズムを提案する。
次に,オブジェクト中心の手法の頑健性を評価するための3つのベンチマークを導入する。
シミュレーション, 現実的, 実世界の画像による実験結果から, 最先端の手法と比較して, 発見対象の品質が著しく向上し, かつ, 隠蔽された状況や分布外の状況下での多部物体の正確な認識が得られた。
また、検出したオブジェクト中心表現は、下流タスクにおける重要なオブジェクト特性をより正確に予測し、オブジェクト中心表現の分野を前進させる手法の可能性を強調した。
関連論文リスト
- SINGAPO: Single Image Controlled Generation of Articulated Parts in Objects [20.978091381109294]
本稿では,単一画像から音声オブジェクトを生成する手法を提案する。
提案手法は,入力画像と視覚的に一致した音声オブジェクトを生成する。
実験の結果,本手法は音声によるオブジェクト生成における最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-10-21T20:41:32Z) - Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。
8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。
多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文 参考訳(メタデータ) (2024-08-17T10:37:07Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Cycle Consistency Driven Object Discovery [75.60399804639403]
本研究では,シーンの各オブジェクトが異なるスロットに関連付けられなければならない制約を明示的に最適化する手法を提案する。
これらの一貫性目標を既存のスロットベースのオブジェクト中心手法に統合することにより、オブジェクト発見性能を大幅に改善することを示す。
提案手法は,オブジェクト発見を改善するだけでなく,下流タスクのよりリッチな機能も提供することを示唆している。
論文 参考訳(メタデータ) (2023-06-03T21:49:06Z) - Compositional Scene Modeling with Global Object-Centric Representations [44.43366905943199]
人間は、メモリ内の標準画像に基づいて閉塞された部分を完了させることで、たとえ閉塞物が存在するとしても、同じ物体を容易に識別することができる。
本稿では,オブジェクトの標準画像のグローバルな表現を,監督なしに推測する合成シーンモデリング手法を提案する。
論文 参考訳(メタデータ) (2022-11-21T14:36:36Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Discovering Objects that Can Move [55.743225595012966]
手動ラベルなしでオブジェクトを背景から分離する、オブジェクト発見の問題について検討する。
既存のアプローチでは、色、テクスチャ、位置などの外観の手がかりを使用して、ピクセルをオブジェクトのような領域に分類する。
私たちは、動的オブジェクト -- 世界で独立して動くエンティティ -- にフォーカスすることを選びます。
論文 参考訳(メタデータ) (2022-03-18T21:13:56Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。