論文の概要: Evaluating Object-Centric Models beyond Object Discovery
- arxiv url: http://arxiv.org/abs/2602.07532v1
- Date: Sat, 07 Feb 2026 13:07:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.674079
- Title: Evaluating Object-Centric Models beyond Object Discovery
- Title(参考訳): オブジェクト発見を超えたオブジェクト中心モデルの評価
- Authors: Krishnakant Singh, Simone Schaub-Meyer, Stefan Roth,
- Abstract要約: オブジェクト中心学習(OCL)は、構成的一般化とアウト・オブ・ディストリビューションデータに対する堅牢性をサポートする構造化されたシーン表現を学習することを目的としている。
ほとんどの以前の研究は、オブジェクト発見と単純な推論タスクのみでOCLモデルを評価することに重点を置いています。
局所化(場所)と表現の有用性を共同で評価する統合評価タスクとメトリクスを導入する。
- 参考スコア(独自算出の注目度): 19.133368391349393
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object-centric learning (OCL) aims to learn structured scene representations that support compositional generalization and robustness to out-of-distribution (OOD) data. However, OCL models are often not evaluated regarding these goals. Instead, most prior work focuses on evaluating OCL models solely through object discovery and simple reasoning tasks, such as probing the representation via image classification. We identify two limitations in existing benchmarks: (1) They provide limited insights on the representation usefulness of OCL models, and (2) localization and representation usefulness are assessed using disjoint metrics. To address (1), we use instruction-tuned VLMs as evaluators, enabling scalable benchmarking across diverse VQA datasets to measure how well VLMs leverage OCL representations for complex reasoning tasks. To address (2), we introduce a unified evaluation task and metric that jointly assess localization (where) and representation usefulness (what), thereby eliminating inconsistencies introduced by disjoint evaluation. Finally, we include a simple multi-feature reconstruction baseline as a reference point.
- Abstract(参考訳): オブジェクト中心学習(OCL)は、構成的一般化とアウト・オブ・ディストリビューション(OOD)データに対する堅牢性をサポートする構造化されたシーン表現を学習することを目的としている。
しかし、OCLモデルはこれらの目標について評価されないことが多い。
代わりに、ほとんどの以前の研究は、オブジェクト発見と単純な推論タスク(画像分類による表現の探索など)を通してのみOCLモデルを評価することに重点を置いている。
既存のベンチマークでは,(1)OCLモデルの表現有用性に関する限られた洞察を提供し,(2)非結合メトリクスを用いて局所化と表現有用性を評価する。
1) に対処するために,命令調整型 VLM を評価器として使用し,多様な VQA データセットをまたいだスケーラブルなベンチマークを可能にし,複雑な推論タスクにおいて,VLM が OCL 表現をどのように活用するかを測定する。
2)に対処するために,局所化(どこ)と表現の有用性(何)を共同で評価する統合評価タスクとメトリクスを導入し,不整合評価による不整合を解消する。
最後に、参照ポイントとして、単純な多機能再構築ベースラインを含める。
関連論文リスト
- CoT Referring: Improving Referring Expression Tasks with Grounded Reasoning [67.18702329644526]
CoT Referringは、構造化されたチェーン・オブ・シークレット・トレーニングデータ構造を通じて、モデル推論をモダリティにわたって強化する。
トレーニングデータを再構築して、新たな出力フォームを実行し、既存のデータセットに新たなアノテーションを提供します。
また、検出とセグメント化機能を統合MLLMフレームワークに統合し、新しい適応重み付き損失で学習して性能を最適化する。
論文 参考訳(メタデータ) (2025-10-03T08:50:21Z) - Are We Done with Object-Centric Learning? [65.67948794110212]
オブジェクト中心学習(OCL)は、シーン内の他のオブジェクトやバックグラウンドキューから分離されたオブジェクトのみをエンコードする表現を学習しようとする。
最近のサンプル効率のセグメンテーションモデルでは、ピクセル空間内のオブジェクトを分離し、それらを独立に符号化することができる。
我々は,OCLのレンズを通した背景刺激によるOOD一般化の課題に対処する。
論文 参考訳(メタデータ) (2025-04-09T17:59:05Z) - Vector-Quantized Vision Foundation Models for Object-Centric Learning [29.417271736114454]
オブジェクト中心学習(OCL)のための統一アーキテクチャ、ベクトル量子化VFMを提案する。
我々の統一の鍵は、OCL集約と復号におけるVFM表現の量子化である。
私たちのVVOは、オブジェクトの発見と認識のベースラインと、下流の視覚的予測と推論を一貫して上回ります。
論文 参考訳(メタデータ) (2025-02-27T16:51:13Z) - Mind the Prompt: A Novel Benchmark for Prompt-based Class-Agnostic Counting [8.000723123087473]
クラスに依存しないカウント(CAC)は、モデルトレーニング中に見たことのない任意のオブジェクトクラスのインスタンスをカウントする。
本稿では,Prompt-Aware Countingベンチマークを導入し,プロンプトベースのCACモデルの堅牢性と信頼性を評価する。
我々は最先端の手法を評価し、標準クラス固有の計数基準で印象的な結果を得たものの、入力プロンプトの理解に重大な欠陥があることを実証した。
論文 参考訳(メタデータ) (2024-09-24T10:35:42Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Using Representation Expressiveness and Learnability to Evaluate
Self-Supervised Learning Methods [61.49061000562676]
本稿では,学習可能性を評価するためにCluster Learnability (CL)を導入する。
CLは、K-meansで表現をクラスタリングすることによって得られたラベルを予測するために訓練されたKNNのパフォーマンスで測定される。
CLは、他の競合する評価手法よりも分布内モデルの性能と相関することがわかった。
論文 参考訳(メタデータ) (2022-06-02T19:05:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。