論文の概要: UN-DETR: Promoting Objectness Learning via Joint Supervision for Unknown Object Detection
- arxiv url: http://arxiv.org/abs/2412.10176v1
- Date: Fri, 13 Dec 2024 14:45:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-16 15:02:37.958947
- Title: UN-DETR: Promoting Objectness Learning via Joint Supervision for Unknown Object Detection
- Title(参考訳): UN-DETR:未知物体検出のための共同スーパービジョンによるオブジェクト学習の促進
- Authors: Haomiao Liu, Hao Xu, Chuhuai Yue, Bo Ma,
- Abstract要約: Unknown Object Detection (UOD) は、クローズドワールドの仮定によって制限された伝統的な検出パラダイムとは異なる、目に見えないカテゴリのオブジェクトを識別することを目的としている。
従来の手法では, 局所化情報と分類情報の両方から, 客観性学習のための監視信号が得られ, UODの性能は低下した。
そこで我々は,UN-DETRというトランスフォーマーをベースとした UOD フレームワークを提案し,それに基づいて IPS (Instance Presence Score) を作成し,オブジェクトの存在の確率を表す。
- 参考スコア(独自算出の注目度): 6.837147490662261
- License:
- Abstract: Unknown Object Detection (UOD) aims to identify objects of unseen categories, differing from the traditional detection paradigm limited by the closed-world assumption. A key component of UOD is learning a generalized representation, i.e. objectness for both known and unknown categories to distinguish and localize objects from the background in a class-agnostic manner. However, previous methods obtain supervision signals for learning objectness in isolation from either localization or classification information, leading to poor performance for UOD. To address this issue, we propose a transformer-based UOD framework, UN-DETR. Based on this, we craft Instance Presence Score (IPS) to represent the probability of an object's presence. For the purpose of information complementarity, IPS employs a strategy of joint supervised learning, integrating attributes representing general objectness from the positional and the categorical latent space as supervision signals. To enhance IPS learning, we introduce a one-to-many assignment strategy to incorporate more supervision. Then, we propose Unbiased Query Selection to provide premium initial query vectors for the decoder. Additionally, we propose an IPS-guided post-process strategy to filter redundant boxes and correct classification predictions for known and unknown objects. Finally, we pretrain the entire UN-DETR in an unsupervised manner, in order to obtain objectness prior. Our UN-DETR is comprehensively evaluated on multiple UOD and known detection benchmarks, demonstrating its effectiveness and achieving state-of-the-art performance.
- Abstract(参考訳): Unknown Object Detection (UOD) は、クローズドワールドの仮定によって制限された伝統的な検出パラダイムとは異なる、目に見えないカテゴリのオブジェクトを識別することを目的としている。
UODの重要な構成要素は、クラスに依存しない方法で、背景からオブジェクトを識別し、ローカライズするために、既知のカテゴリと未知のカテゴリの両方に対して、汎用的な表現、すなわちオブジェクトを学習することである。
しかし, 従来の手法では, 局所化情報や分類情報から個別に対象を学習するための監視信号が得られ, UODの性能は低下した。
この問題に対処するために, トランスフォーマーをベースとした UOD フレームワーク UN-DETR を提案する。
これに基づいて、オブジェクトの存在の確率を表すために、インスタンスPresence Score(IPS)を作成します。
情報相補性のために、IPSは共同教師付き学習の戦略を採用し、位置とカテゴリー的潜在空間からの一般目的性を表す属性を監視信号として統合する。
IPS学習を強化するために、より多くの監督を取り入れる1対多の割当て戦略を導入する。
次に,デコーダの初期クエリベクトルを提供するために,Unbiased Query Selectionを提案する。
さらに、冗長なボックスをフィルタリングし、未知のオブジェクトに対して正しい分類予測を行うためのIPS誘導後処理戦略を提案する。
最後に,University-DETR全体を教師なしの方法で事前訓練し,事前の客観性を得る。
我々のUN-DETRは、複数のUODおよび既知の検出ベンチマークで総合的に評価され、その有効性を示し、最先端の性能を達成する。
関連論文リスト
- Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Weakly Supervised Open-Vocabulary Object Detection [31.605276665964787]
本稿では、従来のWSODを拡張するために、弱教師付きオープン語彙オブジェクト検出フレームワーク、すなわちWSOVODを提案する。
これを実現するために、データセットレベルの特徴適応、画像レベルの有意なオブジェクトローカライゼーション、地域レベルの視覚言語アライメントを含む3つの重要な戦略を検討する。
論文 参考訳(メタデータ) (2023-12-19T18:59:53Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Open-World Object Detection via Discriminative Class Prototype Learning [4.055884768256164]
オープンワールドオブジェクト検出(OWOD)は、オブジェクト検出とインクリメンタルラーニングとオープンセットラーニングを組み合わせた難しい問題である。
OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: オープンワールドオブジェクト検出
論文 参考訳(メタデータ) (2023-02-23T03:05:04Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - PROB: Probabilistic Objectness for Open World Object Detection [15.574535196804042]
Open World Object Detection (OWOD)は、従来のオブジェクト検出(OD)ベンチマークと現実世界におけるオブジェクト検出のギャップを埋める新しいコンピュータビジョンタスクである。
本稿では,対象物の確率分布推定と対象度推定を交互に行う,対象度推定のための新しい確率的フレームワークを提案する。
Probabilistic Objectness-based open-world detector, PROBは、私たちのフレームワークを従来のオブジェクト検出モデルに統合します。
論文 参考訳(メタデータ) (2022-12-02T20:04:24Z) - Open-Set Object Detection Using Classification-free Object Proposal and
Instance-level Contrastive Learning [25.935629339091697]
オープンセットオブジェクト検出(OSOD)は、オブジェクトと背景分離、オープンセットオブジェクト分類という2つのサブタスクからなる問題を処理するための有望な方向である。
我々は,OSODの課題に対処するため,Openset RCNNを提案する。
我々のOpenset RCNNは、散らばった環境下でロボットの並べ替えタスクをサポートするオープンセットの知覚能力でロボットを支援できることを示します。
論文 参考訳(メタデータ) (2022-11-21T15:00:04Z) - OW-DETR: Open-world Detection Transformer [90.56239673123804]
オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを提案する。
OW-DETRは3つの専用コンポーネント、すなわち注目駆動の擬似ラベル、新規性分類、オブジェクトネススコアから構成される。
我々のモデルは、最近導入されたOWODアプローチであるOREよりも優れており、リコールの度合いは1.8%から3.3%である。
論文 参考訳(メタデータ) (2021-12-02T18:58:30Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。