論文の概要: OW-DETR: Open-world Detection Transformer
- arxiv url: http://arxiv.org/abs/2112.01513v1
- Date: Thu, 2 Dec 2021 18:58:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-03 17:02:05.559124
- Title: OW-DETR: Open-world Detection Transformer
- Title(参考訳): OW-DETR:オープンワールド検出変換器
- Authors: Akshita Gupta, Sanath Narayan, K J Joseph, Salman Khan, Fahad Shahbaz
Khan, Mubarak Shah
- Abstract要約: オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを提案する。
OW-DETRは3つの専用コンポーネント、すなわち注目駆動の擬似ラベル、新規性分類、オブジェクトネススコアから構成される。
我々のモデルは、最近導入されたOWODアプローチであるOREよりも優れており、リコールの度合いは1.8%から3.3%である。
- 参考スコア(独自算出の注目度): 90.56239673123804
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Open-world object detection (OWOD) is a challenging computer vision problem,
where the task is to detect a known set of object categories while
simultaneously identifying unknown objects. Additionally, the model must
incrementally learn new classes that become known in the next training
episodes. Distinct from standard object detection, the OWOD setting poses
significant challenges for generating quality candidate proposals on
potentially unknown objects, separating the unknown objects from the background
and detecting diverse unknown objects. Here, we introduce a novel end-to-end
transformer-based framework, OW-DETR, for open-world object detection. The
proposed OW-DETR comprises three dedicated components namely, attention-driven
pseudo-labeling, novelty classification and objectness scoring to explicitly
address the aforementioned OWOD challenges. Our OW-DETR explicitly encodes
multi-scale contextual information, possesses less inductive bias, enables
knowledge transfer from known classes to the unknown class and can better
discriminate between unknown objects and background. Comprehensive experiments
are performed on two benchmarks: MS-COCO and PASCAL VOC. The extensive
ablations reveal the merits of our proposed contributions. Further, our model
outperforms the recently introduced OWOD approach, ORE, with absolute gains
ranging from 1.8% to 3.3% in terms of unknown recall on the MS-COCO benchmark.
In the case of incremental object detection, OW-DETR outperforms the
state-of-the-art for all settings on the PASCAL VOC benchmark. Our codes and
models will be publicly released.
- Abstract(参考訳): オープンワールドオブジェクト検出(owod)は、未知のオブジェクトを同時に識別しながら既知のオブジェクトカテゴリのセットを検出するという、コンピュータビジョンの問題である。
さらに、モデルは次のトレーニングエピソードで明らかになった新しいクラスを段階的に学習する必要があります。
標準的なオブジェクト検出とは別として、OWOD設定は、潜在的に未知のオブジェクトに対する品質候補の提案を生成し、未知のオブジェクトを背景から分離し、未知のオブジェクトを検出するための重要な課題となる。
本稿では、オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを紹介する。
提案するow-detrは,注意駆動擬似ラベル,ノベルティ分類,オブジェクト性スコアリングという3つの専用コンポーネントから成り,上記のowod課題を明示的に解決する。
ow-detrはマルチスケールな文脈情報を明示的にエンコードし、帰納的バイアスが少なく、既知のクラスから未知のクラスへの知識転送を可能にし、未知のオブジェクトと背景を識別する。
総合的な実験はMS-COCOとPASCAL VOCの2つのベンチマークで実施された。
広範なアブレーションの結果,提案する貢献のメリットが明らかになった。
さらに、本モデルは、最近導入されたowodアプローチであるoreを上回り、ms-cocoベンチマークにおける未知のリコールの観点から、絶対値が1.8%から3.3%に上昇した。
インクリメンタルなオブジェクト検出の場合、OW-DETRはPASCAL VOCベンチマークのすべての設定において最先端よりも優れている。
私たちのコードとモデルは公開されます。
関連論文リスト
- Exploiting Unlabeled Data with Multiple Expert Teachers for Open Vocabulary Aerial Object Detection and Its Orientation Adaptation [58.37525311718006]
OVAD(Open-vocabulary Aero Object Detection)という,航空物体検出問題の新しい定式化を行った。
本稿では,CLIP-activated students-Teacher DetectionフレームワークであるCastDetを提案する。
本フレームワークは,ロバストなローカライズ教師といくつかのボックス選択戦略を統合し,新しいオブジェクトの高品質な提案を生成する。
論文 参考訳(メタデータ) (2024-11-04T12:59:13Z) - OSAD: Open-Set Aircraft Detection in SAR Images [1.1060425537315088]
オープンセット検出は、クローズドセットでトレーニングされた検出器によって、すべての既知のオブジェクトを検出し、オープンセット環境で未知のオブジェクトを識別することを目的としている。
これらの課題に対処するため、SAR画像のための新しいオープンセット航空機検出器、Open-Set Aircraft Detection (OSAD) が提案されている。
グローバルコンテキストモデリング(GCM)、位置品質駆動型擬似ラベル生成(LPG)、プロトタイプコントラスト学習(PCL)の3つの専用コンポーネントを備えている。
論文 参考訳(メタデータ) (2024-11-03T15:06:14Z) - Learning Background Prompts to Discover Implicit Knowledge for Open Vocabulary Object Detection [101.15777242546649]
Open vocabulary Object Detection (OVD) は、ベースと新規の両方のカテゴリからオブジェクトを認識できる最適なオブジェクト検出器を求めることを目的としている。
近年の進歩は、知識蒸留を利用して、事前訓練された大規模視覚言語モデルからオブジェクト検出のタスクに洞察力のある知識を伝達している。
本稿では,暗黙的背景知識を活用するための学習バックグラウンドプロンプトを提案するため,LBPと呼ばれる新しいOVDフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-01T17:32:26Z) - Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Unsupervised Recognition of Unknown Objects for Open-World Object
Detection [28.787586991713535]
Open-World Object Detection (OWOD) はオブジェクト検出問題を現実的でダイナミックなシナリオに拡張する。
現在のOWODモデル(OREやOW-DETRなど)は、高い客観性スコアを持つ擬似ラベル領域に注目する。
本稿では,未知の物体を認識するために,教師なしの識別モデルを学ぶ新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-31T08:17:29Z) - Addressing the Challenges of Open-World Object Detection [12.053132866404972]
OW-RCNNは、オープンワールドオブジェクト検出(OWOD)の3つの課題に対処するオープンワールドオブジェクト検出器である。
OW-RCNNは、MS-COCO上のオープンワールド評価プロトコルを用いて、新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2023-03-27T06:11:28Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。