論文の概要: OW-DETR: Open-world Detection Transformer
- arxiv url: http://arxiv.org/abs/2112.01513v1
- Date: Thu, 2 Dec 2021 18:58:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-03 17:02:05.559124
- Title: OW-DETR: Open-world Detection Transformer
- Title(参考訳): OW-DETR:オープンワールド検出変換器
- Authors: Akshita Gupta, Sanath Narayan, K J Joseph, Salman Khan, Fahad Shahbaz
Khan, Mubarak Shah
- Abstract要約: オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを提案する。
OW-DETRは3つの専用コンポーネント、すなわち注目駆動の擬似ラベル、新規性分類、オブジェクトネススコアから構成される。
我々のモデルは、最近導入されたOWODアプローチであるOREよりも優れており、リコールの度合いは1.8%から3.3%である。
- 参考スコア(独自算出の注目度): 90.56239673123804
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Open-world object detection (OWOD) is a challenging computer vision problem,
where the task is to detect a known set of object categories while
simultaneously identifying unknown objects. Additionally, the model must
incrementally learn new classes that become known in the next training
episodes. Distinct from standard object detection, the OWOD setting poses
significant challenges for generating quality candidate proposals on
potentially unknown objects, separating the unknown objects from the background
and detecting diverse unknown objects. Here, we introduce a novel end-to-end
transformer-based framework, OW-DETR, for open-world object detection. The
proposed OW-DETR comprises three dedicated components namely, attention-driven
pseudo-labeling, novelty classification and objectness scoring to explicitly
address the aforementioned OWOD challenges. Our OW-DETR explicitly encodes
multi-scale contextual information, possesses less inductive bias, enables
knowledge transfer from known classes to the unknown class and can better
discriminate between unknown objects and background. Comprehensive experiments
are performed on two benchmarks: MS-COCO and PASCAL VOC. The extensive
ablations reveal the merits of our proposed contributions. Further, our model
outperforms the recently introduced OWOD approach, ORE, with absolute gains
ranging from 1.8% to 3.3% in terms of unknown recall on the MS-COCO benchmark.
In the case of incremental object detection, OW-DETR outperforms the
state-of-the-art for all settings on the PASCAL VOC benchmark. Our codes and
models will be publicly released.
- Abstract(参考訳): オープンワールドオブジェクト検出(owod)は、未知のオブジェクトを同時に識別しながら既知のオブジェクトカテゴリのセットを検出するという、コンピュータビジョンの問題である。
さらに、モデルは次のトレーニングエピソードで明らかになった新しいクラスを段階的に学習する必要があります。
標準的なオブジェクト検出とは別として、OWOD設定は、潜在的に未知のオブジェクトに対する品質候補の提案を生成し、未知のオブジェクトを背景から分離し、未知のオブジェクトを検出するための重要な課題となる。
本稿では、オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを紹介する。
提案するow-detrは,注意駆動擬似ラベル,ノベルティ分類,オブジェクト性スコアリングという3つの専用コンポーネントから成り,上記のowod課題を明示的に解決する。
ow-detrはマルチスケールな文脈情報を明示的にエンコードし、帰納的バイアスが少なく、既知のクラスから未知のクラスへの知識転送を可能にし、未知のオブジェクトと背景を識別する。
総合的な実験はMS-COCOとPASCAL VOCの2つのベンチマークで実施された。
広範なアブレーションの結果,提案する貢献のメリットが明らかになった。
さらに、本モデルは、最近導入されたowodアプローチであるoreを上回り、ms-cocoベンチマークにおける未知のリコールの観点から、絶対値が1.8%から3.3%に上昇した。
インクリメンタルなオブジェクト検出の場合、OW-DETRはPASCAL VOCベンチマークのすべての設定において最先端よりも優れている。
私たちのコードとモデルは公開されます。
関連論文リスト
- Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Robust Tiny Object Detection in Aerial Images amidst Label Noise [50.257696872021164]
本研究は,ノイズラベル管理下での微小物体検出の問題に対処する。
本稿では,DN-TOD(Denoising Tiny Object Detector)を提案する。
本手法は,1段と2段の両方のオブジェクト検出パイプラインにシームレスに統合できる。
論文 参考訳(メタデータ) (2024-01-16T02:14:33Z) - Towards Open World Active Learning for 3D Object Detection [43.242426340854905]
3次元物体検出のためのオープンワールドアクティブラーニング(OWAL-3D)について紹介する。
OWAL-3Dは、既知のクラスと未知クラスの両方で検出性能を最大化しながら、アノテートする少数の3Dボックスを選択することを目的としている。
我々は,2つの関係制約をシンプルかつ効果的なAL戦略であるOpenCRBに統合する。
論文 参考訳(メタデータ) (2023-10-16T13:32:53Z) - Unsupervised Recognition of Unknown Objects for Open-World Object
Detection [28.787586991713535]
Open-World Object Detection (OWOD) はオブジェクト検出問題を現実的でダイナミックなシナリオに拡張する。
現在のOWODモデル(OREやOW-DETRなど)は、高い客観性スコアを持つ擬似ラベル領域に注目する。
本稿では,未知の物体を認識するために,教師なしの識別モデルを学ぶ新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-31T08:17:29Z) - Addressing the Challenges of Open-World Object Detection [12.053132866404972]
OW-RCNNは、オープンワールドオブジェクト検出(OWOD)の3つの課題に対処するオープンワールドオブジェクト検出器である。
OW-RCNNは、MS-COCO上のオープンワールド評価プロトコルを用いて、新しい最先端技術を確立する。
論文 参考訳(メタデータ) (2023-03-27T06:11:28Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - GLENet: Boosting 3D Object Detectors with Generative Label Uncertainty
Estimation [59.05097963821385]
本稿では,対象物の潜在的可算有界箱の多様性として,ラベルの不確実性問題を定式化する。
本稿では,条件付き変分オートエンコーダを応用した生成フレームワークであるGLENetを提案する。
GLENetが生成するラベルの不確実性はプラグアンドプレイモジュールであり、既存のディープ3D検出器に便利に統合することができる。
論文 参考訳(メタデータ) (2022-07-06T06:26:17Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。