論文の概要: CAT: LoCalization and IdentificAtion Cascade Detection Transformer for
Open-World Object Detection
- arxiv url: http://arxiv.org/abs/2301.01970v6
- Date: Mon, 27 Mar 2023 11:37:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-29 00:51:27.829954
- Title: CAT: LoCalization and IdentificAtion Cascade Detection Transformer for
Open-World Object Detection
- Title(参考訳): CAT: オープンワールドオブジェクト検出のためのLoCalizationとIdentificAtion Cascade Detection Transformer
- Authors: Shuailei Ma, Yuefeng Wang, Jiaqi Fan, Ying Wei, Thomas H. Li, Hongli
Liu and Fanbing Lv
- Abstract要約: オープンワールドオブジェクト検出には、既知のオブジェクトと未知のオブジェクトの両方を検出するために、既知のオブジェクトのデータからトレーニングされたモデルが必要である。
CAT: LoCalization and IdentificAtion Cascade Detection Transformerを提案する。
我々のモデルはOWOD, インクリメンタルオブジェクト検出(IOD), オープンセット検出といったタスクにおけるすべての指標において, 最先端技術よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 17.766859354014663
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-world object detection (OWOD), as a more general and challenging goal,
requires the model trained from data on known objects to detect both known and
unknown objects and incrementally learn to identify these unknown objects. The
existing works which employ standard detection framework and fixed
pseudo-labelling mechanism (PLM) have the following problems: (i) The inclusion
of detecting unknown objects substantially reduces the model's ability to
detect known ones. (ii) The PLM does not adequately utilize the priori
knowledge of inputs. (iii) The fixed selection manner of PLM cannot guarantee
that the model is trained in the right direction. We observe that humans
subconsciously prefer to focus on all foreground objects and then identify each
one in detail, rather than localize and identify a single object
simultaneously, for alleviating the confusion. This motivates us to propose a
novel solution called CAT: LoCalization and IdentificAtion Cascade Detection
Transformer which decouples the detection process via the shared decoder in the
cascade decoding way. In the meanwhile, we propose the self-adaptive
pseudo-labelling mechanism which combines the model-driven with input-driven
PLM and self-adaptively generates robust pseudo-labels for unknown objects,
significantly improving the ability of CAT to retrieve unknown objects.
Comprehensive experiments on two benchmark datasets, i.e., MS-COCO and PASCAL
VOC, show that our model outperforms the state-of-the-art in terms of all
metrics in the task of OWOD, incremental object detection (IOD) and open-set
detection.
- Abstract(参考訳): より一般的で挑戦的な目標であるopen-world object detection(owod)は、既知のオブジェクトと未知のオブジェクトの両方を検出し、これらの未知のオブジェクトを段階的に識別するために、既知のオブジェクトのデータからトレーニングされたモデルを必要とする。
標準検出フレームワークと固定擬似ラベリング機構(PLM)を用いた既存の研究には次のような問題がある。
(i)未知の物体を検出することは、モデルが既知の物体を検出する能力を大幅に減少させる。
(ii)plmは、入力の事前知識を十分に活用していない。
(iii)plmの固定的な選択方法は、モデルが正しい方向に訓練されていることを保証できない。
我々は、人間は、混乱を緩和するために、1つの物体を同時にローカライズし識別するのではなく、全ての前景の物体に集中し、各物体を詳細に識別することを好むと観察する。
これにより,共有デコーダによる検出プロセスをカスケード復号方式でデカップリングする,cat(localization and identification cascade detection transformer)という新しい手法が提案される。
一方,モデル駆動と入力駆動plmを組み合わせた自己適応型擬似ラベル機構を提案し,未知オブジェクトに対するロバストな擬似ラベルを生成し,猫による未知オブジェクトの検索能力を大幅に向上させる。
2つのベンチマークデータセット(MS-COCOとPASCAL VOC)の総合的な実験により、OWOD、インクリメンタルオブジェクト検出(IOD)、オープンセット検出(Open-set detection)のタスクにおける全ての指標において、我々のモデルが最先端よりも優れていることが示された。
関連論文リスト
- OSAD: Open-Set Aircraft Detection in SAR Images [1.1060425537315088]
オープンセット検出は、クローズドセットでトレーニングされた検出器によって、すべての既知のオブジェクトを検出し、オープンセット環境で未知のオブジェクトを識別することを目的としている。
これらの課題に対処するため、SAR画像のための新しいオープンセット航空機検出器、Open-Set Aircraft Detection (OSAD) が提案されている。
グローバルコンテキストモデリング(GCM)、位置品質駆動型擬似ラベル生成(LPG)、プロトタイプコントラスト学習(PCL)の3つの専用コンポーネントを備えている。
論文 参考訳(メタデータ) (2024-11-03T15:06:14Z) - Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Unsupervised Recognition of Unknown Objects for Open-World Object
Detection [28.787586991713535]
Open-World Object Detection (OWOD) はオブジェクト検出問題を現実的でダイナミックなシナリオに拡張する。
現在のOWODモデル(OREやOW-DETRなど)は、高い客観性スコアを持つ擬似ラベル領域に注目する。
本稿では,未知の物体を認識するために,教師なしの識別モデルを学ぶ新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-31T08:17:29Z) - Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - SalienDet: A Saliency-based Feature Enhancement Algorithm for Object
Detection for Autonomous Driving [160.57870373052577]
未知の物体を検出するために,サリエンデット法(SalienDet)を提案する。
我々のSaienDetは、オブジェクトの提案生成のための画像機能を強化するために、サリエンシに基づくアルゴリズムを利用している。
オープンワールド検出を実現するためのトレーニングサンプルセットにおいて、未知のオブジェクトをすべてのオブジェクトと区別するためのデータセットレザベリングアプローチを設計する。
論文 参考訳(メタデータ) (2023-05-11T16:19:44Z) - Open-World Object Detection via Discriminative Class Prototype Learning [4.055884768256164]
オープンワールドオブジェクト検出(OWOD)は、オブジェクト検出とインクリメンタルラーニングとオープンセットラーニングを組み合わせた難しい問題である。
OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: 差別的OCPL: 差別的OCPL: オープンワールドオブジェクト検出: オープンワールドオブジェクト検出
論文 参考訳(メタデータ) (2023-02-23T03:05:04Z) - Open World DETR: Transformer based Open World Object Detection [60.64535309016623]
そこで我々は,Deformable DETRに基づくオープンワールドオブジェクト検出のための2段階学習手法Open World DETRを提案する。
モデルのクラス固有のコンポーネントを多視点の自己ラベル戦略と一貫性制約で微調整する。
提案手法は、他の最先端のオープンワールドオブジェクト検出方法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2022-12-06T13:39:30Z) - PROB: Probabilistic Objectness for Open World Object Detection [15.574535196804042]
Open World Object Detection (OWOD)は、従来のオブジェクト検出(OD)ベンチマークと現実世界におけるオブジェクト検出のギャップを埋める新しいコンピュータビジョンタスクである。
本稿では,対象物の確率分布推定と対象度推定を交互に行う,対象度推定のための新しい確率的フレームワークを提案する。
Probabilistic Objectness-based open-world detector, PROBは、私たちのフレームワークを従来のオブジェクト検出モデルに統合します。
論文 参考訳(メタデータ) (2022-12-02T20:04:24Z) - OW-DETR: Open-world Detection Transformer [90.56239673123804]
オープンワールドオブジェクト検出のための新しいエンドツーエンドトランスフォーマーベースのフレームワークOW-DETRを提案する。
OW-DETRは3つの専用コンポーネント、すなわち注目駆動の擬似ラベル、新規性分類、オブジェクトネススコアから構成される。
我々のモデルは、最近導入されたOWODアプローチであるOREよりも優れており、リコールの度合いは1.8%から3.3%である。
論文 参考訳(メタデータ) (2021-12-02T18:58:30Z) - Uncertainty for Identifying Open-Set Errors in Visual Object Detection [31.533136658421892]
GMM-Detは、オブジェクト検出器から不確実性を抽出し、オープンセットエラーを識別および拒否するリアルタイムの方法である。
GMM-Detは、オープンセット検出を識別および拒否するための既存の不確実性技術に一貫して勝ることを示す。
論文 参考訳(メタデータ) (2021-04-03T07:12:31Z) - Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。
古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文 参考訳(メタデータ) (2020-11-17T09:39:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。