論文の概要: Task-Specific Context Decoupling for Object Detection
- arxiv url: http://arxiv.org/abs/2303.01047v1
- Date: Thu, 2 Mar 2023 08:02:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-03 15:35:12.563696
- Title: Task-Specific Context Decoupling for Object Detection
- Title(参考訳): オブジェクト検出のためのタスク特化コンテキストデカップリング
- Authors: Jiayuan Zhuang, Zheng Qin, Hao Yu, Xucan Chen
- Abstract要約: 排他的手法は通常、切り離された頭を使って各タスクの異なる特徴コンテキストを学習する。
本稿では,2つのタスクに対する特徴符号化をさらに切り離した新しいタスク特化コームテキストデカップリング(TSCODE)を提案する。
本手法は計算コストを抑えて1.0 AP以上の異なる検出器を安定的に改善する。
- 参考スコア(独自算出の注目度): 27.078743716924752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification and localization are two main sub-tasks in object detection.
Nonetheless, these two tasks have inconsistent preferences for feature context,
i.e., localization expects more boundary-aware features to accurately regress
the bounding box, while more semantic context is preferred for object
classification. Exsiting methods usually leverage disentangled heads to learn
different feature context for each task. However, the heads are still applied
on the same input features, which leads to an imperfect balance between
classifcation and localization. In this work, we propose a novel Task-Specific
COntext DEcoupling (TSCODE) head which further disentangles the feature
encoding for two tasks. For classification, we generate spatially-coarse but
semantically-strong feature encoding. For localization, we provide
high-resolution feature map containing more edge information to better regress
object boundaries. TSCODE is plug-and-play and can be easily incorperated into
existing detection pipelines. Extensive experiments demonstrate that our method
stably improves different detectors by over 1.0 AP with less computational
cost. Our code and models will be publicly released.
- Abstract(参考訳): 分類とローカライゼーションは、オブジェクト検出における2つの主要なサブタスクである。
にもかかわらず、これらの2つのタスクは特徴コンテキストに対して矛盾しない好みを持っている。つまり、ローカライゼーションは境界を意識した特徴が境界ボックスを正確に回帰させるのを期待する。
排他的手法は通常、切り離された頭を使って各タスクの異なる特徴コンテキストを学習する。
しかし、頭は依然として同じ入力機能に適用され、分類と局所化のバランスが不完全になる。
本稿では,2つのタスクの特徴エンコーディングをさらに分離する新しいタスク固有コンテキストデカップリング(tscode)ヘッドを提案する。
分類のために、空間的に粗いが意味的に強い特徴符号化を生成する。
ローカライズのために、よりエッジ情報を含む高分解能な特徴マップを提供し、オブジェクト境界を良くする。
TSCODEはプラグアンドプレイであり、既存の検出パイプラインに容易に組み込むことができる。
大規模実験により,本手法は計算コストを抑えながら,1.0 AP以上の異なる検出器を安定的に改良することを示した。
私たちのコードとモデルは公開されます。
関連論文リスト
- Decoupled DETR: Spatially Disentangling Localization and Classification
for Improved End-to-End Object Detection [48.429555904690595]
本稿では,タスク認識型問合せ生成モジュールと切り離された特徴学習プロセスを含む空間的に分離されたDETRを紹介する。
提案手法は,従来の研究に比べてMSCOCOデータセットの大幅な改善を実現していることを示す。
論文 参考訳(メタデータ) (2023-10-24T15:54:11Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Task-specific Inconsistency Alignment for Domain Adaptive Object
Detection [38.027790951157705]
大量のラベル付きデータでトレーニングされた検出器は、データ分散ギャップのある特定のシナリオで劇的なパフォーマンス劣化を示すことが多い。
本稿では,タスク固有の不整合アライメント(TIA)を提案する。
TIAは,従来の最先端手法よりも,様々なシナリオにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2022-03-29T08:36:33Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features [14.115782214599015]
ワンショットオブジェクト検出は、単一のデモによって定義されたオブジェクトを検出することで構成される。
ローカライズと認識を共同で行うワンステージシステムを構築している。
いくつかの挑戦的領域に対する実験的評価は,本手法が未知のクラスを検出できることを示唆している。
論文 参考訳(メタデータ) (2020-03-15T11:39:47Z) - iFAN: Image-Instance Full Alignment Networks for Adaptive Object
Detection [48.83883375118966]
iFANは、イメージレベルとインスタンスレベルの両方で、機能の分散を正確に調整することを目的としている。
ソースのみのベースライン上で10%以上のAPで、最先端のメソッドよりも優れています。
論文 参考訳(メタデータ) (2020-03-09T13:27:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。