論文の概要: One-to-Few Label Assignment for End-to-End Dense Detection
- arxiv url: http://arxiv.org/abs/2303.11567v1
- Date: Tue, 21 Mar 2023 03:24:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 16:38:22.127985
- Title: One-to-Few Label Assignment for End-to-End Dense Detection
- Title(参考訳): エンド・ツー・エンドディエンス検出のための1対4ラベルアサインメント
- Authors: Shuai Li, Minghan Li, Ruihuang Li, Chenhang He, Lei Zhang
- Abstract要約: 1対1(o2o)ラベル割り当ては、トランスフォーマーベースのエンドツーエンド検出において重要な役割を果たす。
エンドツーエンドの高密度検出のための単純な1対1 (o2f) ラベル割り当て戦略を提案する。
- 参考スコア(独自算出の注目度): 19.497115000680076
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One-to-one (o2o) label assignment plays a key role for transformer based
end-to-end detection, and it has been recently introduced in fully
convolutional detectors for end-to-end dense detection. However, o2o can
degrade the feature learning efficiency due to the limited number of positive
samples. Though extra positive samples are introduced to mitigate this issue in
recent DETRs, the computation of self- and cross- attentions in the decoder
limits its practical application to dense and fully convolutional detectors. In
this work, we propose a simple yet effective one-to-few (o2f) label assignment
strategy for end-to-end dense detection. Apart from defining one positive and
many negative anchors for each object, we define several soft anchors, which
serve as positive and negative samples simultaneously. The positive and
negative weights of these soft anchors are dynamically adjusted during training
so that they can contribute more to ``representation learning'' in the early
training stage, and contribute more to ``duplicated prediction removal'' in the
later stage. The detector trained in this way can not only learn a strong
feature representation but also perform end-to-end dense detection. Experiments
on COCO and CrowdHuman datasets demonstrate the effectiveness of the o2f
scheme. Code is available at https://github.com/strongwolf/o2f.
- Abstract(参考訳): 1対1(o2o)ラベル割り当ては、トランスベースエンドツーエンド検出において重要な役割を担っており、最近ではエンドツーエンド高密度検出のための完全畳み込み検出器に導入されている。
しかし、o2oは正のサンプル数が少ないため、特徴学習効率を低下させることができる。
近年のDETRでは、この問題を緩和するために追加の正のサンプルが導入されたが、デコーダにおける自己および横断的な注意の計算は、密集した完全な畳み込み検出器への実用的適用を制限する。
本研究では,エンドツーエンド高密度検出のための簡易かつ効果的な1対few(o2f)ラベル割り当て戦略を提案する。
各対象に対して1つの正のアンカーと多くの負のアンカーを定義するのとは別に、いくつかのソフトアンカーを定義する。
これらのソフトアンカーの正の重みと負の重みは、トレーニング中に動的に調整され、初期トレーニング段階では「表現学習」に多く寄与し、後期では「重複予測除去」に寄与する。
このように訓練された検出器は、強い特徴表現を学ぶだけでなく、エンドツーエンドの高密度検出も行うことができる。
COCOとCrowdHumanデータセットの実験は、o2fスキームの有効性を実証している。
コードはhttps://github.com/strongwolf/o2fで入手できる。
関連論文リスト
- MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection [36.478530086163744]
本研究では,MutDetと呼ばれるリモートセンシングオブジェクト検出のための,Mutally最適化事前学習フレームワークを提案する。
MutDetはオブジェクトの埋め込みを融合し、検出器は最後のエンコーダ層に双方向に機能し、情報インタラクションを強化する。
様々な環境での実験は、新しい最先端の転送性能を示している。
論文 参考訳(メタデータ) (2024-07-13T15:28:15Z) - Bridging the Gap Between End-to-end and Non-End-to-end Multi-Object
Tracking [27.74953961900086]
既存のエンドツーエンドのマルチオブジェクト追跡(e2e-MOT)手法は、非エンドツーエンドのトラッキング・バイ・検出手法を超えていない。
本稿では,e2e-MOT をシャドウ概念を用いた新しいラベル割り当てにより,簡便かつ効果的な方法である Co-MOT を提案する。
論文 参考訳(メタデータ) (2023-05-22T05:18:34Z) - Calibrated Teacher for Sparsely Annotated Object Detection [35.74904852812749]
完全な教師付きオブジェクト検出には、すべてのインスタンスに注釈を付けるトレーニングイメージが必要である。
これは、高い労力と時間コストと避けられないアノテーションのため、実際には現実的ではありません。
近年,アノテーションの欠落に対して擬似ラベルを生成することで,オブジェクト検出の容易化が図られている。
本稿では,予測の信頼度を実際の精度に合わせるために,校正教師を提案する。
論文 参考訳(メタデータ) (2023-03-14T02:02:39Z) - Label-Efficient Object Detection via Region Proposal Network
Pre-Training [58.50615557874024]
地域提案ネットワーク(RPN)に効果的な事前学習を提供するための簡単な事前学習タスクを提案する。
RPN事前学習のないマルチステージ検出器と比較して,本手法はダウンストリームタスク性能を継続的に改善することができる。
論文 参考訳(メタデータ) (2022-11-16T16:28:18Z) - Segment-level Metric Learning for Few-shot Bioacoustic Event Detection [56.59107110017436]
本稿では,モデル最適化時の肯定的事象と否定的事象の両方を利用するセグメントレベルの数ショット学習フレームワークを提案する。
本システムでは,DCASE2022チャレンジタスク5(DCASE2022-T5)のF値62.73の検証を行い,ベースラインプロトタイプネットワーク34.02の性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2022-07-15T22:41:30Z) - Co-mining: Self-Supervised Learning for Sparsely Annotated Object
Detection [29.683119976550007]
我々は,簡潔な注釈付き物体検出のためのシンプルだが効果的な機構であるCo-miningを提案する。
共同マイニングでは、シームズネットワークの2つのブランチが互いに擬似ラベルセットを予測します。
実験は3つの異なるアノテートされた設定でMSデータセット上で行われる。
論文 参考訳(メタデータ) (2020-12-03T14:23:43Z) - Reducing Label Noise in Anchor-Free Object Detection [12.397047191315966]
現在のアンカーフリー物体検出器は、事前に定義された中央領域内に空間的に落下する全ての特徴を正としてラベル付けしている。
本研究では,アンカーフリー検出器のラベルノイズ低減を目的とした新しいラベリング手法を提案する。
我々は、トレーニング中にこのラベリング戦略と、推論中に同様の予測プール法を利用するために、新しいワンステージアンカーフリー物体検出器 PPDet を開発した。
論文 参考訳(メタデータ) (2020-08-03T20:02:46Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - FCOS: A simple and strong anchor-free object detector [111.87691210818194]
物体検出を画素ごとの予測方式で解くために, 完全畳み込み型一段物検出器 (FCOS) を提案する。
RetinaNet、SSD、YOLOv3、Faster R-CNNといった最先端のオブジェクト検出器のほとんどは、事前に定義されたアンカーボックスに依存している。
対照的に、提案した検出器FCOSはアンカーボックスフリーであり、提案はフリーである。
論文 参考訳(メタデータ) (2020-06-14T01:03:39Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。