論文の概要: LabelEnc: A New Intermediate Supervision Method for Object Detection
- arxiv url: http://arxiv.org/abs/2007.03282v3
- Date: Tue, 1 Sep 2020 02:37:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 20:00:09.623928
- Title: LabelEnc: A New Intermediate Supervision Method for Object Detection
- Title(参考訳): LabelEnc: オブジェクト検出のための新しい中間スーパービジョン方法
- Authors: Miao Hao, Yitao Liu, Xiangyu Zhang, Jian Sun
- Abstract要約: 本稿では,オブジェクト検出システムのトレーニングを促進するため,LabelEncという新たな中間監視手法を提案する。
鍵となるアイデアは、新しいラベル符号化機能を導入し、接地木ラベルを潜伏埋め込みにマッピングすることである。
実験の結果,COCOデータセット上での検出精度は,約2%向上した。
- 参考スコア(独自算出の注目度): 78.74368141062797
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we propose a new intermediate supervision method, named
LabelEnc, to boost the training of object detection systems. The key idea is to
introduce a novel label encoding function, mapping the ground-truth labels into
latent embedding, acting as an auxiliary intermediate supervision to the
detection backbone during training. Our approach mainly involves a two-step
training procedure. First, we optimize the label encoding function via an
AutoEncoder defined in the label space, approximating the "desired"
intermediate representations for the target object detector. Second, taking
advantage of the learned label encoding function, we introduce a new auxiliary
loss attached to the detection backbones, thus benefiting the performance of
the derived detector. Experiments show our method improves a variety of
detection systems by around 2% on COCO dataset, no matter one-stage or
two-stage frameworks. Moreover, the auxiliary structures only exist during
training, i.e. it is completely cost-free in inference time. Code is available
at: https://github.com/megvii-model/LabelEnc
- Abstract(参考訳): 本稿では,オブジェクト検出システムのトレーニングを促進するため,LabelEncという新たな中間管理手法を提案する。
重要なアイデアは、新しいラベル符号化機能の導入であり、基底ラベルを潜在埋め込みにマッピングし、トレーニング中の検出バックボーンに補助的な中間監督として機能する。
このアプローチは主に2段階のトレーニング手順を含む。
まず,ラベル空間で定義されたAutoEncoderを用いて,対象物体検出器の「希望」中間表現を近似してラベル符号化関数を最適化する。
次に,学習ラベル符号化機能を活用することで,検出バックボーンに新たな補助損失が付加され,検出器の性能が向上することを示す。
実験により,1段階,2段階のフレームワークにかかわらず,COCOデータセット上での検出システムを約2%改善することを確認した。
さらに、補助構造はトレーニング中にのみ存在し、推論時間において完全にコストフリーである。
コードは、https://github.com/megvii-model/LabelEncで入手できる。
関連論文リスト
- Enhancing Hyperspectral Image Prediction with Contrastive Learning in Low-Label Regime [0.810304644344495]
自己教師付きコントラスト学習は、限られたラベル付きデータの課題に対処するための効果的なアプローチである。
単一ラベルと複数ラベルの分類タスクに対して,本手法の性能を評価する。
論文 参考訳(メタデータ) (2024-10-10T10:20:16Z) - Focusing on what to decode and what to train: Efficient Training with
HOI Split Decoders and Specific Target Guided DeNoising [17.268302302974607]
近年の1段変圧器を用いた手法は,DETRの検出を利用して,人物体間相互作用検出(HOI)タスクにおいて顕著な利得を達成している。
対象デコーダ,オブジェクトデコーダ,動詞デコーダで構成される新しいワンステージフレームワーク(SOV)を提案する。
本稿では,学習可能なオブジェクトと動詞ラベルの埋め込みを活用して学習指導を指導し,学習の収束を加速する,特定目標指導(STG)訓練戦略を提案する。
論文 参考訳(メタデータ) (2023-07-05T13:42:31Z) - Label, Verify, Correct: A Simple Few Shot Object Detection Method [93.84801062680786]
トレーニングセットから高品質な擬似アノテーションを抽出するための簡単な擬似ラベリング手法を提案する。
擬似ラベリングプロセスの精度を向上させるための2つの新しい手法を提案する。
提案手法は,既存手法と比較して,最先端ないし第2の性能を実現する。
論文 参考訳(メタデータ) (2021-12-10T18:59:06Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。