論文の概要: Group DETR v2: Strong Object Detector with Encoder-Decoder Pretraining
- arxiv url: http://arxiv.org/abs/2211.03594v1
- Date: Mon, 7 Nov 2022 14:33:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 17:40:24.285505
- Title: Group DETR v2: Strong Object Detector with Encoder-Decoder Pretraining
- Title(参考訳): Group DETR v2: Encoder-Decoder Pretraining 付き強力なオブジェクト検出器
- Authors: Qiang Chen, Jian Wang, Chuchu Han, Shan Zhang, Zexian Li, Xiaokang
Chen, Jiahui Chen, Xiaodi Wang, Shuming Han, Gang Zhang, Haocheng Feng, Kun
Yao, Junyu Han, Errui Ding, Jingdong Wang
- Abstract要約: エンコーダ・デコーダを事前学習・微調整した強力な物体検出器を提案する。
グループ DETR v2 は COCO test-dev 上で $textbf64.5$ mAP を獲得し、COCO のリーダーボード上に新たな SoTA を確立する。
- 参考スコア(独自算出の注目度): 61.646312198005596
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a strong object detector with encoder-decoder pretraining and
finetuning. Our method, called Group DETR v2, is built upon a vision
transformer encoder ViT-Huge~\cite{dosovitskiy2020image}, a DETR variant
DINO~\cite{zhang2022dino}, and an efficient DETR training method Group
DETR~\cite{chen2022group}. The training process consists of self-supervised
pretraining and finetuning a ViT-Huge encoder on ImageNet-1K, pretraining the
detector on Object365, and finally finetuning it on COCO. Group DETR v2
achieves $\textbf{64.5}$ mAP on COCO test-dev, and establishes a new SoTA on
the COCO leaderboard https://paperswithcode.com/sota/object-detection-on-coco
- Abstract(参考訳): エンコーダデコーダプリトレーニングと微調整を備えた強い物体検出器を提案する。
本手法は,視覚変換器のViT-Huge~\cite{dosovitskiy2020image},DTRの変種であるDINO〜\cite{zhang2022dino},DTRの効率的な訓練方法であるグループDETR〜\cite{chen2022group}に基づいて構築されている。
トレーニングプロセスは、ImageNet-1KでVT-Hugeエンコーダを自己指導して微調整し、Object365で検出器を事前訓練し、最後にCOCOで微調整する。
Group DETR v2 は COCO test-dev 上で $\textbf{64.5}$ mAP を獲得し、COCO のリーダーボード https://paperswithcode.com/sota/object-detection-on-coco 上に新たな SoTA を確立する。
関連論文リスト
- DetToolChain: A New Prompting Paradigm to Unleash Detection Ability of MLLM [81.75988648572347]
DetToolChainはマルチモーダル大言語モデル(MLLM)のゼロショットオブジェクト検出能力を解き放つ新しいパラダイムである。
提案手法は,高精度検出にヒントを得た検出プロンプトツールキットと,これらのプロンプトを実装するための新しいChain-of-Thoughtから構成される。
DetToolChainを用いたGPT-4Vは,オープン語彙検出のための新しいクラスセットにおいて,最先端のオブジェクト検出器を+21.5%AP50で改善することを示す。
論文 参考訳(メタデータ) (2024-03-19T06:54:33Z) - DEYO: DETR with YOLO for End-to-End Object Detection [0.0]
純粋な畳み込み構造エンコーダであるDETRとYOLO(DEYO)を併用した初のリアルタイムエンドツーエンドオブジェクト検出モデルを提案する。
トレーニングの第一段階では、エンドツーエンド検出器の背骨と首を初期化するために、1対1のマッチング戦略で事前訓練された古典的な検出器を用いる。
トレーニングの第2段階では,エンド・ツー・エンド検出器の背骨と頸部を凍結し,デコーダのトレーニングをスクラッチから行う必要がある。
論文 参考訳(メタデータ) (2024-02-26T07:48:19Z) - DEYOv3: DETR with YOLO for Real-time Object Detection [0.0]
ステップ・バイ・ステップ・トレーニング(Step-by-step training)と呼ばれる新しいトレーニング手法を提案する。
第1段階では、一対多で事前訓練されたYOLO検出器を使用して、エンドツーエンド検出器を初期化する。
第2段階では、バックボーンとエンコーダはDETRのようなモデルと一致しているが、検出器のみをゼロから訓練する必要がある。
論文 参考訳(メタデータ) (2023-09-21T07:49:07Z) - Pair DETR: Contrastive Learning Speeds Up DETR Training [0.6491645162078056]
本稿では、DreTRの主な問題である緩やかな収束に対処するための簡単なアプローチを提案する。
2つのデコーダを用いて、一対のキーポイント、左上隅、中央としてオブジェクト境界ボックスを検出する。
実験により、Pair DETRは元のDETRより少なくとも10倍早く収束し、トレーニング中にConditional DETRより1.5倍速く収束できることが示された。
論文 参考訳(メタデータ) (2022-10-29T03:02:49Z) - Group DETR: Fast DETR Training with Group-Wise One-to-Many Assignment [80.55064790937092]
複数の予測に1つの基幹オブジェクトを割り当てる1対多の割り当ては、より高速なR-CNNやFCOSのような検出方法に成功している。
グループDETR(Group DETR)は、単純だが効率的なDECRトレーニング手法であり、一対多の割り当てのためのグループワイドな方法を導入する。
実験により、グループDETRはトレーニング収束を著しく高速化し、様々なDETRモデルの性能を向上させることが示された。
論文 参考訳(メタデータ) (2022-07-26T17:57:58Z) - DETReg: Unsupervised Pretraining with Region Priors for Object Detection [103.93533951746612]
DETRegは、オブジェクト検出ネットワーク全体を事前トレーニングする、新しい自己教師型メソッドである。
事前トレーニング中、DETRegはオブジェクトのローカライゼーションを予測し、教師なしのリージョン提案ジェネレータからのローカライゼーションにマッチする。
対応する機能埋め込みと、自己教師付きイメージエンコーダからの埋め込みを同時に調整する。
論文 参考訳(メタデータ) (2021-06-08T17:39:14Z) - UP-DETR: Unsupervised Pre-training for Object Detection with
Transformers [11.251593386108189]
教師なし事前学習型DETR(UP-DETR)におけるランダムクエリパッチ検出という新しいプレテキストタスクを提案する。
具体的には、与えられた画像からパッチをランダムに取り出し、デコーダにクエリとして与えます。
UP-DETRは、より高速な収束とオブジェクト検出、ワンショット検出、パノプティックセグメンテーションにおける平均精度でDETRの性能を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-18T05:16:11Z) - LabelEnc: A New Intermediate Supervision Method for Object Detection [78.74368141062797]
本稿では,オブジェクト検出システムのトレーニングを促進するため,LabelEncという新たな中間監視手法を提案する。
鍵となるアイデアは、新しいラベル符号化機能を導入し、接地木ラベルを潜伏埋め込みにマッピングすることである。
実験の結果,COCOデータセット上での検出精度は,約2%向上した。
論文 参考訳(メタデータ) (2020-07-07T08:55:05Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。