論文の概要: An Effective Two-stage Training Paradigm Detector for Small Dataset
- arxiv url: http://arxiv.org/abs/2309.05652v1
- Date: Mon, 11 Sep 2023 17:43:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-12 11:28:49.676921
- Title: An Effective Two-stage Training Paradigm Detector for Small Dataset
- Title(参考訳): 小型データセットのための効果的な2段階学習パラダイム検出器
- Authors: Zheng Wang, Dong Xie, Hanzhi Wang, Jiang Tian
- Abstract要約: YOLOv8のバックボーンはマスク画像モデリング技術を用いてエンコーダとして事前訓練されている。
テスト段階では、各モデルを強化するためにテスト時間拡張(TTA)が使用され、さらに性能を高めるために重み付きボックス融合(WBF)が実装される。
良く設計された構造で、私たちのアプローチはDelftBikesテストセットで0.50から0.95までの平均精度を30.4%達成し、リーダーボードで4位になった。
- 参考スコア(独自算出の注目度): 13.227589864946477
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning from the limited amount of labeled data to the pre-train model has
always been viewed as a challenging task. In this report, an effective and
robust solution, the two-stage training paradigm YOLOv8 detector (TP-YOLOv8),
is designed for the object detection track in VIPriors Challenge 2023. First,
the backbone of YOLOv8 is pre-trained as the encoder using the masked image
modeling technique. Then the detector is fine-tuned with elaborate
augmentations. During the test stage, test-time augmentation (TTA) is used to
enhance each model, and weighted box fusion (WBF) is implemented to further
boost the performance. With the well-designed structure, our approach has
achieved 30.4% average precision from 0.50 to 0.95 on the DelftBikes test set,
ranking 4th on the leaderboard.
- Abstract(参考訳): ラベル付きデータの限られた量から事前トレインモデルへの学習は、常に困難なタスクと見なされてきた。
本報告では,VIPriors Challenge 2023において,物体検出のための2段階トレーニングパラダイムYOLOv8検出器(TP-YOLOv8)を設計した。
まず、YOLOv8のバックボーンをマスク画像モデリング技術を用いてエンコーダとして事前訓練する。
その後、検出器は精巧な拡張で微調整される。
テスト段階では、各モデルを強化するためにテスト時間拡張(TTA)を使用し、さらに性能を高めるために重み付きボックス融合(WBF)を実装する。
良く設計された構造で、私たちのアプローチはDelftBikesテストセットの0.50から0.95までの平均精度を30.4%達成しました。
関連論文リスト
- Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for
Enhanced Dataset Pruning [54.511055635704764]
我々は、時間的デュアルディープス・スコーリング(TDDS)と呼ばれる新しいデータセット・プルーニング手法を提案する。
本手法は,10%のトレーニングデータで54.51%の精度を達成し,ランダム選択を7.83%以上,他の比較手法を12.69%以上上回る結果を得た。
論文 参考訳(メタデータ) (2023-11-22T03:45:30Z) - DiffNAS: Bootstrapping Diffusion Models by Prompting for Better
Architectures [63.12993314908957]
そこで我々は,DiffNASと呼ばれるベースモデル探索手法を提案する。
GPT-4をスーパーネットとして利用して検索を高速化し,検索メモリを補足して結果を向上する。
厳密な実験により,GPTに基づくシナリオでは,探索効率を2倍に向上できることが示された。
論文 参考訳(メタデータ) (2023-10-07T09:10:28Z) - DEYOv3: DETR with YOLO for Real-time Object Detection [0.0]
ステップ・バイ・ステップ・トレーニング(Step-by-step training)と呼ばれる新しいトレーニング手法を提案する。
第1段階では、一対多で事前訓練されたYOLO検出器を使用して、エンドツーエンド検出器を初期化する。
第2段階では、バックボーンとエンコーダはDETRのようなモデルと一致しているが、検出器のみをゼロから訓練する必要がある。
論文 参考訳(メタデータ) (2023-09-21T07:49:07Z) - Q-YOLOP: Quantization-aware You Only Look Once for Panoptic Driving
Perception [6.3709120604927945]
本稿では, 物体検出, 乾燥領域分割, レーン線分割のための効率的かつ定量的なパン光学駆動認識モデル(Q-YOLOP)を提案する。
提案モデルでは,オブジェクト検出用 mAP@0.5 とセグメンテーション用 mIoU の mAP@0.5 およびセグメンテーション用 mIoU を用いて,最先端性能を実現する。
論文 参考訳(メタデータ) (2023-07-10T13:02:46Z) - Real-Time Flying Object Detection with YOLOv8 [0.0]
本稿では,移動学習やさらなる研究に使用できる飛行物体のリアルタイム検出のための一般化モデルを提案する。
次に、これらの学習パラメータを実世界の環境をよりよく表現したデータセット上で転送学習を行う。
我々の最終一般化モデルは、0.685のmAP50-95と50fpsの1080pビデオの平均推論速度を達成する。
論文 参考訳(メタデータ) (2023-05-17T06:11:10Z) - Identification of Binary Neutron Star Mergers in Gravitational-Wave Data
Using YOLO One-Shot Object Detection [0.0]
本稿では, 汎用の畳み込み型単発物体検出モデルであるYOLOv5モデルを, 電流発生干渉計検出器の重力波データから二元中性子星(BNS)の合体現象を検出するタスクに適用した。
単クラス検証データセットの平均精度(textmAP_[0.50]$)は0.945、テストデータセットは0.978である。
論文 参考訳(メタデータ) (2022-07-01T10:11:44Z) - To be Critical: Self-Calibrated Weakly Supervised Learning for Salient
Object Detection [95.21700830273221]
弱教師付き有色物体検出(WSOD)は,画像レベルのアノテーションを用いた有色度モデルの開発を目的としている。
擬似ラベルとネットワーク予測の相互校正ループを明確に設定し,自己校正学習戦略を提案する。
十分に整合したアノテーションを持つはるかに小さなデータセットであっても、モデルがより優れたパフォーマンスと一般化性を達成するのに役立ちます。
論文 参考訳(メタデータ) (2021-09-04T02:45:22Z) - Workshop on Autonomous Driving at CVPR 2021: Technical Report for
Streaming Perception Challenge [57.647371468876116]
本稿では,現実的な自律運転シナリオのためのリアルタイム2次元物体検出システムについて紹介する。
私たちの検出器は、YOLOXと呼ばれる新しい設計のYOLOモデルで構築されています。
Argoverse-HDデータセットでは,検出のみのトラック/トラックで2位を7.8/6.1上回る41.0ストリーミングAPを達成した。
論文 参考訳(メタデータ) (2021-07-27T06:36:06Z) - End-to-End Semi-Supervised Object Detection with Soft Teacher [63.26266730447914]
本稿では,従来の複雑な多段階法とは対照的に,終端から終端までの半教師付き物体検出手法を提案する。
提案手法は, 種々のラベル付け比において, 従来手法よりも大きなマージンで性能を向上する。
最先端のSwin Transformerベースの物体検出器では、検出精度を+1.5 mAPで大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-06-16T17:59:30Z) - End-2-End COVID-19 Detection from Breath & Cough Audio [68.41471917650571]
クラウドソースのオーディオサンプルからエンドツーエンドのディープラーニングを使用してCOVID-19を診断する最初の試みを実証します。
本研究では, 人工深層ニューラルネットワークを用いて, 人工呼吸器から新型コロナを診断する新しいモデル戦略を提案する。
論文 参考訳(メタデータ) (2021-01-07T01:13:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。