論文の概要: Simple In-place Data Augmentation for Surveillance Object Detection
- arxiv url: http://arxiv.org/abs/2404.11226v1
- Date: Wed, 17 Apr 2024 10:20:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-18 14:35:31.409828
- Title: Simple In-place Data Augmentation for Surveillance Object Detection
- Title(参考訳): 簡易な位置データ拡張による監視対象検出
- Authors: Munkh-Erdene Otgonbold, Ganzorig Batnasan, Munkhjargal Gochoo,
- Abstract要約: 本稿では,オブジェクト検出データセットに適した簡単な拡張手法を提案する。
提案手法では,オブジェクトをオリジナルと同じ位置に配置することで,その有効性を保証する。
- 参考スコア(独自算出の注目度): 2.3841361713768077
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivated by the need to improve model performance in traffic monitoring tasks with limited labeled samples, we propose a straightforward augmentation technique tailored for object detection datasets, specifically designed for stationary camera-based applications. Our approach focuses on placing objects in the same positions as the originals to ensure its effectiveness. By applying in-place augmentation on objects from the same camera input image, we address the challenge of overlapping with original and previously selected objects. Through extensive testing on two traffic monitoring datasets, we illustrate the efficacy of our augmentation strategy in improving model performance, particularly in scenarios with limited labeled samples and imbalanced class distributions. Notably, our method achieves comparable performance to models trained on the entire dataset while utilizing only 8.5 percent of the original data. Moreover, we report significant improvements, with mAP@.5 increasing from 0.4798 to 0.5025, and the mAP@.5:.95 rising from 0.29 to 0.3138 on the FishEye8K dataset. These results highlight the potential of our augmentation approach in enhancing object detection models for traffic monitoring applications.
- Abstract(参考訳): 限定ラベル付きサンプルを用いたトラヒック監視タスクのモデル性能向上の必要性から,オブジェクト検出データセットに特化して,静止カメラベースのアプリケーションに特化して設計された,簡単な拡張手法を提案する。
提案手法では,オブジェクトをオリジナルと同じ位置に配置することで,その有効性を保証する。
同じカメラ入力画像からオブジェクトにインプレース拡張を適用することで、元のオブジェクトと以前選択されたオブジェクトと重複する課題に対処する。
2つのトラヒックモニタリングデータセットの広範なテストを通じて、モデル性能を改善するための拡張戦略の有効性について説明する。
特に,本手法は,データセット全体をトレーニングしたモデルに匹敵する性能を示し,元のデータの8.5%しか利用していない。
さらに,mAP@.5は0.4798から0.5025に増加し,mAP@.5:.95は0.29から0.3138に増加した。
これらの結果は,交通監視アプリケーションにおけるオブジェクト検出モデルの拡張における拡張アプローチの可能性を強調した。
関連論文リスト
- Stanceformer: Target-Aware Transformer for Stance Detection [59.69858080492586]
スタンス検出は、テキストで表現されたスタンスを特定の主題やターゲットに向けて識別する。
以前の作業は、ターゲットを効果的に優先順位付けする能力に欠ける既存のトランスフォーマーモデルに依存していた。
本稿では,学習と推論の両方において,目標に対する注意を高めるターゲット対応トランスフォーマーモデルであるStanceformerを紹介する。
論文 参考訳(メタデータ) (2024-10-09T17:24:28Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Constellation Dataset: Benchmarking High-Altitude Object Detection for an Urban Intersection [7.419274609612015]
本研究では,高標高カメラで観測された都市景観の物体検出研究に適した13K画像のデータセットであるConstellationを紹介する。
このデータセットは、歩行者の限られたピクセルフットプリントによって実証された小さな物体検出の問題を探索するキュレートされたデータの必要性に対処する。
提案手法は, 車両と比較して小型歩行者の検出性能が低いことを観察し, データセット上での同時検出アーキテクチャの評価を行った。
論文 参考訳(メタデータ) (2024-04-25T18:00:24Z) - From Blurry to Brilliant Detection: YOLOv5-Based Aerial Object Detection
with Super Resolution [4.107182710549721]
超解像度と適応型軽量YOLOv5アーキテクチャを組み合わせた革新的なアプローチを提案する。
実験により,小型で密集した物体の検出において,モデルの性能が優れていることを示した。
論文 参考訳(メタデータ) (2024-01-26T05:50:58Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Leveraging the Power of Data Augmentation for Transformer-based Tracking [64.46371987827312]
トラッキング用にカスタマイズされた2つのデータ拡張手法を提案する。
まず、動的探索半径機構と境界サンプルのシミュレーションにより、既存のランダムトリミングを最適化する。
第2に,背景干渉などの問題に対するモデルを可能にする,トークンレベルの機能混在強化戦略を提案する。
論文 参考訳(メタデータ) (2023-09-15T09:18:54Z) - A Billion-scale Foundation Model for Remote Sensing Images [5.065947993017157]
基礎モデルの事前学習における3つの重要な要因は、事前学習方法、事前学習データセットのサイズ、モデルパラメータの数である。
本稿では,下流タスクにおける基礎モデルの性能に及ぼすモデルパラメータ数の増加の影響について検討する。
我々の知る限りでは、これはリモートセンシング分野における最初の10億ドル規模の基礎モデルである。
論文 参考訳(メタデータ) (2023-04-11T13:33:45Z) - AdaZoom: Adaptive Zoom Network for Multi-Scale Object Detection in Large
Scenes [57.969186815591186]
大規模なシーンの検出は、小さなオブジェクトと極端なスケールの変動のために難しい問題である。
本稿では,物体検出のための焦点領域を適応的に拡大するために,フレキシブルな形状と焦点長を有する選択的拡大器として,新しい適応型Zoom(AdaZoom)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-19T03:30:22Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。