論文の概要: Let's Roll: Synthetic Dataset Analysis for Pedestrian Detection Across
Different Shutter Types
- arxiv url: http://arxiv.org/abs/2309.08136v1
- Date: Fri, 15 Sep 2023 04:07:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-18 16:15:41.058424
- Title: Let's Roll: Synthetic Dataset Analysis for Pedestrian Detection Across
Different Shutter Types
- Title(参考訳): Let's Roll: 異なるシャッタータイプにわたる歩行者検出のための合成データセット解析
- Authors: Yue Hu, Gourav Datta, Kira Beerel, Peter Beerel
- Abstract要約: 本稿では,機械学習(ML)オブジェクト検出モデルに異なるシャッター機構が与える影響について検討する。
特に、合成合成されたGSとRSのデータセットを用いて、主流検出モデルを訓練し、評価する。
- 参考スコア(独自算出の注目度): 7.0441427250832644
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Computer vision (CV) pipelines are typically evaluated on datasets processed
by image signal processing (ISP) pipelines even though, for
resource-constrained applications, an important research goal is to avoid as
many ISP steps as possible. In particular, most CV datasets consist of global
shutter (GS) images even though most cameras today use a rolling shutter (RS).
This paper studies the impact of different shutter mechanisms on machine
learning (ML) object detection models on a synthetic dataset that we generate
using the advanced simulation capabilities of Unreal Engine 5 (UE5). In
particular, we train and evaluate mainstream detection models with our
synthetically-generated paired GS and RS datasets to ascertain whether there
exists a significant difference in detection accuracy between these two shutter
modalities, especially when capturing low-speed objects (e.g., pedestrians).
The results of this emulation framework indicate the performance between them
are remarkably congruent for coarse-grained detection (mean average precision
(mAP) for IOU=0.5), but have significant differences for fine-grained measures
of detection accuracy (mAP for IOU=0.5:0.95). This implies that ML pipelines
might not need explicit correction for RS for many object detection
applications, but mitigating RS effects in ISP-less ML pipelines that target
fine-grained location of the objects may need additional research.
- Abstract(参考訳): コンピュータビジョン(CV)パイプラインは通常、画像信号処理(ISP)パイプラインによって処理されるデータセットで評価されるが、リソース制約のあるアプリケーションでは、可能な限り多くのISPステップを避けることが重要な研究目標である。
特に、ほとんどのCVデータセットは、現在ほとんどのカメラがローリングシャッター(RS)を使用しているにもかかわらず、グローバルシャッター(GS)画像で構成されている。
本論文では,Unreal Engine 5 (UE5) の高度なシミュレーション機能を用いて生成する合成データセットに対して,異なるシャッター機構が機械学習(ML)オブジェクト検出モデルに与える影響について検討する。
特に,これらの2つのシャッターモード間の検出精度に有意差があるかどうか,特に低速物体(歩行者など)を捕捉する場合に,合成合成したGSデータセットとRSデータセットを用いて主流検出モデルを訓練し,評価する。
このエミュレーション・フレームワークの結果から, 粗粒度検出(iou=0.5の平均精度(map))は著しく一致したが, 細粒度検出精度(iou=0.5:0.95マップ)には有意差が認められた。
これは、多くのオブジェクト検出アプリケーションにおいて、MLパイプラインはRSの明示的な修正を必要としないかもしれないが、オブジェクトのきめ細かい位置をターゲットとするISPのないMLパイプラインにおけるRS効果を緩和するには、さらなる研究が必要であることを意味している。
関連論文リスト
- OpticalRS-4M: Scaling Efficient Masked Autoencoder Learning on Large Remote Sensing Dataset [66.15872913664407]
本稿では、大規模RSデータセットの作成とMIMの効率的なアプローチを特徴とする、RSモデルのための新しい事前学習パイプラインを提案する。
我々は、公開可能なRSデータセットを収集し、排除、スライシング、復号化によってそれらを処理することで、OptoRS-4Mという高品質なデータセットをキュレートした。
実験により,OCR-4Mは分類,検出,セグメンテーション性能を著しく向上し,SelectiveMAEは2回以上のトレーニング効率を向上させることが示された。
論文 参考訳(メタデータ) (2024-06-17T15:41:57Z) - Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークが組み込まれている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - ParGANDA: Making Synthetic Pedestrians A Reality For Object Detection [2.7648976108201815]
本稿では,GAN(Generative Adversarial Network)を用いて,実データと合成データのギャップを埋めることを提案する。
我々のアプローチは、視覚的に可視なサンプルを生成するだけでなく、実際のドメインのラベルも必要としない。
論文 参考訳(メタデータ) (2023-07-21T05:26:32Z) - A Simulation-Augmented Benchmarking Framework for Automatic RSO Streak
Detection in Single-Frame Space Images [7.457841062817294]
大規模データセットが利用可能な場合、ディープ畳み込みニューラルネットワーク(DCNN)は、オブジェクト検出において優れたパフォーマンスを示している。
RSO検出のための新しいシミュレーション強化ベンチマークフレームワーク(SAB-RSOD)を紹介する。
本フレームワークでは,実空間画像をキャプチャするセンサのハードウェアパラメータを最大限に活用することにより,まず高忠実度RSOシミュレータを開発する。
次に,このシミュレータを用いて宇宙空間に多彩なROSを含む画像を生成し,自動的に注釈を付ける。
論文 参考訳(メタデータ) (2023-04-30T07:00:16Z) - Comprehensive Analysis of the Object Detection Pipeline on UAVs [16.071349046409885]
まず、リモートセンシングアプリケーションにおける7つのパラメータ(量子化、圧縮、解像度、色モデル、画像歪み、ガンマ補正、追加チャネル)の影響を実験的に分析する。
すべてのパラメータが検出精度とデータスループットに等しく影響を与えるわけではなく、パラメータ間の適切な妥協により、軽量物体検出モデルの検出精度を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-01T09:30:01Z) - On the Role of Sensor Fusion for Object Detection in Future Vehicular
Networks [25.838878314196375]
異なるセンサの組み合わせが車両の移動・運転環境の検出にどのように影響するかを評価します。
最終的な目標は、チャネルに分散するデータの量を最小限に抑える最適な設定を特定することです。
論文 参考訳(メタデータ) (2021-04-23T18:58:37Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Learning Camera Miscalibration Detection [83.38916296044394]
本稿では,視覚センサ,特にRGBカメラの誤校正検出を学習するためのデータ駆動型アプローチに焦点を当てた。
コントリビューションには、RGBカメラの誤校正基準と、この基準に基づく新しい半合成データセット生成パイプラインが含まれる。
深層畳み込みニューラルネットワークをトレーニングすることにより、カメラ固有のパラメータの再校正が必要か否かを判断するパイプラインの有効性を実証する。
論文 参考訳(メタデータ) (2020-05-24T10:32:49Z) - A DICOM Framework for Machine Learning Pipelines against Real-Time
Radiology Images [50.222197963803644]
Nifflerは、研究クラスタでの機械学習パイプラインの実行を可能にする統合フレームワークである。
ニフラーはDigital Imaging and Communications in Medicine (DICOM)プロトコルを使用して画像データの取得と保存を行っている。
我々は,そのアーキテクチャと3つのユースケースを提示する: リアルタイムに画像から下大静脈フィルターを検出すること,スキャナ利用の同定,およびスキャナクロックの校正。
論文 参考訳(メタデータ) (2020-04-16T21:06:49Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。