論文の概要: SimD3: A Synthetic drone Dataset with Payload and Bird Distractor Modeling for Robust Detection
- arxiv url: http://arxiv.org/abs/2601.14742v1
- Date: Wed, 21 Jan 2026 07:56:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.285428
- Title: SimD3: A Synthetic drone Dataset with Payload and Bird Distractor Modeling for Robust Detection
- Title(参考訳): SimD3:ロバスト検出のためのペイロードとバードディトラクタモデリングを備えた合成ドローンデータセット
- Authors: Ami Pandat, Kanyala Muvva, Punna Rajasekhar, Gopika Vinod, Rohit Shukla,
- Abstract要約: 本稿では,複雑な大気環境下でのロバストなドローン検出のために設計された大規模高忠実な合成データセットであるSimD3を紹介する。
既存の合成ドローンデータセットとは異なり、SimD3は異質なペイロードでドローンをモデル化し、複数の鳥種をリアルな邪魔者として取り込んでおり、様々なUnreal Engine 5環境を利用して、360度6カメラのリグで捉えた天候、照明、飛行軌道を制御している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable drone detection is challenging due to limited annotated real-world data, large appearance variability, and the presence of visually similar distractors such as birds. To address these challenges, this paper introduces SimD3, a large-scale high-fidelity synthetic dataset designed for robust drone detection in complex aerial environments. Unlike existing synthetic drone datasets, SimD3 explicitly models drones with heterogeneous payloads, incorporates multiple bird species as realistic distractors, and leverages diverse Unreal Engine 5 environments with controlled weather, lighting, and flight trajectories captured using a 360 six-camera rig. Using SimD3, we conduct an extensive experimental evaluation within the YOLOv5 detection framework, including an attention-enhanced variant termed Yolov5m+C3b, where standard bottleneck-based C3 blocks are replaced with C3b modules. Models are evaluated on synthetic data, combined synthetic and real data, and multiple unseen real-world benchmarks to assess robustness and generalization. Experimental results show that SimD3 provides effective supervision for small-object drone detection and that Yolov5m+C3b consistently outperforms the baseline across in-domain and cross-dataset evaluations. These findings highlight the utility of SimD3 for training and benchmarking robust drone detection models under diverse and challenging conditions.
- Abstract(参考訳): 信頼性の高いドローン検出は、注釈付き現実世界のデータに制限があり、外観の多様性が大きく、鳥のような視覚的に類似した障害物が存在するため、困難である。
これらの課題に対処するために,複雑な大気環境下でのロバストなドローン検出のために設計された大規模高忠実な合成データセットであるSimD3を紹介する。
既存の合成ドローンデータセットとは異なり、SimD3は異質なペイロードでドローンをモデル化し、複数の鳥種をリアルな邪魔者として取り込んでおり、様々なUnreal Engine 5環境を利用して、360度6カメラのリグで捉えた天候、照明、飛行軌道を制御している。
SimD3を用いることで、標準的なボトルネックベースのC3ブロックをC3bモジュールに置き換える、Yolov5m+C3bと呼ばれる注目度の高い変種を含む、YOLOv5検出フレームワーク内で広範囲な実験的評価を行う。
モデルは、合成データ、合成データと実データの組み合わせ、およびロバスト性と一般化を評価するために、複数の見えない実世界のベンチマークに基づいて評価される。
実験結果から,SimD3は小物体のドローン検出に効果的な監視を提供し,Yolov5m+C3bはドメイン内およびデータセット間の評価において一貫してベースラインを上回っていることがわかった。
これらの知見は、多様で困難な条件下でロバストなドローン検出モデルをトレーニングし、ベンチマークするためのSimD3の有用性を強調している。
関連論文リスト
- UAV-MM3D: A Large-Scale Synthetic Benchmark for 3D Perception of Unmanned Aerial Vehicles with Multi-Modal Data [47.317955428393134]
UAV-MM3Dは,低高度UAV知覚と動作理解のための多モード合成データセットである。
様々なシーン(都市部、郊外部、森林部、沿岸部)と気象条件にまたがる400Kの同期フレームで構成されている。
各フレームは2D/3Dバウンディングボックス、6-DoFのポーズ、インスタンスレベルのアノテーションを提供し、3D検出、ポーズ推定、ターゲット追跡、短期軌道予測などのUAVに関連するコアタスクを可能にする。
論文 参考訳(メタデータ) (2025-11-27T12:30:28Z) - JiSAM: Alleviate Labeling Burden and Corner Case Problems in Autonomous Driving via Minimal Real-World Data [49.2298619289506]
本稿では,ジッタリング強化,ドメイン認識バックボーン,メモリに基づくセクタライズAlignMentのためのJiSAMというプラグイン・アンド・プレイ手法を提案する。
有名なADデータセットであるNuScenesで実施された広範な実験において、SOTA 3Dオブジェクト検出器を用いて、JiSAMはシミュレーションデータと2.5%の実データにラベルを付けるだけで、実データで訓練されたモデルに匹敵する性能が得られることを示した。
論文 参考訳(メタデータ) (2025-03-11T13:35:39Z) - Digital twins to alleviate the need for real field data in vision-based vehicle speed detection systems [0.9899633398596672]
正確な視覚に基づく速度推定は、レーダーやLiDARに基づく従来の手法よりもコスト効率が高い。
ディープラーニングのアプローチは、利用可能なデータがないため、このコンテキストでは極めて限定的です。
本研究では,CARLAシミュレータを用いたデジタルツインを用いて,特定の実世界のカメラの大規模なデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-11T10:41:20Z) - TransVisDrone: Spatio-Temporal Transformer for Vision-based
Drone-to-Drone Detection in Aerial Videos [57.92385818430939]
視覚的フィードを用いたドローンからドローンへの検知は、ドローンの衝突の検出、ドローンの攻撃の検出、他のドローンとの飛行の調整など、重要な応用がある。
既存の手法は計算コストがかかり、非エンドツーエンドの最適化に追随し、複雑なマルチステージパイプラインを持つため、エッジデバイス上でのリアルタイムデプロイメントには適さない。
計算効率を向上したエンドツーエンドのソリューションを提供する,シンプルで効果的なフレームワークであるitTransVisDroneを提案する。
論文 参考訳(メタデータ) (2022-10-16T03:05:13Z) - Aerial Monocular 3D Object Detection [67.20369963664314]
DVDETは2次元画像空間と3次元物理空間の両方で空中単分子3次元物体検出を実現するために提案される。
高度視差変形問題に対処するため,新しい測地変形変換モジュールを提案する。
より多くの研究者がこの領域を調査するよう促すため、データセットと関連するコードをリリースします。
論文 参考訳(メタデータ) (2022-08-08T08:32:56Z) - Sequence Models for Drone vs Bird Classification [2.294014185517203]
ドローンのコストが減少し、ドローン技術が向上するにつれ、ドローン検出はオブジェクト検出において重要な課題となっている。
コントラストが弱く、距離が長く、視界が低い場合、遠方のドローンを検知することは困難である。
検出されたドローントラックの偽陽性比を低減するために,いくつかのシーケンス分類アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-07-21T11:00:44Z) - Transferable Active Grasping and Real Embodied Dataset [48.887567134129306]
ハンドマウント型RGB-Dカメラを用いて把握可能な視点を探索する方法を示す。
現実的な3段階の移動可能な能動把握パイプラインを開発し、未確認のクラッタシーンに適応する。
本研究のパイプラインでは,カテゴリ非関連行動の把握と確保において,スパース報酬問題を克服するために,新しいマスク誘導報酬を提案する。
論文 参考訳(メタデータ) (2020-04-28T08:15:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。