論文の概要: Enhancing Maritime Object Detection in Real-Time with RT-DETR and Data Augmentation
- arxiv url: http://arxiv.org/abs/2510.07346v1
- Date: Tue, 07 Oct 2025 20:45:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.630587
- Title: Enhancing Maritime Object Detection in Real-Time with RT-DETR and Data Augmentation
- Title(参考訳): RT-DETRとデータ拡張によるリアルタイム海事物体検出の高速化
- Authors: Nader Nemati,
- Abstract要約: リアルタイムオブジェクト検出は、ラベル付き実RGBデータのターゲットサイズと制限が小さいため、重要な課題に直面している。
本稿では,RT-DETRに基づくリアルタイム物体検出システムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Maritime object detection faces essential challenges due to the small target size and limitations of labeled real RGB data. This paper will present a real-time object detection system based on RT-DETR, enhanced by employing augmented synthetic images while strictly evaluating on real data. This study employs RT-DETR for the maritime environment by combining multi-scale feature fusion, uncertainty-minimizing query selection, and smart weight between synthetic and real training samples. The fusion module in DETR enhances the detection of small, low-contrast vessels, query selection focuses on the most reliable proposals, and the weighting strategy helps reduce the visual gap between synthetic and real domains. This design preserves DETR's refined end-to-end set prediction while allowing users to adjust between speed and accuracy at inference time. Data augmentation techniques were also used to balance the different classes of the dataset to improve the robustness and accuracy of the model. Regarding this study, a full Python robust maritime detection pipeline is delivered that maintains real-time performance even under practical limits. It also verifies how each module contributes, and how the system handles failures in extreme lighting or sea conditions. This study also includes a component analysis to quantify the contribution of each architectural module and explore its interactions.
- Abstract(参考訳): リアルタイムオブジェクト検出は、ラベル付き実RGBデータのターゲットサイズと制限が小さいため、重要な課題に直面している。
本稿では,RT-DETRに基づくリアルタイム物体検出システムを提案する。
本研究では,マルチスケールな特徴融合,不確実性最小化クエリ選択,および合成と実のトレーニングサンプル間のスマートウェイトを組み合わせたRT-DETRを海洋環境に適用した。
DETRの融合モジュールは、小さくて低コントラストな容器の検出を強化し、クエリの選択は最も信頼性の高い提案に焦点を当て、重み付け戦略は合成ドメインと実際のドメインの間の視覚的ギャップを減らすのに役立つ。
この設計はDETRの洗練されたエンドツーエンドのセット予測を保存し、ユーザーは推論時に速度と精度を調整できる。
データ拡張技術は、モデルの堅牢性と正確性を改善するために、データセットの異なるクラスのバランスをとるためにも使用された。
この研究に関して、実用的な制限の下でもリアルタイムのパフォーマンスを維持する、完全なPython堅牢な海洋検出パイプラインが提供される。
また、各モジュールがどのように貢献するか、システムが過度な照明や海洋条件で障害に対処するかも検証する。
この研究には、各アーキテクチャモジュールのコントリビューションを定量化し、その相互作用を探索するコンポーネント分析も含まれる。
関連論文リスト
- FishDet-M: A Unified Large-Scale Benchmark for Robust Fish Detection and CLIP-Guided Model Selection in Diverse Aquatic Visual Domains [1.3791394805787949]
FishDet-Mは、様々な水生環境にまたがる13の公開データセットを含む、魚検出のための最大の統一されたベンチマークである。
すべてのデータは、境界ボックスとセグメンテーションマスクの両方を持つCOCOスタイルのアノテーションを使用して調和する。
FishDet-Mは、複雑な水シーンにおけるオブジェクト検出を評価するための標準化され再現可能なプラットフォームを確立する。
論文 参考訳(メタデータ) (2025-07-23T18:32:01Z) - YOLOatr : Deep Learning Based Automatic Target Detection and Localization in Thermal Infrared Imagery [0.0]
そこで我々は, YOLOatrと呼ばれるアンカー型単段検出器を改良し, 検出ヘッドを最適に修正し, 首の核融合, カスタム拡張プロファイルを提案する。
相関テストプロトコルと非相関テストプロトコルの両方を用いたリアルタイムATRのための総合的DSIAC MWIRデータセットの性能評価を行った。
論文 参考訳(メタデータ) (2025-07-15T12:41:01Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Improved LiDAR Odometry and Mapping using Deep Semantic Segmentation and
Novel Outliers Detection [1.0334138809056097]
高速移動プラットフォームのためのLOAMアーキテクチャに基づくリアルタイムLiDARオドメトリーとマッピングのための新しいフレームワークを提案する。
本フレームワークは,ディープラーニングモデルによって生成された意味情報を用いて,ポイント・ツー・ラインとポイント・ツー・プレーンのマッチングを改善する。
高速動作に対するLiDARオドメトリーのロバスト性に及ぼすマッチング処理の改善効果について検討した。
論文 参考訳(メタデータ) (2024-03-05T16:53:24Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Thermal-Infrared Remote Target Detection System for Maritime Rescue
based on Data Augmentation with 3D Synthetic Data [4.66313002591741]
本稿では,深層学習とデータ拡張を用いた海難救助のための熱赤外(TIR)遠隔目標検出システムを提案する。
データセットの不足に対処し、モデルの堅牢性を改善するために、3Dゲーム(ARMA3)からの合成データセットを収集する。
提案したセグメンテーションモデルは,最先端セグメンテーション手法の性能を上回る。
論文 参考訳(メタデータ) (2023-10-31T12:37:49Z) - Learning IMM Filter Parameters from Measurements using Gradient Descent [45.335821132209766]
トラック下のターゲットの固有のパラメータは、システムがデプロイされるまで完全に観測不可能である。
最先端のセンサーシステムはますます複雑になり、パラメータの数が自然に増加する。
本稿では,対話型多重モデル (IMM) フィルタのパラメータを計測のみで最適化する。
論文 参考訳(メタデータ) (2023-07-13T08:35:40Z) - Unseen Object Instance Segmentation with Fully Test-time RGB-D
Embeddings Adaptation [14.258456366985444]
最近では、大規模な合成データのRGB-D機能を活用し、実世界のシナリオにモデルを適用するのが一般的である。
本稿では,Sim2Realドメイン間の適応プロセスを再強調する。
本稿では,BatchNorm層のパラメータに基づいて,完全テスト時間RGB-D埋め込み適応(FTEA)を行うフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-21T02:35:20Z) - Neural BRDF Representation and Importance Sampling [79.84316447473873]
本稿では,リフレクタンスBRDFデータのコンパクトニューラルネットワークに基づく表現について述べる。
BRDFを軽量ネットワークとしてエンコードし、適応角サンプリングによるトレーニングスキームを提案する。
複数の実世界のデータセットから等方性および異方性BRDFの符号化結果を評価する。
論文 参考訳(メタデータ) (2021-02-11T12:00:24Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。