論文の概要: Thermal-Infrared Remote Target Detection System for Maritime Rescue
based on Data Augmentation with 3D Synthetic Data
- arxiv url: http://arxiv.org/abs/2310.20412v1
- Date: Tue, 31 Oct 2023 12:37:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 15:22:03.062926
- Title: Thermal-Infrared Remote Target Detection System for Maritime Rescue
based on Data Augmentation with 3D Synthetic Data
- Title(参考訳): 3次元合成データを用いたデータ拡張に基づく海上救助のための熱赤外リモートターゲット検出システム
- Authors: Sungjin Cheong, Wonho Jung, Yoon Seop Lim, Yong-Hwa Park
- Abstract要約: 本稿では,深層学習とデータ拡張を用いた海難救助のための熱赤外(TIR)遠隔目標検出システムを提案する。
データセットの不足に対処し、モデルの堅牢性を改善するために、3Dゲーム(ARMA3)からの合成データセットを収集する。
提案したセグメンテーションモデルは,最先端セグメンテーション手法の性能を上回る。
- 参考スコア(独自算出の注目度): 4.66313002591741
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper proposes a thermal-infrared (TIR) remote target detection system
for maritime rescue using deep learning and data augmentation. We established a
self-collected TIR dataset consisting of multiple scenes imitating human rescue
situations using a TIR camera (FLIR). Additionally, to address dataset scarcity
and improve model robustness, a synthetic dataset from a 3D game (ARMA3) to
augment the data is further collected. However, a significant domain gap exists
between synthetic TIR and real TIR images. Hence, a proper domain adaptation
algorithm is essential to overcome the gap. Therefore, we suggest a domain
adaptation algorithm in a target-background separated manner from 3D
game-to-real, based on a generative model, to address this issue. Furthermore,
a segmentation network with fixed-weight kernels at the head is proposed to
improve the signal-to-noise ratio (SNR) and provide weak attention, as remote
TIR targets inherently suffer from unclear boundaries. Experiment results
reveal that the network trained on augmented data consisting of translated
synthetic and real TIR data outperforms that trained on only real TIR data by a
large margin. Furthermore, the proposed segmentation model surpasses the
performance of state-of-the-art segmentation methods.
- Abstract(参考訳): 本稿では,深層学習とデータ拡張を用いた海難救助のための熱赤外リモートターゲット検出システムを提案する。
我々は、TIRカメラ(FLIR)を用いて、人間の救助状況を模倣した複数のシーンからなる自己収集TIRデータセットを構築した。
さらに、データセットの不足に対処し、モデルロバスト性を向上させるため、3dゲーム(arma3)からの合成データセットをさらに収集する。
しかし、合成TIR画像と実際のTIR画像の間には大きな領域ギャップが存在する。
したがって、ギャップを克服するには適切なドメイン適応アルゴリズムが不可欠である。
そこで本研究では,この問題に対処するために,生成モデルに基づく3次元ゲームからリアルまでの領域適応アルゴリズムを提案する。
さらに,頭部に固定ウェイトカーネルを持つセグメンテーションネットワークを提案し,信号対雑音比(signal-to-noise ratio,snr)を改善し,遠隔tirターゲットが本質的に不明瞭な境界に苦しむため,注意力の低下を図る。
実験の結果,翻訳されたTIRデータと実際のTIRデータからなる拡張データに基づいてトレーニングされたネットワークは,実際のTIRデータのみを大きなマージンでトレーニングした上で,優れた性能を示した。
さらに,提案手法は最先端セグメンテーション法の性能を上回っている。
関連論文リスト
- Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Tensor Factorization for Leveraging Cross-Modal Knowledge in
Data-Constrained Infrared Object Detection [22.60228799622782]
赤外線画像における物体検出のボトルネックは、十分なラベル付きトレーニングデータがないことである。
我々は、RGBモードにおけるモデル性能を保ちながら、RGBモードからオブジェクト検出器をIRモードにスケールするために、RGBモードからの手がかりを活用しようとしている。
まず、これらの因子行列をRGBモードで事前トレーニングし、多くのトレーニングデータが存在すると仮定した後、IRモードでトレーニングするためのトレーニング可能なパラメータをわずかに増やして過度な適合を避ける。
論文 参考訳(メタデータ) (2023-09-28T16:55:52Z) - Point-aware Interaction and CNN-induced Refinement Network for RGB-D
Salient Object Detection [95.84616822805664]
我々は,CNNによるトランスフォーマーアーキテクチャを導入し,ポイント・アウェア・インタラクションとCNNによるリファインメントを備えた新しいRGB-D SODネットワークを提案する。
トランスフォーマーがもたらすブロック効果とディテール破壊問題を自然に軽減するために,コンテンツリファインメントとサプリメントのためのCNNRユニットを設計する。
論文 参考訳(メタデータ) (2023-08-17T11:57:49Z) - Human Semantic Segmentation using Millimeter-Wave Radar Sparse Point
Clouds [3.3888257250564364]
本稿では,ミリ波レーダの粗い逐次点雲のセマンティックセグメンテーションのためのフレームワークを提案する。
mmWaveデータの空間的特徴と時間的トポロジ的特徴は依然として問題である。
グラフ構造とトポロジ的特徴をポイントクラウドに導入し,セマンティックセグメンテーションフレームワークを提案する。
我々のモデルは、$mathbf82.31%$でカスタムデータセットの平均精度を達成し、最先端のアルゴリズムより優れている。
論文 参考訳(メタデータ) (2023-04-27T12:28:06Z) - ChiNet: Deep Recurrent Convolutional Learning for Multimodal Spacecraft
Pose Estimation [3.964047152162558]
本稿では,ランデブーシーケンスからの時間情報を組み込んで,宇宙船の相対的な姿勢を推定する革新的な深層学習パイプラインを提案する。
畳み込みニューラルネットワーク(CNN)バックボーンによって抽出された特徴の処理のために、データのシーケンスをモデル化する上で、LSTM(Long Short-term memory)ユニットのパフォーマンスを活用する。
3つの異なるトレーニング戦略が組み合わさって、特徴学習を容易にし、回帰によるエンドツーエンドのポーズ推定を改善する。
論文 参考訳(メタデータ) (2021-08-23T16:48:58Z) - Deep Cellular Recurrent Network for Efficient Analysis of Time-Series
Data with Spatial Information [52.635997570873194]
本研究では,空間情報を用いた複雑な多次元時系列データを処理するための新しいディープセルリカレントニューラルネットワーク(DCRNN)アーキテクチャを提案する。
提案するアーキテクチャは,文献に比較して,学習可能なパラメータをかなり少なくしつつ,最先端の性能を実現している。
論文 参考訳(メタデータ) (2021-01-12T20:08:18Z) - ePointDA: An End-to-End Simulation-to-Real Domain Adaptation Framework
for LiDAR Point Cloud Segmentation [111.56730703473411]
LiDARデータ上でディープニューラルネットワーク(DNN)をトレーニングするには、大規模なポイントワイドアノテーションが必要である。
シミュレーション・トゥ・リアル・ドメイン適応(SRDA)は、DNNを無制限の合成データと自動生成されたラベルで訓練する。
ePointDAは、自己教師付きドロップアウトノイズレンダリング、統計不変および空間適応型特徴アライメント、転送可能なセグメンテーション学習の3つのモジュールで構成されている。
論文 参考訳(メタデータ) (2020-09-07T23:46:08Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z) - Unsupervised Domain Adaptation through Inter-modal Rotation for RGB-D
Object Recognition [31.24587317555857]
本稿では,RGBと深度画像のモーダル間関係を利用して,合成領域から実領域へのシフトを低減する新しいRGB-D DA法を提案する。
提案手法は,主認識タスクに加えて,RGBと深度画像の相対的回転を予測するプリテキストタスクである畳み込みニューラルネットワークを訓練することで解決する。
論文 参考訳(メタデータ) (2020-04-21T13:53:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。