論文の概要: Robust pedestrian detection in thermal imagery using synthesized images
- arxiv url: http://arxiv.org/abs/2102.02005v1
- Date: Wed, 3 Feb 2021 11:08:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-04 17:25:39.504092
- Title: Robust pedestrian detection in thermal imagery using synthesized images
- Title(参考訳): 合成画像を用いた熱画像中のロバスト歩行者検出
- Authors: My Kieu, Lorenzo Berlincioni, Leonardo Galteri, Marco Bertini, Andrew
D. Bagdanov, Alberto Del Bimbo
- Abstract要約: 熱領域における歩行者検出を2段階に分けて改善する手法を提案する。
まず、生成データ拡張アプローチを使用し、次いで、生成されたデータを用いたドメイン適応法は、RGB歩行者検出器に適応する。
我々の検出器は,最先端技術に関して,KAIST上で最高の単一モダリティ検出結果を達成する。
- 参考スコア(独自算出の注目度): 39.33977680993236
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In this paper we propose a method for improving pedestrian detection in the
thermal domain using two stages: first, a generative data augmentation approach
is used, then a domain adaptation method using generated data adapts an RGB
pedestrian detector. Our model, based on the Least-Squares Generative
Adversarial Network, is trained to synthesize realistic thermal versions of
input RGB images which are then used to augment the limited amount of labeled
thermal pedestrian images available for training. We apply our generative data
augmentation strategy in order to adapt a pretrained YOLOv3 pedestrian detector
to detection in the thermal-only domain. Experimental results demonstrate the
effectiveness of our approach: using less than 50\% of available real thermal
training data, and relying on synthesized data generated by our model in the
domain adaptation phase, our detector achieves state-of-the-art results on the
KAIST Multispectral Pedestrian Detection Benchmark; even if more real thermal
data is available adding GAN generated images to the training data results in
improved performance, thus showing that these images act as an effective form
of data augmentation. To the best of our knowledge, our detector achieves the
best single-modality detection results on KAIST with respect to the
state-of-the-art.
- Abstract(参考訳): 本論文では,熱領域における歩行者検出を改善する方法として,第1段階では,生成データを用いた領域適応手法を用いて,RGB歩行者検出器を適応させる手法を提案する。
我々のモデルは,Last-Squares Generative Adversarial Networkをベースとして,入力されたRGB画像のリアルな熱バージョンを合成し,ラベル付き熱歩行者画像の限られた量をトレーニングに用いるように訓練されている。
我々は,前訓練されたyolov3歩行者検出器を熱のみ領域に適応させるために,生成的データ拡張戦略を適用する。
実験により,本手法の有効性が示された: 実測熱データのうち50%未満を使用でき, ドメイン適応段階でモデルによって生成された合成データに頼って, KAISTマルチスペクトルペデストリアン検出ベンチマークにおいて, 実測熱データが利用可能であっても, GAN 生成した画像がトレーニングデータに付加されて, 性能が向上し, これらの画像がデータ拡張の有効な形態として機能することを示す。
我々の知る限り、我々の検出器は、最先端技術に関して、KAIST上で最高の単一モダリティ検出結果を達成する。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Toward Data-Driven STAP Radar [23.333816677794115]
我々は、時空間適応処理(STAP)レーダーに対するデータ駆動アプローチを特徴付ける。
所定領域に可変強度のターゲットをランダムに配置することにより、受信レーダ信号の豊富なサンプルデータセットを生成する。
この領域内の各データサンプルに対して、ビームフォーマの出力パワーのレンジ、方位、および上昇のヒートマップテンソルを生成する。
空中に浮かぶシナリオでは、動くレーダーは、ビデオに似た、これらのタイムインデクシングされたイメージスタックのシーケンスを生成する。
論文 参考訳(メタデータ) (2022-01-26T02:28:13Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - Object Detection in Thermal Spectrum for Advanced Driver-Assistance
Systems (ADAS) [0.5156484100374058]
熱赤外スペクトルにおける物体検出は、低照度条件と異なる気象条件においてより信頼性の高いデータソースを提供する。
本稿では,高度運転支援システム(ADAS)の7つの異なるクラスを用いたサーマルビジョンにおける最先端のオブジェクト・ビジョン・フレームワークの探索と適用について述べる。
公開データセット上のトレーニング済みネットワーク変種は、3つの異なるテストアプローチでテストデータ上で検証される。
訓練されたネットワークの有効性は、未冷却のLWIRプロトタイプ熱カメラで捉えたローカル収集された新しいテストデータで検証される。
論文 参考訳(メタデータ) (2021-09-20T21:38:55Z) - Can Synthetic Data Improve Object Detection Results for Remote Sensing
Images? [15.466412729455874]
本稿では,リモートセンシング画像航空機検出の性能向上のために,広域分布のリアルな合成データの利用を提案する。
レンダリング中に、インスタンスのサイズや背景画像のクラスなど、パラメータをランダムに設定します。
合成画像をよりリアルにするために,CycleGANと実際の未ラベル画像を用いて,画素レベルで合成画像を洗練する。
論文 参考訳(メタデータ) (2020-06-09T02:23:22Z) - Exploring Thermal Images for Object Detection in Underexposure Regions
for Autonomous Driving [67.69430435482127]
アンダーエクスポージャー地域は、安全な自動運転のための周囲の完全な認識を構築するのに不可欠である。
サーマルカメラが利用可能になったことで、他の光学センサーが解釈可能な信号を捉えていない地域を探索するための重要な代替手段となった。
本研究は,可視光画像から熱画像へ学習を伝達するためのスタイル伝達手法を用いたドメイン適応フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-01T09:59:09Z) - Unsupervised Image-generation Enhanced Adaptation for Object Detection
in Thermal images [4.810743887667828]
本稿では、熱画像における物体検出のための教師なし画像生成拡張適応法を提案する。
可視領域と熱領域のギャップを低減するため,提案手法は擬似熱画像を生成する。
提案手法の有効性と優位性を示す実験を行った。
論文 参考訳(メタデータ) (2020-02-17T04:53:30Z) - Radioactive data: tracing through training [130.2266320167683]
本稿では,このデータセットに認識不能な変化を生じさせる新しい手法であるEmphradioactive dataを提案する。
訓練されたモデルにより, 放射能データの利用を検知し, 信頼度(p-値)のレベルを提供する。
提案手法はディープネットワーク最適化におけるデータ拡張とバックドア性に対して堅牢である。
論文 参考訳(メタデータ) (2020-02-03T18:41:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。