論文の概要: TFDet: Target-aware Fusion for RGB-T Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2305.16580v2
- Date: Mon, 18 Sep 2023 08:27:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 23:38:05.727988
- Title: TFDet: Target-aware Fusion for RGB-T Pedestrian Detection
- Title(参考訳): TFDet:RGB-Tペデストリアン検出のためのターゲット認識融合
- Authors: Xue Zhang, Xiaohan Zhang, Zehua Sheng, and Hui-Liang Shen
- Abstract要約: TFDet と呼ばれる多スペクトル歩行者検出のための新しい目標認識融合戦略を提案する。
我々の融合戦略は、歩行者関連の特徴を強調しながら、無関係な特徴を抑え、より差別的な融合特徴をもたらす。TFDetは、KAISTとLLVIPベンチマークの両方で最先端のパフォーマンスを達成し、従来の最先端のものと同等の効率性を持つ。
- 参考スコア(独自算出の注目度): 18.57345502755969
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Pedestrian detection plays a critical role in computer vision as it
contributes to ensuring traffic safety. Existing methods that rely solely on
RGB images suffer from performance degradation under low-light conditions due
to the lack of useful information. To address this issue, recent multispectral
detection approaches have combined thermal images to provide complementary
information and have obtained enhanced performances. Nevertheless, few
approaches focus on the negative effects of false positives caused by noisy
fused feature maps. Different from them, we comprehensively analyze the impacts
of false positives on the detection performance and find that enhancing feature
contrast can significantly reduce these false positives. In this paper, we
propose a novel target-aware fusion strategy for multispectral pedestrian
detection, named TFDet. Our fusion strategy highlights the pedestrian-related
features while suppressing unrelated ones, resulting in more discriminative
fused features. TFDet achieves state-of-the-art performance on both KAIST and
LLVIP benchmarks, with an efficiency comparable to the previous
state-of-the-art counterpart. Importantly, TFDet performs remarkably well even
under low-light conditions, which is a significant advancement for ensuring
road safety. The code will be made publicly available at
\url{https://github.com/XueZ-phd/TFDet.git}.
- Abstract(参考訳): 歩行者検出は、交通安全の確保に寄与するため、コンピュータビジョンにおいて重要な役割を果たす。
RGB画像のみに依存する既存の手法は、有用な情報がないため、低照度条件下での性能劣化に悩まされる。
この問題に対処するため、近年のマルチスペクトル検出手法では、熱画像を組み合わせて補完情報を提供し、性能の向上が図られている。
それにもかかわらず、ノイズの多い特徴マップによって引き起こされる偽陽性の悪影響に焦点を当てるアプローチはほとんどない。
それらと異なるのは,偽陽性が検出性能に与える影響を包括的に分析し,特徴コントラストの強化によってこれらの偽陽性を著しく低減できることを見出した。
本稿では,TFDet と呼ばれる多スペクトル歩行者検出のための新たな目標対応融合戦略を提案する。
我々の融合戦略は歩行者関連機能を強調しながら非関連機能を抑制する。
TFDet は KAIST と LLVIP のベンチマークで最先端のパフォーマンスを実現している。
重要なこととして、TFDetは低照度条件下でも著しく性能が良く、道路安全を確保するための重要な進歩である。
コードは \url{https://github.com/XueZ-phd/TFDet.git} で公開されている。
関連論文リスト
- SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - ReDFeat: Recoupling Detection and Description for Multimodal Feature
Learning [51.07496081296863]
我々は、相互重み付け戦略による多モーダル特徴学習の検出と記述の独立した制約を再定義する。
本研究では,大きな受容場を有し,学習可能な非最大抑制層を備える検出器を提案する。
我々は,特徴マッチングと画像登録タスクにおける特徴量を評価するために,クロス可視,赤外線,近赤外,合成開口レーダ画像ペアを含むベンチマークを構築した。
論文 参考訳(メタデータ) (2022-05-16T04:24:22Z) - Target-aware Dual Adversarial Learning and a Multi-scenario
Multi-Modality Benchmark to Fuse Infrared and Visible for Object Detection [65.30079184700755]
本研究は、物体検出のために異なるように見える赤外線と可視画像の融合の問題に対処する。
従来のアプローチでは、2つのモダリティの根底にある共通点を発見し、反復最適化またはディープネットワークによって共通空間に融合する。
本稿では、融合と検出の連立問題に対する二段階最適化の定式化を提案し、その後、核融合と一般的に使用される検出ネットワークのためのターゲット認識デュアル逆学習(TarDAL)ネットワークに展開する。
論文 参考訳(メタデータ) (2022-03-30T11:44:56Z) - Benchmarking Deep Models for Salient Object Detection [67.07247772280212]
汎用SALOD(General SALient Object Detection)ベンチマークを構築し,複数のSOD手法の総合的な比較を行った。
以上の実験では、既存の損失関数は、通常いくつかの指標に特化しているが、他の指標には劣る結果が報告されている。
我々は,深層ネットワークに画素レベルと画像レベルの両方の監視信号を統合することにより,より識別的な特徴を学習するためのエッジ・アウェア・ロス(EA)を提案する。
論文 参考訳(メタデータ) (2022-02-07T03:43:16Z) - Illumination and Temperature-Aware Multispectral Networks for
Edge-Computing-Enabled Pedestrian Detection [10.454696553567809]
本研究は,高精度かつ効率的な歩行者検出のための軽量照明・温度対応マルチスペクトルネットワーク(IT-MN)を提案する。
提案アルゴリズムは、車載カメラで収集した公開データセットを用いて、選択した最先端アルゴリズムと比較して評価する。
提案アルゴリズムは,GPU上の画像ペアあたり14.19%,0.03秒の低ミス率と推論時間を実現する。
論文 参考訳(メタデータ) (2021-12-09T17:27:23Z) - Multimodal Object Detection via Bayesian Fusion [59.31437166291557]
我々は、RGBとサーマルカメラでマルチモーダルオブジェクト検出を研究します。後者は照明不良下ではるかに強力なオブジェクトシグネチャを提供することができます。
我々の重要な貢献は、異なるモードのボックス検出を融合する非学習遅延融合法である。
このアプローチは、整列(KAIST)と非整列(FLIR)のマルチモーダルセンサーデータを含むベンチマークに適用されます。
論文 参考訳(メタデータ) (2021-04-07T04:03:20Z) - Robust Correlation Tracking via Multi-channel Fused Features and
Reliable Response Map [10.079856376445598]
本稿では,2つのアイデアに基づく頑健な相関追跡アルゴリズム(RCT)を提案する。
まず,追跡対象の勾配や色情報をより自然に記述するために,特徴を融合する手法を提案する。
第二に、応答マップにおけるノイズを著しく低減し、従ってモデルドリフトの問題を緩和する新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-11-25T07:15:03Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。