論文の概要: DINF: Dynamic Instance Noise Filter for Occluded Pedestrian Detection
- arxiv url: http://arxiv.org/abs/2301.05565v1
- Date: Fri, 13 Jan 2023 14:12:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 14:53:24.433799
- Title: DINF: Dynamic Instance Noise Filter for Occluded Pedestrian Detection
- Title(参考訳): DINF:Occluded Pedestrian Detectionのための動的インスタンスノイズフィルタ
- Authors: Li Xiang, He Miao, Luo Haibo, Xiao Jiajie
- Abstract要約: RCNNベースの歩行者検出器は、矩形領域を使用してインスタンスの特徴を抽出する。
重なり合うオブジェクトの数とわずかに重なり合うオブジェクトの数は不均衡である。
RCNNをベースとした歩行者検知器の信号雑音比を改善するために, 繰り返し動的インスタンスノイズフィルタ (DINF) を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Occlusion issue is the biggest challenge in pedestrian detection. RCNN-based
detectors extract instance features by cropping rectangle regions of interest
in the feature maps. However, the visible pixels of the occluded objects are
limited, making the rectangle instance feature mixed with a lot of
instance-irrelevant noise information. Besides, by counting the number of
instances with different degrees of overlap of CrowdHuman dataset, we find that
the number of severely overlapping objects and the number of slightly
overlapping objects are unbalanced, which may exacerbate the challenges posed
by occlusion issues. Regarding to the noise issue, from the perspective of
denoising, an iterable dynamic instance noise filter (DINF) is proposed for the
RCNN-based pedestrian detectors to improve the signal-noise ratio of the
instance feature. Simulating the wavelet denoising process, we use the instance
feature vector to generate dynamic convolutional kernels to transform the RoIs
features to a domain in which the near-zero values represent the noise
information. Then, soft thresholding with channel-wise adaptive thresholds is
applied to convert the near-zero values to zero to filter out noise
information. For the imbalance issue, we propose an IoU-Focal factor (IFF) to
modulate the contributions of the well-regressed boxes and the bad-regressed
boxes to the loss in the training process, paying more attention to the
minority severely overlapping objects. Extensive experiments conducted on
CrowdHuman and CityPersons demonstrate that our methods can help RCNN-based
pedestrian detectors achieve state-of-the-art performance.
- Abstract(参考訳): 閉塞問題は歩行者検出における最大の課題である。
rcnnベースの検出器は、特徴マップに興味のある長方形領域を切り刻んでインスタンスの特徴を抽出する。
しかし、オクルードされたオブジェクトの可視画素は限られており、矩形インスタンスには多くのインスタンス関係のノイズ情報が混ざっている。
また,クラウドヒューマンデータセットの重複度が異なるインスタンス数を数えることで,重なり合うオブジェクト数と若干重なり合うオブジェクト数がバランスが取れないことがわかり,閉塞問題による課題を悪化させる可能性がある。
ノイズ問題に関しては,雑音特性の信号・雑音比を改善するため,rcnnを用いた歩行者検出装置において,雑音除去の観点からイテレーブル動的インスタンスノイズフィルタ(dinf)を提案する。
ウェーブレット除算プロセスをシミュレートし、インスタンス特徴ベクトルを用いて動的畳み込みカーネルを生成し、rois特徴をノイズ情報を表すゼロに近い値の領域に変換する。
次に、チャネルワイド適応閾値のソフトしきい値を適用して、近ゼロ値をゼロに変換し、ノイズ情報をフィルタリングする。
不均衡問題として、トレーニングプロセスにおける損失に対して、よく回帰したボックスと悪い回帰したボックスの貢献を調節するIoU-Focal Factor(IFF)を提案する。
CrowdHumanとCityPersonsで実施された大規模な実験は、我々の手法がRCNNベースの歩行者検知器の最先端の性能向上に役立つことを示した。
関連論文リスト
- DenoDet: Attention as Deformable Multi-Subspace Feature Denoising for Target Detection in SAR Images [20.11145540094807]
本稿では、畳み込みバイアスを校正し、高周波により多くの注意を払うために、明示的な周波数領域変換によって支援されるネットワークを提案する。
変換領域ソフトしきい値処理を行う動的周波数領域アテンションモジュールであるTransDenoを設計する。
プラグアンドプレイのTransDenoは、複数のSARターゲット検出データセットに対して最先端のスコアを設定する。
論文 参考訳(メタデータ) (2024-06-05T01:05:26Z) - Robust Tiny Object Detection in Aerial Images amidst Label Noise [50.257696872021164]
本研究は,ノイズラベル管理下での微小物体検出の問題に対処する。
本稿では,DN-TOD(Denoising Tiny Object Detector)を提案する。
本手法は,1段と2段の両方のオブジェクト検出パイプラインにシームレスに統合できる。
論文 参考訳(メタデータ) (2024-01-16T02:14:33Z) - DeNoising-MOT: Towards Multiple Object Tracking with Severe Occlusions [52.63323657077447]
DNMOTは、複数のオブジェクト追跡のためのエンドツーエンドのトレーニング可能なDeNoising Transformerである。
具体的には、トレーニング中にノイズを伴って軌道を拡大し、エンコーダ・デコーダアーキテクチャのデノイング過程をモデルに学習させる。
我々はMOT17,MOT20,DanceTrackのデータセットについて広範な実験を行い,実験結果から,提案手法が従来の最先端手法よりも明確なマージンで優れていることが示された。
論文 参考訳(メタデータ) (2023-09-09T04:40:01Z) - Advancing Unsupervised Low-light Image Enhancement: Noise Estimation, Illumination Interpolation, and Self-Regulation [55.07472635587852]
低光画像強調(LLIE)技術は、画像の詳細の保存とコントラストの強化に顕著な進歩をもたらした。
これらのアプローチは、動的ノイズを効率的に緩和し、様々な低照度シナリオを収容する上で、永続的な課題に直面する。
まず,低照度画像の雑音レベルを迅速かつ高精度に推定する方法を提案する。
次に、照明と入力の一般的な制約を満たすために、Learningable Illumination Interpolator (LII) を考案する。
論文 参考訳(メタデータ) (2023-05-17T13:56:48Z) - Degradation-Noise-Aware Deep Unfolding Transformer for Hyperspectral
Image Denoising [9.119226249676501]
ハイパースペクトル画像(HSI)は、帯域幅が狭いため、ノイズが多いことが多い。
HSIデータキューブのノイズを低減するため、モデル駆動型と学習型の両方の復調アルゴリズムが提案されている。
本稿では,これらの問題に対処するDNA-Net(Degradation-Noise-Aware Unfolding Network)を提案する。
論文 参考訳(メタデータ) (2023-05-06T13:28:20Z) - CFNet: Conditional Filter Learning with Dynamic Noise Estimation for
Real Image Denoising [37.29552796977652]
本稿では、カメラ内信号処理パイプラインを用いた異方性ガウス/ポアソンガウス分布によって近似された実雑音について考察する。
本稿では,特徴位置の異なる最適なカーネルを画像とノイズマップの局所的特徴により適応的に推定できる条件付きフィルタを提案する。
また,CNN構造にノイズ推定や非ブラインド復調を行う場合,反復的特徴復調を導出する前に連続的にノイズを更新すると考える。
論文 参考訳(メタデータ) (2022-11-26T14:28:54Z) - Robust Semantic Communications with Masked VQ-VAE Enabled Codebook [56.63571713657059]
本稿では,ロバストなエンドツーエンドのセマンティック通信システムにおいて,セマンティックノイズに対処するためのフレームワークを提案する。
セマンティックノイズに対処するため、重み付き対向トレーニングを開発し、トレーニングデータセットにセマンティックノイズを組み込む。
ノイズやタスク非関連の特徴を抑える機能重要モジュール (FIM) を開発した。
論文 参考訳(メタデータ) (2022-06-08T16:58:47Z) - CVF-SID: Cyclic multi-Variate Function for Self-Supervised Image
Denoising by Disentangling Noise from Image [53.76319163746699]
そこで本研究では,CVF-SIDと呼ばれる,新しい,強力な自己監督型デノベーション手法を提案する。
CVF-SIDは、様々な自己教師付き損失項を活用することにより、入力からクリーンな画像とノイズマップを分離することができる。
最先端の自己監督型画像復調性能を達成し、既存のアプローチに匹敵する。
論文 参考訳(メタデータ) (2022-03-24T11:59:28Z) - Robust Unsupervised Multi-Object Tracking in Noisy Environments [5.409476600348953]
頑健なマルチオブジェクト追跡(MOT)モデルである AttU-Net を導入する。
提案したシングルヘッドアテンションモデルは、異なるセグメントスケールでの視覚的表現を学習することで、ノイズの負の影響を制限するのに役立つ。
本手法をMNISTとAtariゲームビデオベンチマークで評価する。
論文 参考訳(メタデータ) (2021-05-20T19:38:03Z) - SCRDet++: Detecting Small, Cluttered and Rotated Objects via
Instance-Level Feature Denoising and Rotation Loss Smoothing [131.04304632759033]
小さくて散らばった物体は実世界では一般的であり、検出は困難である。
本稿では,まず,物体検出にデノナイズするアイデアを革新的に紹介する。
機能マップ上のインスタンスレベルの記述は、小さくて散らばったオブジェクトの検出を強化するために行われる。
論文 参考訳(メタデータ) (2020-04-28T06:03:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。