論文の概要: Multispectral Pedestrian Detection with Sparsely Annotated Label
- arxiv url: http://arxiv.org/abs/2501.02640v1
- Date: Sun, 05 Jan 2025 20:05:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-07 17:07:13.285295
- Title: Multispectral Pedestrian Detection with Sparsely Annotated Label
- Title(参考訳): 少ないアノテートラベルによる多スペクトルペデストリアン検出
- Authors: Chan Lee, Seungho Shin, Gyeong-Moon Park, Jung Uk Kim,
- Abstract要約: Sparsely Annotated Multispectral Pedestrian Detection (SAMPD) と呼ばれる新しいフレームワークを提案する。
SAMPDはマルチスペクトル領域内の疎アノテート環境における性能を著しく向上させる。
- 参考スコア(独自算出の注目度): 12.055803551700116
- License:
- Abstract: Although existing Sparsely Annotated Object Detection (SAOD) approches have made progress in handling sparsely annotated environments in multispectral domain, where only some pedestrians are annotated, they still have the following limitations: (i) they lack considerations for improving the quality of pseudo-labels for missing annotations, and (ii) they rely on fixed ground truth annotations, which leads to learning only a limited range of pedestrian visual appearances in the multispectral domain. To address these issues, we propose a novel framework called Sparsely Annotated Multispectral Pedestrian Detection (SAMPD). For limitation (i), we introduce Multispectral Pedestrian-aware Adaptive Weight (MPAW) and Positive Pseudo-label Enhancement (PPE) module. Utilizing multispectral knowledge, these modules ensure the generation of high-quality pseudo-labels and enable effective learning by increasing weights for high-quality pseudo-labels based on modality characteristics. To address limitation (ii), we propose an Adaptive Pedestrian Retrieval Augmentation (APRA) module, which adaptively incorporates pedestrian patches from ground-truth and dynamically integrates high-quality pseudo-labels with the ground-truth, facilitating a more diverse learning pool of pedestrians. Extensive experimental results demonstrate that our SAMPD significantly enhances performance in sparsely annotated environments within the multispectral domain.
- Abstract(参考訳): 既存のSparsely Annotated Object Detection (SAOD)アロケートは、いくつかの歩行者だけが注釈を付けるマルチスペクトル領域における疎アノテート環境の処理を進展させたが、以下の制限がある。
(i)アノテーションの欠落に対する擬似ラベルの品質向上への配慮が欠如していること。
(II) 固定的真理アノテーションに頼り、多スペクトル領域における限られた歩行者視認性しか学ばない。
これらの問題に対処するため,Sparsely Annotated Multispectral Pedestrian Detection (SAMPD) と呼ばれる新しいフレームワークを提案する。
制限
(i)Multispectral Pedestrian-aware Adaptive Weight (MPAW)とPositive Pseudo-label Enhancement (PPE)を導入する。
マルチスペクトル知識を利用することで、これらのモジュールは高品質な擬似ラベルの生成を確実にし、モダリティ特性に基づいた高品質な擬似ラベルの重みを増大させることにより効果的な学習を可能にする。
限界に対処する
(II) 提案するアダプティブPedestrian Retrieval Augmentation (APRA) モジュールは, 地上からの歩行者パッチを適応的に組み込んで, 高品質な擬似ラベルを地上から動的に統合し, より多様な歩行者の学習プールを実現する。
広汎な実験結果から,SAMPDはマルチスペクトル領域内の疎アノテート環境における性能を著しく向上することが示された。
関連論文リスト
- Unified Domain Generalization and Adaptation for Multi-View 3D Object Detection [14.837853049121687]
マルチビューカメラを利用した3次元物体検出は, 視覚課題における実用的, 経済的価値を実証した。
典型的な教師付き学習アプローチは、目に見えない、ラベルなしのターゲットデータセットに対する満足な適応を達成する上で、課題に直面します。
本稿では、これらの欠点を軽減するための実践的なソリューションとして、統一ドメイン一般化・適応(UDGA)を提案する。
論文 参考訳(メタデータ) (2024-10-29T18:51:49Z) - Dual-Decoupling Learning and Metric-Adaptive Thresholding for Semi-Supervised Multi-Label Learning [81.83013974171364]
半教師付きマルチラベル学習(SSMLL)は、正確なマルチラベルアノテーションを収集するコストを削減するために、ラベルのないデータを活用する強力なフレームワークである。
半教師付き学習とは異なり、インスタンスに含まれる複数のセマンティクスのため、SSMLLの擬似ラベルとして最も確率の高いラベルを選択することはできない。
本稿では,高品質な擬似ラベルを生成するための二重パースペクティブ手法を提案する。
論文 参考訳(メタデータ) (2024-07-26T09:33:53Z) - Transcending Forgery Specificity with Latent Space Augmentation for Generalizable Deepfake Detection [57.646582245834324]
LSDAと呼ばれる簡易で効果的なディープフェイク検出器を提案する。
より多様な偽の表現は、より一般化可能な決定境界を学べるべきである。
提案手法は驚くほど有効であり, 広く使用されている複数のベンチマークで最先端の検出器を超越することを示す。
論文 参考訳(メタデータ) (2023-11-19T09:41:10Z) - Revisiting Class Imbalance for End-to-end Semi-Supervised Object
Detection [1.6249267147413524]
半教師付きオブジェクト検出(SSOD)は、擬似ラベルに基づくエンドツーエンド手法の開発において大きな進歩を遂げている。
多くの手法は、擬似ラベルジェネレータの有効性を妨げるクラス不均衡のため、課題に直面している。
本稿では,低品質な擬似ラベルの根本原因と,ラベル生成品質を改善するための新しい学習メカニズムについて検討する。
論文 参考訳(メタデータ) (2023-06-04T06:01:53Z) - Robust Domain Adaptive Object Detection with Unified Multi-Granularity Alignment [59.831917206058435]
ドメイン適応検出は、ターゲットドメイン上の検出器の一般化を改善することを目的としている。
近年のアプローチは、異なる粒度の特徴アライメントを通じて、逆学習を通じてドメイン適応を実現する。
ドメイン不変な特徴学習のための統合多重粒度アライメント(MGA)に基づく検出フレームワークを提案する。
論文 参考訳(メタデータ) (2023-01-01T08:38:07Z) - Feature Diversity Learning with Sample Dropout for Unsupervised Domain
Adaptive Person Re-identification [0.0]
本稿では,ノイズの多い擬似ラベルを限定することで,より優れた一般化能力を持つ特徴表現を学習する手法を提案する。
我々は,古典的な相互学習アーキテクチャの下で,FDL(Feature Diversity Learning)と呼ばれる新しい手法を提案する。
実験の結果,提案するFDL-SDは,複数のベンチマークデータセット上での最先端性能を実現することがわかった。
論文 参考訳(メタデータ) (2022-01-25T10:10:48Z) - Incomplete Multi-View Weak-Label Learning with Noisy Features and
Imbalanced Labels [4.800187500079582]
マルチビュー学習の限界を克服する新しい手法を提案する。
不完全ビューと弱いラベルを適応重み付き低次元部分空間に埋め込む。
ノイズの多いビューを検出するために埋め込みの視点的重要性を適応的に学習し、焦点損失によるラベルの不均衡問題を緩和する。
論文 参考訳(メタデータ) (2022-01-04T10:49:30Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - Selective Pseudo-Labeling with Reinforcement Learning for
Semi-Supervised Domain Adaptation [116.48885692054724]
半教師付きドメイン適応のための強化学習に基づく選択擬似ラベル法を提案する。
高精度かつ代表的な擬似ラベルインスタンスを選択するための深層Q-ラーニングモデルを開発する。
提案手法は, SSDAのベンチマークデータセットを用いて評価し, 全ての比較手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-12-07T03:37:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。