論文の概要: Thermal-Only Crowd Counting with Deployment-Time Privacy Protection
- arxiv url: http://arxiv.org/abs/2605.17042v1
- Date: Sat, 16 May 2026 15:21:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.510979
- Title: Thermal-Only Crowd Counting with Deployment-Time Privacy Protection
- Title(参考訳): デプロイ時プライバシ保護によるサーマルオンリークラウドカウント
- Authors: Yifei Qian, Zhongliang Guo, Chun Tong Lei, Bowen Deng, Chun Pong Lau, Xiaopeng Hong, Michael P. Pound,
- Abstract要約: プライバシを意識した集団カウント用に設計された,最初のサーマルオンリーフレームワークを提案する。
熱表現を増強する識別的特徴を抽出するクロスモーダルブリッジとして深度-RGB拡散モデルを利用する。
RGBT-CCおよびDroneRGBTデータセットを用いた実験により,本手法は最先端のRGB-T融合法と競合する性能を示した。
- 参考スコア(独自算出の注目度): 28.787797620535354
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While RGB-Thermal crowd counting has shown promise, the paradigm faces critical limitations: RGB data raises privacy concerns in public surveillance, and multi-modal misalignment degrades fusion performance. We propose the first thermal-only framework specifically designed for privacy-conscious crowd counting, eliminating RGB dependency at inference time and substantially reducing the privacy exposure associated with continuous RGB capture in public surveillance deployments. To mitigate thermal ambiguity, we leverage depth-to-RGB diffusion models as a cross-modal bridge, extracting discriminative features that enhance thermal representations. Critically, we demonstrate that single-step LCM denoising yields features most faithful to the structural content of the depth conditioning signal, while multi-step approaches progressively decouple features from the conditioning input and accumulate errors that degrade counting accuracy. Experiments on RGBT-CC and DroneRGBT datasets show our method achieves competitive performance against state-of-the-art RGB-T fusion methods, while requiring only thermal input during inference, eliminating the need for continuous RGB capture that constitutes the primary privacy concern in real-world surveillance deployment. The code will be made publicly available.
- Abstract(参考訳): RGBデータは、公開監視におけるプライバシー上の懸念を高め、マルチモーダルな不正調整は、核融合性能を低下させる。
本稿では,プライバシを意識したクラウドカウント,推論時のRGB依存性の排除,および公開監視デプロイメントにおける連続的なRGBキャプチャに関連するプライバシ露出の大幅な削減などを目的とした,初めてのサーマルオンリーフレームワークを提案する。
熱のあいまいさを軽減するため,熱表現を高める識別的特徴を抽出し,深度-RGB拡散モデルをクロスモーダルブリッジとして活用する。
批判的に、単一ステップのLCM復調は、深度条件信号の構造的内容に最も忠実な特徴であり、マルチステップのアプローチは、条件入力から段階的に特徴を分離し、カウント精度を低下させる誤差を蓄積する。
RGBT-CCとDroneRGBTデータセットを用いた実験により,提案手法は現状のRGB-T融合法と競合する性能を示した。
コードは公開されます。
関連論文リスト
- SWIR-LightFusion: Multi-spectral Semantic Fusion of Synthetic SWIR with Thermal IR (LWIR/MWIR) and RGB [6.054759773528757]
スペクトル再現を主張せずにSWIR様の構造/コントラストキューを合成的に生成する。
次に、合成SWIR、LWIR、RGBモダリティを統合したマルチモーダル融合フレームワークを提案する。
この結果は、監視と自律システムにおける現実世界の応用のかなりの可能性を浮き彫りにしている。
論文 参考訳(メタデータ) (2025-10-15T11:00:41Z) - Enhancing Infrared Vision: Progressive Prompt Fusion Network and Benchmark [58.61079960074608]
既存の赤外線画像強調法は、個々の劣化に対処することに焦点を当てている。
一般的にRGBセンサーに適用されるオールインワンエンハンスメント法は、有効性が制限されることが多い。
論文 参考訳(メタデータ) (2025-10-10T12:55:54Z) - Spectral-Aware Global Fusion for RGB-Thermal Semantic Segmentation [10.761216101789774]
マルチモーダル機能の強化と融合を図るため,SGFNet(Spectral-aware Global Fusion Network)を提案する。
SGFNetは、MFNetとPST900データセットの最先端メソッドよりも優れている。
論文 参考訳(メタデータ) (2025-05-21T13:17:57Z) - Human Activity Recognition using RGB-Event based Sensors: A Multi-modal Heat Conduction Model and A Benchmark Dataset [65.76480665062363]
人間の活動認識は主に、高性能な活動認識を実現するために従来のRGBカメラに依存していた。
照明不足や急激な動きといった現実のシナリオにおける課題は、必然的にRGBカメラの性能を低下させる。
本研究では,RGBとイベントカメラを組み合わせることで,人間の活動認識を再考する。
論文 参考訳(メタデータ) (2025-04-08T09:14:24Z) - Bringing RGB and IR Together: Hierarchical Multi-Modal Enhancement for Robust Transmission Line Detection [67.02804741856512]
高速かつ高精度なTL検出のために,RGBとIRデータを統合したHMMEN(Hierarchical Multi-Modal Enhancement Network)を提案する。
提案手法では,(1)階層的RGBおよびIR特徴写像を大まかに融合・拡張するMMEB,(2)デコーダ出力とIR特徴写像の不整合を変形可能な畳み込みを利用して補正するFAB,の2つの重要な構成要素を紹介する。
論文 参考訳(メタデータ) (2025-01-25T06:21:06Z) - IRFusionFormer: Enhancing Pavement Crack Segmentation with RGB-T Fusion and Topological-Based Loss [0.0]
本稿では,RGBと熱データを効果的に統合したフラクチャーセグメンテーションの新しいモデルであるIRFusionFormerを提案する。
本手法は,90.01%のDiceスコアと81.83%のIoUで最先端性能を実現し,各種環境条件におけるロバスト性および精度を著しく向上させる。
論文 参考訳(メタデータ) (2024-09-30T16:35:16Z) - InferDPT: Privacy-Preserving Inference for Black-box Large Language Model [66.07752875835506]
InferDPTは、ブラックボックスLSMのプライバシ保護推論のための最初の実用的なフレームワークである。
RANTEXTはInferDPTの摂動モジュールに組み込まれた新しい微分プライバシー機構である。
論文 参考訳(メタデータ) (2023-10-18T18:00:11Z) - Residual Spatial Fusion Network for RGB-Thermal Semantic Segmentation [19.41334573257174]
従来の方法では、主にRGBイメージを使用し、照明条件、例えば暗闇の影響が大きい。
近年の研究では、セグメンテーションの補正モダリティとして、熱画像は夜のシナリオに頑健であることが示されている。
本稿では,RGB-TセマンティックセグメンテーションのためのResidual Spatial Fusion Network (RSFNet)を提案する。
論文 参考訳(メタデータ) (2023-06-17T14:28:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。