Fugu-MT 論文翻訳(概要): VPD-100K: Towards Generalizable and Fine-grained Visual Privacy Protection

論文の概要: VPD-100K: Towards Generalizable and Fine-grained Visual Privacy Protection

arxiv url: http://arxiv.org/abs/2605.10229v1
Date: Mon, 11 May 2026 09:06:30 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-12 23:28:50.675234
Title: VPD-100K: Towards Generalizable and Fine-grained Visual Privacy Protection
Title（参考訳）: VPD-100K: 汎用的できめ細かいビジュアルプライバシ保護を目指して
Authors: Xiaobin Hu, Enpu Zuo, Lanping Hu, Kaiwen Yang, Dianshu Liao, Tianyi Zhang, Bo Yin, Yinsi Zhou, Shidong Pan, Xiaoyu Sun,
Abstract要約: 既存のプライバシ指向データセットは、しばしば、限られたスケール、粗い粒度のアノテーション、狭いドメインカバレッジに悩まされる。一般化されたプライバシー検出を容易にするために設計された,大規模できめ細かいビジュアルプライバシデータセット(VPD-100K)を提案する。
参考スコア（独自算出の注目度）: 13.539276664177452
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Privacy protection has become a critical requirement in the era of ubiquitous visual data sharing, imposing higher demands on efficient and robust privacy detection algorithms. However, current robust detection models are severely hindered by the lack of comprehensive datasets. Existing privacy-oriented datasets often suffer from limited scale, coarse-grained annotations, and narrow domain coverage, failing to capture the intricate details of sensitive information in realworld environments. To bridge this gap, we present a large-scale, fine-grained Visual Privacy Dataset (VPD-100K), designed to facilitate generalized privacy detection. We establish a holistic taxonomy comprising four primary domains: Human Presence, On-Screen Personally Identifiable Information (PII), Physical Identifiers, and Location Indicators, containing 100,000 images annotated with 33 fine-grained classes and over 190,000 object instances. Statistical analysis reveals that our dataset features long-tailed distributions, small object scales, and high visual complexity. These characteristics make the dataset particularly valuable for demanding, unconstrained applications such as live streaming, where actors frequently face unintentional, realtime information leakage. Furthermore, we design an effective frequency-enhanced lightweight module consisting of frequency-domain attention fusion and adaptive spectral gating mechanism that breaks the limitations of spatial pixel intensity to better capture the subtle details of sensitive information. Extensive experiments conducted on both diverse image and streaming videos benchmarks consistently demonstrate the effectiveness of our VPD-100K dataset and the wellcurated frequency mechanism. The code and dataset are available at https://vpd-100k.github.io/.
Abstract（参考訳）: プライバシー保護は、ユビキタスなビジュアルデータ共有の時代において重要な要件となっている。しかし、現在のロバスト検出モデルは、包括的なデータセットの欠如によって著しく妨げられている。既存のプライバシ指向のデータセットは、しばしば、限られたスケール、粗大なアノテーション、狭いドメインカバレッジに悩まされ、現実世界の環境における機密情報の複雑な詳細をキャプチャできない。このギャップを埋めるために、我々は、一般化されたプライバシー検出を容易にするために設計された、大規模できめ細かなVisual Privacy Dataset (VPD-100K)を提示する。そこで本研究では, 人間の存在, オンスクリーンの個人識別情報(PII), 物理的識別者, 位置指標の4つの主要領域からなる総合分類法を構築し, 微粒クラス33点, オブジェクトインスタンス190,000点を付加した10万点の画像を含む。統計的分析により,我々のデータセットは長い尾の分布,小さなオブジェクトスケール,高い視覚的複雑さを特徴としていることが明らかとなった。これらの特徴は、アクターが意図しないリアルタイム情報漏洩に直面しているライブストリーミングのような、要求のない、制約のないアプリケーションにとって、データセットを特に価値のあるものにしている。さらに、周波数領域の注意融合と適応スペクトルゲーティング機構により、空間画素強度の限界を破り、センシティブな情報の微妙な詳細をより正確に捉えることができる効果的な周波数強調軽量モジュールを設計する。多様な画像とストリーミングビデオのベンチマークで実施された大規模な実験は、VPD-100Kデータセットの有効性と、正確な周波数メカニズムを一貫して実証している。コードとデータセットはhttps://vpd-100k.github.io/.com/で公開されている。

関連論文リスト

Privacy-Aware Video Anomaly Detection through Orthogonal Subspace Projection [14.631956899935721]
ビデオ異常検出(VAD)システムは、プライバシの懸念を乗り越えながら精度を優先し、現実のデプロイメントに対する適合性を制限していることが多い。本稿では,タスク非関連な変化を除去し,異常関連キューに着目した表現を生成する軽量モジュールであるOrthogonal Projection Layer (OPL)を提案する。人物中心のシナリオにおけるプライバシーリスクに対処するために,ポーズや動きなどの識別不能な特徴を保ちながら,顔提示信号からの弱い監視を用いて顔属性を抑えるガイドOPL(G-OPL)を導入する。
論文参考訳（メタデータ） (2026-05-09T03:46:39Z)
Only Whats Necessary: Pareto Optimal Data Minimization for Privacy Preserving Video Anomaly Detection [28.081614331006477]
ビデオ異常検出(VAD)システムは、ますます重要な安全環境にデプロイされ、正確な検出のために大量のデータを必要とする。しかし、データは個人識別可能な情報(PII)を含み、顔の手がかりや繊細な人口統計特性を含む。 What's Necessaryだけが、VADのためのプライバシ・バイ・デザインのフレームワークであり、検出パイプラインに露出する視覚情報量とタイプを明示的に制御する。
論文参考訳（メタデータ） (2026-03-27T12:26:56Z)
Privacy-preserving datasets by capturing feature distributions with Conditional VAEs [0.11999555634662634]
条件付き変分オートエンコーダ(CVAE)は、大きな事前学習された視覚基盤モデルから抽出された特徴ベクトルに基づいて訓練される。本手法は, 医用領域と自然画像領域の両方において, 従来のアプローチよりも優れている。結果は、データスカースおよびプライバシに敏感な環境におけるディープラーニングアプリケーションに大きな影響を与える生成モデルの可能性を強調している。
論文参考訳（メタデータ） (2024-08-01T15:26:24Z)
DailyDVS-200: A Comprehensive Benchmark Dataset for Event-Based Action Recognition [51.96660522869841]
DailyDVS-200は、イベントベースのアクション認識コミュニティに適したベンチマークデータセットである。実世界のシナリオで200のアクションカテゴリをカバーし、47人の参加者によって記録され、22,000以上のイベントシーケンスで構成されている。 DailyDVS-200には14の属性がアノテートされており、記録されたアクションの詳細なキャラクタリゼーションが保証されている。
論文参考訳（メタデータ） (2024-07-06T15:25:10Z)
MaSS: Multi-attribute Selective Suppression for Utility-preserving Data Transformation from an Information-theoretic Perspective [10.009178591853058]
本稿では,このユーティリティ保護プライバシ保護問題に対する情報理論の形式的定義を提案する。我々は、ターゲットデータセットからセンシティブな属性を抑えることができるデータ駆動学習可能なデータ変換フレームワークを設計する。その結果,様々な構成下での手法の有効性と一般化性を示した。
論文参考訳（メタデータ） (2024-05-23T18:35:46Z)
Wild Face Anti-Spoofing Challenge 2023: Benchmark and Results [73.98594459933008]
顔認証システム(FAS)は、顔認識システムの完全性を保護するための重要なメカニズムである。この制限は、公開可能なFASデータセットの不足と多様性の欠如に起因する可能性がある。制約のない環境で収集された大規模で多様なFASデータセットであるWild Face Anti-Spoofingデータセットを紹介した。
論文参考訳（メタデータ） (2023-04-12T10:29:42Z)
Towards Real-World Prohibited Item Detection: A Large-Scale X-ray Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文参考訳（メタデータ） (2021-08-16T11:14:16Z)
On Deep Learning with Label Differential Privacy [54.45348348861426]
ラベルは機密性があり、保護されるべきであるとするマルチクラス分類について検討する。本稿では,ラベル差分プライバシを用いたディープニューラルネットワークのトレーニングアルゴリズムを提案し,いくつかのデータセットで評価を行う。
論文参考訳（メタデータ） (2021-02-11T15:09:06Z)
Attribute Privacy: Framework and Mechanisms [26.233612860653025]
本研究では、データ所有者が分析中にデータセット全体の機密性を明らかにすることに関心を持つ属性プライバシの研究を行う。我々は,グローバル属性を保護する必要がある2つのケースにおいて,インパトリビュートプライバシを捕捉するための定義を提案する。これらの設定の属性プライバシーを満足する2つの効率的なメカニズムと1つの非効率的なメカニズムを提供する。
論文参考訳（メタデータ） (2020-09-08T22:38:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。