論文の概要: Evaluating the Impact of Data Anonymization on Image Retrieval
- arxiv url: http://arxiv.org/abs/2602.19641v1
- Date: Mon, 23 Feb 2026 09:39:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.754243
- Title: Evaluating the Impact of Data Anonymization on Image Retrieval
- Title(参考訳): データ匿名化が画像検索に与える影響の評価
- Authors: Marvin Chen, Manuel Eberhardinger, Johannes Maucher,
- Abstract要約: 2つの公開データセットと内部DOKIQデータセットを用いたCBIR(Content-Based Image Retrieval)に対する匿名化の影響について検討した。
本結果から,匿名化後に最も類似した検索結果を生成するオリジナルデータを用いたモデルに有利な検索バイアスが明らかとなった。
- 参考スコア(独自算出の注目度): 2.8165396388850112
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the growing importance of privacy regulations such as the General Data Protection Regulation, anonymizing visual data is becoming increasingly relevant across institutions. However, anonymization can negatively affect the performance of Computer Vision systems that rely on visual features, such as Content-Based Image Retrieval (CBIR). Despite this, the impact of anonymization on CBIR has not been systematically studied. This work addresses this gap, motivated by the DOKIQ project, an artificial intelligence-based system for document verification actively used by the State Criminal Police Office Baden-Württemberg. We propose a simple evaluation framework: retrieval results after anonymization should match those obtained before anonymization as closely as possible. To this end, we systematically assess the impact of anonymization using two public datasets and the internal DOKIQ dataset. Our experiments span three anonymization methods, four anonymization degrees, and four training strategies, all based on the state of the art backbone Self-Distillation with No Labels (DINO)v2. Our results reveal a pronounced retrieval bias in favor of models trained on original data, which produce the most similar retrievals after anonymization. The findings of this paper offer practical insights for developing privacy-compliant CBIR systems while preserving performance.
- Abstract(参考訳): 一般データ保護規則(General Data Protection Regulation)のようなプライバシー規制の重要性が高まっているため、視覚データの匿名化は機関間でますます重要になっている。
しかし、匿名化は、CBIR(Content-Based Image Retrieval)のような視覚的特徴に依存するコンピュータビジョンシステムの性能に悪影響を及ぼす可能性がある。
それにもかかわらず、CBIRに対する匿名化の影響は体系的に研究されていない。
この研究は、国家刑事警察局のバーデン=ヴュルテンベルク(英語版)が積極的に使用している文書検証のための人工知能ベースのシステムであるDOKIQプロジェクトによって動機付けられたこのギャップに対処する。
匿名化後の検索結果は、匿名化前の結果と可能な限り密接に一致すべきである。
そこで我々は,2つの公開データセットと内部DOKIQデータセットを用いて,匿名化の影響を系統的に評価した。
実験は,3つの匿名化法,4つの匿名化度,および4つのトレーニング戦略にまたがる。
本結果から,匿名化後に最も類似した検索結果を生成するオリジナルデータを用いたモデルに有利な検索バイアスが明らかとなった。
本稿では,プライバシに適合したCBIRシステムの開発において,性能を保ちながら実践的な知見を提供する。
関連論文リスト
- Self-Refining Language Model Anonymizers via Adversarial Distillation [48.280759014096354]
本稿では,Self-refining Anonymization with Language Model (SEAL)を紹介する。
SEALは、推論時に外部モデルに頼ることなく効果的な匿名化を行うために、小型言語モデル(SLM)をトレーニングするための新しい蒸留フレームワークである。
合成個人プロファイルとテキストコメントのデータセットであるSynthPAIの実験は、SEALでトレーニングされたSLMが匿名化機能を大幅に改善したことを示す。
論文 参考訳(メタデータ) (2025-06-02T08:21:27Z) - Robust Utility-Preserving Text Anonymization Based on Large Language Models [80.5266278002083]
機密情報を含む匿名化は、幅広いアプリケーションにとって不可欠である。
既存の技術は、大規模言語モデルの再識別能力の新たな課題に直面している。
本稿では,プライバシ評価器,ユーティリティ評価器,最適化コンポーネントの3つの重要なコンポーネントで構成されるフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-16T14:28:56Z) - Disentangle Before Anonymize: A Two-stage Framework for Attribute-preserved and Occlusion-robust De-identification [55.741525129613535]
匿名化前の混乱」は、新しい二段階フレームワーク(DBAF)である
このフレームワークには、Contrastive Identity Disentanglement (CID)モジュールとKey-authorized Reversible Identity Anonymization (KRIA)モジュールが含まれている。
大規模な実験により,本手法は最先端の非識別手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-11-15T08:59:02Z) - Diff-Privacy: Diffusion-based Face Privacy Protection [58.1021066224765]
本稿では,Diff-Privacyと呼ばれる拡散モデルに基づく顔のプライバシー保護手法を提案する。
具体的には、提案したマルチスケール画像インバージョンモジュール(MSI)をトレーニングし、元の画像のSDMフォーマット条件付き埋め込みのセットを得る。
本研究は,条件付き埋め込みに基づいて,組込みスケジューリング戦略を設計し,デノナイズプロセス中に異なるエネルギー関数を構築し,匿名化と視覚的アイデンティティ情報隠蔽を実現する。
論文 参考訳(メタデータ) (2023-09-11T09:26:07Z) - Does Image Anonymization Impact Computer Vision Training? [0.0]
コンピュータビジョンモデルのトレーニングにおける画像匿名化が重要なコンピュータビジョンタスクに与える影響について検討する。
従来の画像の匿名化は、特に全身の匿名化において、最終的なモデルの性能に大きな影響を及ぼす。
現実的な匿名化は、顔匿名化の最小性能低下を反映するこの性能低下を軽減することができる。
論文 参考訳(メタデータ) (2023-06-08T12:02:03Z) - GANonymization: A GAN-based Face Anonymization Framework for Preserving
Emotional Expressions [43.017036538109274]
GANonymizationは、表情保存能力を持つ新しい顔匿名化フレームワークである。
提案手法は, 顔の高レベル表現をベースとして, GAN(Generative Adversarial Network)に基づく匿名化バージョンに合成する。
論文 参考訳(メタデータ) (2023-05-03T14:22:48Z) - A False Sense of Privacy: Towards a Reliable Evaluation Methodology for the Anonymization of Biometric Data [8.799600976940678]
生体データは、顔の特徴や歩行パターンのような特徴的な人間の特徴を含んでいる。
プライバシー保護は、匿名化の技法によって広範囲に提供される。
我々は、匿名化の性能を評価するために使用される最先端の手法を評価する。
論文 参考訳(メタデータ) (2023-04-04T08:46:14Z) - Learnable Privacy-Preserving Anonymization for Pedestrian Images [27.178354411900127]
本稿では,歩行者画像における新たなプライバシー保護匿名化問題について検討する。
認証されたモデルに対する個人識別情報(PII)を保存し、PIIが第三者によって認識されないようにする。
本稿では,全体匿名画像の可逆的生成が可能な共同学習可逆匿名化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T07:04:16Z) - How important are faces for person re-identification? [14.718372669984364]
顔検出およびぼかしアルゴリズムを適用し、複数の人気人物再識別データセットの匿名化バージョンを作成する。
我々は,この匿名化が標準メトリクスを用いた再識別性能に与える影響を評価する。
論文 参考訳(メタデータ) (2020-10-13T11:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。