論文の概要: Towards Context-Aware Image Anonymization with Multi-Agent Reasoning
- arxiv url: http://arxiv.org/abs/2603.27817v1
- Date: Sun, 29 Mar 2026 19:06:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.131264
- Title: Towards Context-Aware Image Anonymization with Multi-Agent Reasoning
- Title(参考訳): マルチエージェント推論によるコンテキスト認識画像の匿名化に向けて
- Authors: Robert Aufschläger, Jakob Folz, Gautam Savaliya, Manjitha D Vidanalage, Michael Heigl, Martin Schramm,
- Abstract要約: 拡散型匿名化を用いた文脈認識型PIIセグメンテーションのためのエージェントフレームワークCAIAMARを提案する。
Plan-Do-Check-Actサイクルにおいて、3つの特殊エージェントがラウンドロビン話者選択を介して協調する。
CityScapesの画質保存のためには、KID:0.001$とFID:9.1$を達成し、既存の匿名化を著しく上回っている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Street-level imagery contains personally identifiable information (PII), some of which is context-dependent. Existing anonymization methods either over-process images or miss subtle identifiers, while API-based solutions compromise data sovereignty. We present an agentic framework CAIAMAR (\underline{C}ontext-\underline{A}ware \underline{I}mage \underline{A}nonymization with \underline{M}ulti-\underline{A}gent \underline{R}easoning) for context-aware PII segmentation with diffusion-based anonymization, combining pre-defined processing for high-confidence cases with multi-agent reasoning for indirect identifiers. Three specialized agents coordinate via round-robin speaker selection in a Plan-Do-Check-Act (PDCA) cycle, enabling large vision-language models to classify PII based on spatial context (private vs. public property) rather than rigid category rules. The agents implement spatially-filtered coarse-to-fine detection where a scout-and-zoom strategy identifies candidates, open-vocabulary segmentation processes localized crops, and $IoU$-based deduplication ($30\%$ threshold) prevents redundant processing. Modal-specific diffusion guidance with appearance decorrelation substantially reduces re-identification (Re-ID) risks. On CUHK03-NP, our method reduces person Re-ID risk by $73\%$ ($R1$: $16.9\%$ vs. $62.4\%$ baseline). For image quality preservation on CityScapes, we achieve KID: $0.001$, and FID: $9.1$, significantly outperforming existing anonymization. The agentic workflow detects non-direct PII instances across object categories, and downstream semantic segmentation is preserved. Operating entirely on-premise with open-source models, the framework generates human-interpretable audit trails supporting EU's GDPR transparency requirements while flagging failed cases for human review.
- Abstract(参考訳): ストリートレベルの画像には個人識別可能な情報(PII)が含まれており、そのいくつかは文脈に依存している。
既存の匿名化メソッドはオーバープロセスイメージか微妙な識別子を見逃し、APIベースのソリューションはデータの主権を侵害する。
CAIAMAR (\underline{C}ontext-\underline{A}ware \underline{I}mage \underline{A}nonymization with \underline{M}ulti-\underline{A}gent \underline{R}easoning) for context-aware PII segmentation with diffusion-based anonymization, combined pre-defined processing for high-confidence case for multi-agent reasoning for indirect IDs。
3つの特殊エージェントは、Plan-Do-Check-Act (PDCA) サイクルでラウンドロビン話者の選択によって調整される。
エージェントは空間的にフィルタリングされた粗粒度検出を実装し、スカウトとズームの戦略が候補を識別し、オープン語彙のセグメンテーションプロセスがローカライズされた作物、そして$IoU$ベースの重複(30\%$閾値)が冗長な処理を妨げている。
モダル特異的拡散誘導と外観デコレーションは再同定(Re-ID)リスクを大幅に低減させる。
CUHK03-NPでは、人のRe-IDリスクを7,3\%(R1$:$16.9\%、ベースラインは$62.4\%)に減らす。
CityScapesの画質保存のためには、KID:0.001$とFID:9.1$を達成し、既存の匿名化を著しく上回っている。
エージェントワークフローはオブジェクトカテゴリ間で間接的なPIIインスタンスを検出し、下流のセマンティックセマンティックセグメンテーションを保存する。
オープンソースモデルで完全にオンプレミスで運用されているこのフレームワークは、EUのGDPR透明性要件をサポートする人間解釈可能な監査パスを生成し、ヒューマンレビューの失敗事例を警告する。
関連論文リスト
- A Multi-Agent LLM Framework for Multi-Domain Low-Resource In-Context NER via Knowledge Retrieval, Disambiguation and Reflective Analysis [7.594209761100934]
In-context Learning (ICL) with large language model (LLMs)は、低リソースシナリオにおける名前付きエンティティ認識(NER)のための有望なパラダイムとして登場した。
KDR-Agentは、知識検索、曖昧さ、反射分析を統合した、コンテキスト内NERのための新しいマルチエージェントフレームワークである。
5つのドメインから10のデータセットを対象とした実験では、KDR-Agentが既存のゼロショットと少数ショットのICLベースラインを大幅に上回っていることが示されている。
論文 参考訳(メタデータ) (2025-11-24T13:23:34Z) - Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.29071072675132]
顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。
トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。
IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-28T09:28:12Z) - Benchmarking Unified Face Attack Detection via Hierarchical Prompt Tuning [58.16354555208417]
PADとFFDはそれぞれ物理メディアベースのプレゼンテーションアタックとデジタル編集ベースのDeepFakeから顔データを保護するために提案されている。
これら2つのカテゴリの攻撃を同時に処理する統一顔攻撃検出モデルがないことは、主に2つの要因に起因する。
本稿では,異なる意味空間から複数の分類基準を適応的に探索する,視覚言語モデルに基づく階層型プロンプトチューニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-19T16:35:45Z) - PS-ReID: Advancing Person Re-Identification and Precise Segmentation with Multimodal Retrieval [38.530536338075684]
人物再識別(ReID)は、セキュリティ監視や刑事捜査などの応用において重要な役割を果たす。
画像とテキストの入力を組み合わせたマルチモーダルモデルであるbf PS-ReIDを提案する。
実験の結果、PS-ReIDは、ReIDとセグメンテーションタスクの両方において、ユニモーダルクエリベースのモデルよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-03-27T15:14:03Z) - Offline-Online Associated Camera-Aware Proxies for Unsupervised Person
Re-identification [31.065557919305892]
教師なしの人物再識別(Re-ID)は研究の注目を集めている。
ほとんどのクラスタリングベースのメソッドは、各クラスタを擬似IDクラスとして扱う。
カメラビューに応じて,各クラスタを複数のプロキシに分割することを提案する。
論文 参考訳(メタデータ) (2022-01-15T10:12:03Z) - Uncertainty-aware Clustering for Unsupervised Domain Adaptive Object
Re-identification [123.75412386783904]
最先端のオブジェクトRe-IDアプローチでは、クラスタリングアルゴリズムを採用して、ラベルのないターゲットドメインの擬似ラベルを生成する。
UDAタスクのための不確実性対応クラスタリングフレームワーク(UCF)を提案する。
我々のUCF法は、オブジェクトRe-IDのための複数のUDAタスクにおける最先端のパフォーマンスを一貫して達成する。
論文 参考訳(メタデータ) (2021-08-22T09:57:14Z) - Dual-Refinement: Joint Label and Feature Refinement for Unsupervised
Domain Adaptive Person Re-Identification [51.98150752331922]
Unsupervised Domain Adaptive (UDA) Person Re-identification (再ID) は、ターゲットドメインデータのラベルが欠落しているため、難しい作業です。
オフラインクラスタリングフェーズにおける擬似ラベルとオンライントレーニングフェーズにおける特徴を共同で改良する,デュアルリファインメントと呼ばれる新しいアプローチを提案する。
本手法は最先端手法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-12-26T07:35:35Z) - Camera-aware Proxies for Unsupervised Person Re-Identification [60.26031011794513]
本稿では、アノテーションを必要としない純粋に教師なしの人物識別(Re-ID)問題に取り組む。
各クラスタを複数のプロキシに分割し、それぞれのプロキシが同じカメラからのインスタンスを表すことを提案する。
カメラ認識プロキシに基づいて、カメラ内およびカメラ間コントラスト学習コンポーネントをre-idモデル用に設計する。
論文 参考訳(メタデータ) (2020-12-19T12:37:04Z) - Style Normalization and Restitution for Generalizable Person
Re-identification [89.482638433932]
我々は、ソースドメイン上でモデルをトレーニングするが、ターゲットドメイン上での一般化や性能をよく行うことのできる、一般化可能な人物ReIDフレームワークを設計する。
本稿では,シンプルで効果的なスタイル正規化・再構成(SNR)モジュールを提案する。
SNRモジュールによって強化された我々のモデルは、複数の広く使われているReIDベンチマークにおいて最先端のドメイン一般化アプローチよりも大幅に優れている。
論文 参考訳(メタデータ) (2020-05-22T07:15:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。