論文の概要: Toward Trustworthy AI: Multi-Target Adversarial Attacks and Robust Defenses for Continuous Data Summarization
- arxiv url: http://arxiv.org/abs/2606.11804v1
- Date: Wed, 10 Jun 2026 08:38:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.365955
- Title: Toward Trustworthy AI: Multi-Target Adversarial Attacks and Robust Defenses for Continuous Data Summarization
- Title(参考訳): 信頼できるAIに向けて - 継続的データ要約のためのマルチターゲット敵攻撃とロバストディフェンス
- Authors: Yuefang Lian, Longkun Guo, Zhongrui Zhao, Zhigang Lu, Yanan Cai, Shuchao Pang, Dachuan Xu, Jason Xue,
- Abstract要約: 要約プロセスに対する敵対的な摂動は、上流で信頼できるAIを妥協する可能性がある。
本稿では,DR-サブモジュラー最適化による類似度レベルの摂動下での連続データ要約に対する逆攻撃について検討する。
非負のサブモジュラー集合関数の多重線型拡張として、多重解像度画像要約対象のクラスが定式化可能であることを示す。
次に、類似構造の許容摂動を最適化し、複数のターゲットの要約モデルを分解する、min-max問題としてマルチターゲット攻撃生成を定式化する。
- 参考スコア(独自算出の注目度): 8.957420305238177
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Trustworthy AI requires reliable data-processing pipelines, not only robust downstream predictive models. As an upstream component, data summarization determines which information is retained and passed to subsequent learning or decision modules. Therefore, adversarial perturbations to the summarization process can compromise trustworthy AI in an upstream manner: they may alter the selected summary, reduce its representativeness, and further degrade the utility of subsequent learning tasks. In this paper, we study adversarial attacks on continuous data summarization under similarity-level perturbations through DR-submodular optimization. We show that a class of multi-resolution image summarization objectives can be formulated as multilinear extensions of non-negative submodular set functions and satisfy DR-submodularity with $m$-weak monotonicity. We then formulate multi-target attack generation as a min-max problem, where one admissible perturbation of the similarity structure is optimized to degrade multiple target summarization models. To mitigate such perturbations, we formulate robust defense against mixed attack types as a regularized max-min problem. For both problems, we develop approximation algorithms with theoretical guarantees. Experiments on real-data and controlled clustered benchmarks show that the proposed attack is effective in representative low-to-moderate budget regimes and can induce downstream task-performance loss. The proposed defense improves the robustness--mitigation trade-off in structured settings, while also revealing the parameter sensitivity of robust protection on real data.
- Abstract(参考訳): 信頼できるAIには、堅牢な下流予測モデルだけでなく、信頼できるデータ処理パイプラインが必要です。
上流コンポーネントとして、データの要約はどの情報が保持され、その後の学習や決定モジュールに渡されるかを決定する。
したがって、要約プロセスに対する敵対的摂動は、選択された要約を変更し、その代表性を減らし、さらにその後の学習タスクの有用性を低下させるという、信頼できるAIを上流的に妥協することができる。
本稿では,DR-サブモジュラー最適化による類似度レベルの摂動下での連続データ要約に対する逆攻撃について検討する。
非負のサブモジュラー集合関数の多重線型拡張として定式化することができ、DR-サブモジュラリティを$m$-weak monotonicityで満足することを示す。
次に、類似構造の許容摂動を最適化し、複数のターゲットの要約モデルを分解する、min-max問題としてマルチターゲット攻撃生成を定式化する。
このような摂動を緩和するために、我々は正則化された最大ミン問題として混合攻撃タイプに対する堅牢な防御を定式化する。
両問題に対して,理論的保証付き近似アルゴリズムを開発した。
実データおよびクラスタ化ベンチマークによる実験により,提案手法は低調な予算体系に有効であり,下流のタスクパフォーマンス損失を誘発できることが示された。
提案したディフェンスは、構造化された設定におけるロバスト性-緩和トレードオフを改善するとともに、実データに対するロバスト保護のパラメータ感度を明らかにする。
関連論文リスト
- Guided Verifier: Collaborative Multimodal Reasoning via Dynamic Process Supervision [11.159231524113764]
マルチモーダル大規模言語モデル(MLLM)の複雑な推論能力を高めるための重要なメカニズムとして強化学習(RL)が登場した。
本稿では,これらの構造的制約に対処する textbfGuided Verifier フレームワークを提案する。
我々は,マルチモーダル幻覚をターゲットとした特殊なデータ合成パイプラインを開発し,プロセスレベルの負の textbfCoRe データセットとtextbfCorrect-guide textbfReasoning トラジェクトリを構築し,ガイド付き検証器を訓練する。
論文 参考訳(メタデータ) (2026-02-04T07:38:42Z) - RMBRec: Robust Multi-Behavior Recommendation towards Target Behaviors [26.88506691092044]
ターゲット行動に対するロバスト多行動勧告(RMBRec)を提案する。
RMBRecは、情報理論の堅牢性原理に基づく、堅牢なマルチビヘイビアレコメンデーションフレームワークである。
RMBRecは最先端の手法よりも精度が高く,様々なノイズ摂動下では顕著な安定性を維持している。
論文 参考訳(メタデータ) (2026-01-13T16:34:17Z) - Revisiting the Privacy Risks of Split Inference: A GAN-Based Data Reconstruction Attack via Progressive Feature Optimization [49.32786615205064]
Split Inference (SI)は、エッジデバイスとクラウドの間の計算を分割することで、レイテンシを低減し、ユーザのプライバシを保護する。
データ再構成攻撃(DRA)の最近の進歩は、SIで交換された中間的特徴を利用して機密入力データを復元できることを明らかにしている。
既存のDRAは一般的に浅いモデルにのみ有効であり、セマンティックな事前を十分に活用できない。
本稿では,プログレッシブ・フィーチャー・オプティマイゼーション(PFO)を用いた新しいGANベースのDRAフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T10:00:39Z) - MISLEADER: Defending against Model Extraction with Ensembles of Distilled Models [56.09354775405601]
モデル抽出攻撃は、クエリアクセスを通じてブラックボックスモデルの機能を複製することを目的としている。
既存のディフェンスでは、アタッカークエリにはオフ・オブ・ディストリビューション(OOD)サンプルがあることを前提としており、不審な入力を検出し破壊することができる。
OOD仮定に依存しない新しい防衛戦略であるMISLEADERを提案する。
論文 参考訳(メタデータ) (2025-06-03T01:37:09Z) - MIBP-Cert: Certified Training against Data Perturbations with Mixed-Integer Bilinear Programs [50.41998220099097]
トレーニング中のデータエラー、汚職、中毒攻撃は、現代のAIシステムの信頼性に大きな脅威をもたらす。
混合整数双線形プログラミング(MIBP)に基づく新しい認証手法MIBP-Certを紹介する。
摂動データや操作データを通じて到達可能なパラメータの集合を計算することで、可能なすべての結果を予測することができ、堅牢性を保証することができる。
論文 参考訳(メタデータ) (2024-12-13T14:56:39Z) - Transferable Adversarial Attacks on SAM and Its Downstream Models [87.23908485521439]
本稿では,セグメント・アプライス・モデル(SAM)から微調整した様々な下流モデルに対する敵攻撃の可能性について検討する。
未知のデータセットを微調整したモデルに対する敵攻撃の有効性を高めるために,ユニバーサルメタ初期化(UMI)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-26T15:04:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。