論文の概要: Differentially Private Auditing Under Strategic Response
- arxiv url: http://arxiv.org/abs/2605.07674v1
- Date: Fri, 08 May 2026 12:44:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.046558
- Title: Differentially Private Auditing Under Strategic Response
- Title(参考訳): ストラテジック・レスポンス下における個人別監査
- Authors: Florian A. D. Burnat,
- Abstract要約: 監査担当者がプライバシーに制約のある監査インターフェースに戦略的に対応できる場合、監査設計について検討する。
プライバシに制約のある監査をバイレベルなStackelbergゲームとして定式化し、監査人がクエリポリシーとDP予算割り当てを有害次元にわたってコミットする。
本稿では,開発者のベストレスポンスを通した高次アルゴリズムであるStrategic Private Audit Design (SPAD)を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Regulatory audits of AI systems increasingly rely on differential privacy (DP) to protect training data and model internals. We study audit design when the audited developer can strategically respond to the privacy-constrained audit interface. We formalize privacy-constrained auditing as a bilevel Stackelberg game, in which an auditor commits to a query policy and DP budget allocation across harm dimensions, and a strategic developer reallocates mitigation efforts in response. We introduce the welfare-weighted under-detection gap $B_w$, the welfare-weighted true residual harm the audit fails to detect at the developer's strategic best response, and prove that naive DP auditing (uniform or harm-proportional allocation) induces a strictly larger $B_w$ than any non-strategic mitigation baseline whenever effective detectability is heterogeneous, the welfare weights are not comonotone with detectability, and the developer's optimum is interior. We characterize the optimal auditor allocation as a four-factor balance of welfare weight, audit miss-probability, detectability elasticity, and mitigation-cost curvature, and provide a single-level reformulation of the bilevel problem via the developer's KKT system. We propose Strategic Private Audit Design (SPAD), a projected-gradient algorithm with hypergradients computed through the developer's best response.
- Abstract(参考訳): AIシステムの規制監査は、トレーニングデータを保護し、内部をモデル化するために、ディファレンシャルプライバシ(DP)にますます依存している。
監査担当者がプライバシーに制約のある監査インターフェースに戦略的に対応できる場合、監査設計について検討する。
そこで我々は,2段階のStackelbergゲームとして,プライバシ制約による監査を形式化し,監査人が損害範囲を越えてクエリポリシとDP予算配分にコミットし,戦略的な開発者が対応して緩和作業を再配置する。
我々は,福祉重み付き下検出ギャップである$B_w$を導入し,福祉重み付き真の残効害が開発者の戦略的最良応答で検出できないことを証明し,有効な検出性が不均一である場合,その福祉重みがコモノトンではなく,開発者の最適度が内在である場合に,DP監査(一様もしくは一様的アロケーション)がどの非戦略的緩和ベースラインよりも厳格に大きい$B_w$を誘導することを示した。
我々は,最適監査者配置を,福祉重量,監査ミス確率,検出性弾性,緩和コスト曲線の4要素バランスとして特徴付け,開発者のKKTシステムを介して,二段階問題の単一レベル再構成を行う。
本稿では,開発者のベストレスポンスを通した高次アルゴリズムであるStrategic Private Audit Design (SPAD)を提案する。
関連論文リスト
- A Benchmark for Strategic Auditee Gaming Under Continuous Compliance Monitoring [1.253312107729806]
継続的デプロイ後のコンプライアンス監査は、戦略的なゲームのクラスを作成します。
我々は,時間的方針にコミットする監査者と適応監査人との間に,$T$ラウンドのStackelbergゲームとして継続的監査を形式化する。
論文 参考訳(メタデータ) (2026-05-07T14:28:34Z) - Automated Self-Testing as a Quality Gate: Evidence-Driven Release Management for LLM Applications [51.56484100374058]
我々は,エビデンスに基づくリリース決定を伴う品質ゲートを導入する自動自己テストフレームワークを提案する。
内部展開型多エージェント対話型AIシステムの縦型ケーススタディにより,本フレームワークの評価を行った。
論文 参考訳(メタデータ) (2026-03-13T20:44:15Z) - ODAR: Principled Adaptive Routing for LLM Reasoning via Active Inference [60.958331943869126]
ODAR-Expertは、原則化されたリソース割り当てによる精度と効率のトレードオフを最適化する適応的なルーティングフレームワークである。
我々は、MATHの98.2%の精度、HumanityのLast Examの54.8%を含む、強く一貫した利得を示している。
論文 参考訳(メタデータ) (2026-02-27T05:22:01Z) - Governing AI Forgetting: Auditing for Machine Unlearning Compliance [30.173215964349044]
我々は、認定されたアンラーニング理論と規制執行を統合することで、機械のアンラーニングコンプライアンスを監査するための最初の経済枠組みを導入する。
MUの本質的な不確かさを,証明された未学習の仮説検証解釈を用いて特徴付ける。
次に,オーディタとオペレータ間の戦略的相互作用を捉えるゲーム理論モデルを提案する。
論文 参考訳(メタデータ) (2026-02-16T08:32:09Z) - Making LLMs Reliable When It Matters Most: A Five-Layer Architecture for High-Stakes Decisions [51.56484100374058]
現在の大規模言語モデル(LLM)は、実行前にアウトプットをチェックできるが、不確実な結果を伴う高い戦略決定には信頼性が低い検証可能な領域で優れている。
このギャップは、人間と人工知能(AI)システムの相互認知バイアスによって引き起こされ、そのセクターにおける評価と投資の持続可能性の保証を脅かす。
本報告では、7つのフロンティアグレードLDMと3つの市場向けベンチャーヴィグネットの時間的圧力下での系統的質的評価から生まれた枠組みについて述べる。
論文 参考訳(メタデータ) (2025-11-10T22:24:21Z) - Information-Theoretic Reward Modeling for Stable RLHF: Detecting and Mitigating Reward Hacking [78.69179041551014]
本稿では,インフォメーション・ボトルネックの原理に基づく情報理論報酬モデリングフレームワークを提案する。
InfoRMは、報酬の一般化を緩和するために、嗜好に無関係な情報をフィルタリングする。
IBLは分散レベルの正規化であり、そのような偏差を罰し、最適化の展望を効果的に拡張する。
論文 参考訳(メタデータ) (2025-10-15T15:51:59Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - A Game-Theoretic Analysis of Auditing Differentially Private Algorithms with Epistemically Disparate Herd [16.10098472773814]
本研究は,Stackelbergゲームアプローチを用いたアルゴリズム開発者に対する群集監査の効果について検討する。
透明性と説明責任を高めることで、Hed auditはプライバシ保護アルゴリズムの責任ある開発に寄与する。
論文 参考訳(メタデータ) (2024-04-24T20:34:27Z) - A fully decentralized auditing approach for edge computing: A Game-Theoretic Perspective [18.20120097647291]
エッジストレージは、アプリケーションベンダーに実行可能なデータストレージを提供する。
エッジコンピューティングシステムにキャッシュされたデータは、意図的または偶発的な障害の影響を受けやすい。
本稿では,データ完全性を保護するための分散型整合監査方式を提案する。
論文 参考訳(メタデータ) (2023-12-26T11:26:44Z) - TrustFed: A Reliable Federated Learning Framework with Malicious-Attack
Resistance [8.924352407824566]
フェデレートラーニング(FL)は、個々のデータのプライバシを確保しながら、複数のクライアント間で協調的な学習を可能にする。
本稿では,階層型監査に基づくFL(HiAudit-FL)フレームワークを提案する。
シミュレーションの結果、HiAudit-FLは、システムオーバーヘッドを小さくして、潜在的悪意のあるユーザを効果的に識別し、対処できることが示されている。
論文 参考訳(メタデータ) (2023-12-06T13:56:45Z) - Algorithmic Fairness and Vertical Equity: Income Fairness with IRS Tax
Audit Models [73.24381010980606]
本研究は、IRSによる税務監査選択を通知するシステムの文脈におけるアルゴリズムフェアネスの問題について検討する。
監査を選択するための柔軟な機械学習手法が、垂直エクイティにどのように影響するかを示す。
この結果は,公共セクター全体でのアルゴリズムツールの設計に影響を及ぼす。
論文 参考訳(メタデータ) (2022-06-20T16:27:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。