論文の概要: A Benchmark for Strategic Auditee Gaming Under Continuous Compliance Monitoring
- arxiv url: http://arxiv.org/abs/2605.06340v1
- Date: Thu, 07 May 2026 14:28:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.89957
- Title: A Benchmark for Strategic Auditee Gaming Under Continuous Compliance Monitoring
- Title(参考訳): 継続的コンプライアンスモニタリングによる戦略的オーディティーゲーミングのベンチマーク
- Authors: Florian A. D. Burnat, Brittany I. Davidson,
- Abstract要約: 継続的デプロイ後のコンプライアンス監査は、戦略的なゲームのクラスを作成します。
我々は,時間的方針にコミットする監査者と適応監査人との間に,$T$ラウンドのStackelbergゲームとして継続的監査を形式化する。
- 参考スコア(独自算出の注目度): 1.253312107729806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Continuous post-deployment compliance audits, mandated by emerging regulations such as the EU AI Act and Digital Services Act, create a class of strategic gaming distinct from the one-shot input/output gaming studied in prior work. Regulated systems can delay outcome reporting, drift their reports within plausible noise envelopes, exploit longitudinal sample attrition, and cherry-pick among ambiguous metric definitions. We formalize continuous auditing as a $T$-round Stackelberg game between an auditor that commits to a temporal policy and an adaptive auditee, and identify a structural feature of any noise-aware static-auditor design: a cover regime in which coverage gaps and granularity gaps cannot be closed simultaneously. We make this formal as Observation 1 and show that two minimal extension policies, each derived from the observation, close the regime along orthogonal axes: a sample-size-aware static rule (Periodic-with-floor) closes the granularity-failure case, while a history-conditioned suspicion-escalation policy closes the coverage-failure case for the naive Drift strategy -- and neither closes both, exactly as the observation predicts; an audit-aware OffAuditDrift strategy that exploits Stackelberg commitment defeats both. To support empirical study we contribute a non-additive harm decomposition (welfare loss $W$, coverage loss $C$) that exposes how attrition shifts harm from the regulator-accountable surface to a regulator-invisible one; an initial library of five auditee strategies (Delay, Drift, Cherry-pick, Attrition, OffAuditDrift) and five auditor policies, calibrated to summary statistics from published audits of the DSA Transparency Database; and a reproducible simulator with a small, extensible Python interface.
- Abstract(参考訳): EU AI ActやDigital Services Actといった新たな規制が義務付けられている継続的デプロイ後のコンプライアンス監査は、以前の研究で研究されたワンショットの入出力ゲームとは異なる、戦略的なゲーミングのクラスを作成する。
規制されたシステムは、結果の報告を遅らせ、可塑性ノイズエンベロープ内に報告を流し込み、縦断的なサンプルの減少と、曖昧なメートル法定義の中でチェリーピックを利用することができる。
本研究では,時間的政策にコミットする監査者と,適応的な監査人との間にある$T$ラウンドのStackelbergゲームとして継続的監査を形式化し,ノイズ認識型静的オーディタ設計の構造的特徴を同定する。
サンプルサイズを意識した静的規則 (Periodic-with-floor) は粒度の欠陥を解消し、履歴条件の疑似エスカレーションポリシーはナイーブドリフト戦略のカバレッジ障害のケースを閉鎖する。
実験的な研究をサポートするために、我々は、非付加的な害分解($W$、カバレッジ損失$C$)に貢献する。これは、規制対象の可算面から規制対象の可視面への有害な変化を露呈するものであり、最初のライブラリは、監査人戦略(Delay、Drift、Cherry-pick、Attrition、OFAuditDrift)と5つの監査者ポリシーで、DSA Transparency Databaseの公開された監査の統計をまとめて調整し、小さな、拡張可能なPythonインターフェースを備えた再現可能なシミュレータである。
関連論文リスト
- ECoLAD: Deployment-Oriented Evaluation for Automotive Time-Series Anomaly Detection [1.7751300245073598]
時系列異常検出器は、制約のない実行下で、ワークステーションクラスのハードウェアで一般的に比較される。
しかし、車内監視は、限られたCPU並列性の下で予測可能なレイテンシと安定した動作を必要とする。
本稿では,プロプライエタリな自動車テレメトリに関する実証的研究として,デプロイ指向評価プロトコルであるECoLADを提案する。
論文 参考訳(メタデータ) (2026-03-11T16:08:56Z) - Adversarial Intent is a Latent Variable: Stateful Trust Inference for Securing Multimodal Agentic RAG [5.4716896485317195]
マルチモーダルエージェントRAGに対する現在のステートレスディフェンスは、悪意のあるセマンティクスを配布する敵の戦略を検出するのに失敗する。
MMA-RAGTは,MTA (Modular Trust Agent) が管理する推定時制御フレームワークで,ほぼ信頼状態を維持している。
論文 参考訳(メタデータ) (2026-02-24T23:52:27Z) - Conformal Tradeoffs: Guarantees Beyond Coverage [0.02648566468224904]
配置されたコンフォーマル予測器は、有限操作ウィンドウ上で稼働する長期間の意思決定基盤である。
マージのカバレッジは、デプロイメントに直面する量を特定しません。
私たちは、範囲を超えて運用の認証と計画のためのフレームワークを提供しています。
論文 参考訳(メタデータ) (2026-02-20T07:58:25Z) - Preventing the Collapse of Peer Review Requires Verification-First AI [49.995126139461085]
我々は、真理結合、すなわち、過度に科学的真理をトラックする場所のスコアの厳密さを提案する。
プロキシ・ソブリン評価に向けた相転移を駆動する2つの力の形式化を行う。
論文 参考訳(メタデータ) (2026-01-23T17:17:32Z) - Audit the Whisper: Detecting Steganographic Collusion in Multi-Agent LLMs [0.0]
Audit the Whisperは、理論、ベンチマーク設計、検出、検証にまたがるカンファレンスグレードの研究成果物である。
i) パラフレーズ, レート制限, 役割置換などの介入が, ペアリングしたKullback-Leibler診断によって定量的なペナルティの操作を課すことを示すチャネル容量分析を行った。
我々は、匿名化された再生スクリプト、匿名化されたマニフェスト、ドキュメントをリリースし、外部監査官がすべての図を再現し、二重盲検要件を満たし、最小限の努力でフレームワークを拡張します。
論文 参考訳(メタデータ) (2025-10-05T17:51:52Z) - Unsupervised Conformal Inference: Bootstrapping and Alignment to Control LLM Uncertainty [49.19257648205146]
生成のための教師なし共形推論フレームワークを提案する。
我々のゲートは、分断されたUPPよりも厳密で安定した閾値を提供する。
その結果は、ラベルのない、API互換の、テスト時間フィルタリングのゲートになる。
論文 参考訳(メタデータ) (2025-09-26T23:40:47Z) - When Does Confidence-Based Cascade Deferral Suffice? [69.28314307469381]
カスケードは、推論コストをサンプル毎に適応的に変化させる古典的な戦略である。
deferralルールは、シーケンス内の次の分類子を呼び出すか、または予測を終了するかを決定する。
カスケードの構造に執着しているにもかかわらず、信頼に基づく推論は実際は極めてうまく機能することが多い。
論文 参考訳(メタデータ) (2023-07-06T04:13:57Z) - Hallucinated Adversarial Control for Conservative Offline Policy
Evaluation [64.94009515033984]
本研究では,環境相互作用のオフラインデータセットが与えられた場合,政策のパフォーマンスを低く抑えることを目的とした,保守的非政治評価(COPE)の課題について検討する。
本稿では,遷移力学の不確実性を考慮した学習モデルに基づくHAMBOを紹介する。
結果のCOPE推定値が妥当な下界であることを証明し、正則性条件下では、真に期待された戻り値への収束を示す。
論文 参考訳(メタデータ) (2023-03-02T08:57:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。