論文の概要: Operational AI Deployment Assurance: Governance-State Orchestration Under Threshold-Sensitive Deployment Conditions -- A Governance Framework for High-Stakes AI Systems
- arxiv url: http://arxiv.org/abs/2605.27827v1
- Date: Wed, 27 May 2026 01:33:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.673833
- Title: Operational AI Deployment Assurance: Governance-State Orchestration Under Threshold-Sensitive Deployment Conditions -- A Governance Framework for High-Stakes AI Systems
- Title(参考訳): Operational AI Deployment Assurance: Threshold-Sensitive Deployment Conditionsの下でのガバナンス-状態オーケストレーション - 高度なAIシステムのためのガバナンスフレームワーク
- Authors: Khalid Adnan Alsayed,
- Abstract要約: 本稿では、公平性の不一致、不安定性、しきい値感度、修正結果、運用上の不確実性をデプロイメント指向の保証決定に翻訳するガバナンスフレームワークであるOperational AI Deployment Assurance(OADA)を紹介する。
提案するフレームワークでは,運用デプロイメント保証を,評価と実世界のAIデプロイメント間のガバナンスレイヤとして位置付けている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI governance frameworks increasingly emphasize fairness, transparency, accountability, and lifecycle risk management in high-stakes domains. However, many current approaches remain observational, relying on static metric reporting, post-hoc auditing, and monitoring dashboards without directly governing deployment readiness, remediation progression, escalation states, or assurance-driven deployment control. This paper introduces Operational AI Deployment Assurance (OADA), a governance framework for translating fairness disagreement, subgroup instability, threshold sensitivity, remediation outcomes, and operational uncertainty into deployment-oriented assurance decisions. Building on prior work on the Fairness Disagreement Index (FDI) and FairRisk-FDI, OADA reframes governance uncertainty as an operational concern within AI deployment pipelines rather than a byproduct of metric disagreement. The framework introduces Deployment Assurance Scores, Deployment Readiness Classifications, Threshold Stability Zones, Governance Escalation States, and remediation-aware assurance progression. These constructs support lifecycle-oriented governance decisions across high-stakes settings by connecting evaluation outputs to deployment-state interpretation, reassessment, escalation, and operational control. Through deployment-oriented evaluation across facial recognition systems, with discussion extended to healthcare AI as a representative high-stakes domain, the paper demonstrates how systems may appear acceptable under isolated fairness or performance metrics while still exhibiting instability that affects deployment readiness. The proposed framework positions operational deployment assurance as a governance layer between evaluation and real-world AI deployment.
- Abstract(参考訳): AIガバナンスフレームワークは、ハイテイクドメインにおける公正性、透明性、説明責任、ライフサイクルリスク管理をますます強調する。
しかし、現在の多くのアプローチは監視的であり、デプロイの準備、修正の進捗、エスカレーション状態、保証駆動デプロイメントコントロールを直接管理することなく、静的なメトリックレポート、ポストホック監査、ダッシュボードの監視に依存している。
本稿では、公平性の不一致、サブグループ不安定性、しきい値感度、修正結果、運用上の不確実性をデプロイ指向の保証決定に翻訳するためのガバナンスフレームワークであるOADA(Operational AI Deployment Assurance)を紹介する。
FDI(Fairness Disagreement Index)とFairRisk-FDI(FairRisk-FDI)に関する以前の作業に基づいて、OADAは、管理の不確実性を、メトリクスの不一致の副産物ではなく、AIデプロイメントパイプライン内の運用上の問題として再設定している。
このフレームワークには、Deployment Assurance Scores、Deployment Readiness Classifications、Threshold Stability Zones、Governance Escalation States、Remediation-Aware Assurance Progressionが導入されている。
これらの構造は、評価出力をデプロイメント状態の解釈、再評価、エスカレーション、運用管理に接続することで、ハイテイクな設定でライフサイクル指向のガバナンス決定をサポートする。
顔認識システム全体のデプロイメント指向評価を通じて、医療AIを代表的ハイテイクドメインとして論じるとともに、分離されたフェアネスやパフォーマンス指標の下でシステムがどのように受け入れられるかを示すとともに、デプロイメントの即応性に影響を与える不安定性を示す。
提案するフレームワークでは,運用デプロイメント保証を,評価と実世界のAIデプロイメント間のガバナンスレイヤとして位置付けている。
関連論文リスト
- Towards trustworthy agentic AI: a comprehensive survey of safety, robustness, privacy, and system security [57.35851886874902]
エージェントAIシステムは、複雑なタスクを自律的に実行するが、その多段階の軌道には、信頼性に挑戦する新たな障害モードが導入されている。
この調査では、リスクの高いデプロイメントに不可欠な2つのコアディメンションを通じて、信頼できるエージェントAIを精査する。
各次元について、重要な概念を明確にし、エージェントワークフローに沿ってリスクが発生する場所を特定し、ステージ目標の緩和戦略を要約する。
論文 参考訳(メタデータ) (2026-05-17T10:26:37Z) - EmbodiedGovBench: A Benchmark for Governance, Recovery, and Upgrade Safety in Embodied Agent Systems [14.412476605788482]
EmbodiedGovBenchは、エンボディエージェントシステムのガバナンス指向評価のためのベンチマークである。
現実的な摂動の下で、システムは制御可能か、ポリシーに縛られたか、回復可能か、監査可能か、進化安全かを評価する。
論文 参考訳(メタデータ) (2026-04-13T08:34:04Z) - Beyond Benchmark Islands: Toward Representative Trustworthiness Evaluation for Agentic AI [45.21562889170875]
シナリオ多様体に対するエージェントの信頼性を特徴付けるシステム評価パラダイムを提案する。
このフレームワークは,静的認知と政策分析,対話型サンドボックスシミュレーション,社会倫理アライメントアライメントアセスメント,および(iv)分散対応の代表サンプリングエンジンの4つの補完的コンポーネントを統合している。
論文 参考訳(メタデータ) (2026-03-16T08:51:33Z) - AI Governance Control Stack for Operational Stability: Achieving Hardened Governance in AI Systems [0.0]
本稿では、トレーサブルでレジリエントなAIシステムの動作を保証するために設計された階層型ガバナンスアーキテクチャである、運用安定のためのAIガバナンス制御スタックを紹介する。
提案したコントロールスタックには,システム・オブ・レコーズ・バージョン管理,エビデンスに基づく検証,意思決定時の説明可能性ロギング,テレメトリ監視,モデルドリフト検出,ガバナンスエスカレーションという,6つの補完的なガバナンスレイヤが統合されている。
論文 参考訳(メタデータ) (2026-03-12T19:01:42Z) - The Alignment Flywheel: A Governance-Centric Hybrid MAS for Architecture-Agnostic Safety [5.399984738447277]
本稿では、アライメントフライホイールをガバナンス中心のハイブリッドMASアーキテクチャとして定式化する。
執行層は実行時に明確なリスクポリシーを適用し、ガバナンスMASは監査、不確実性駆動による検証、バージョン管理による改善を通じてOracleを監督します。
アーキテクチャはProposerとSafety Oracleの両方に関して実装に依存せず、実行時ゲーティング、監査、署名されたパッチ、ステージングロールアウトに必要な役割、アーティファクト、プロトコル、リリースセマンティクスを指定する。
論文 参考訳(メタデータ) (2026-02-28T00:48:06Z) - Watermarking Without Standards Is Not AI Governance [46.71493672772134]
現在の実装は、効果的な監視を提供するのではなく、象徴的なコンプライアンスとして機能するリスクがある、と私たちは主張する。
本稿では,技術標準,監査インフラストラクチャ,実施機構を含む3層フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-27T18:10:04Z) - Beyond Explainability: The Case for AI Validation [0.0]
我々は、中央規制柱としての検証へのシフトを主張する。
AI出力の信頼性、一貫性、堅牢性を保証するバリデーションは、説明可能性に対してより実用的で、スケーラブルで、リスクに敏感な代替手段を提供する。
本稿では,事前・後検証,第三者監査,調和標準,債務インセンティブを中心に,先進的な政策枠組みを提案する。
論文 参考訳(メタデータ) (2025-05-27T06:42:41Z) - Human-AI Governance (HAIG): A Trust-Utility Approach [0.0]
本稿では,人間とAIの関係が進化する中で,信頼のダイナミクスを分析するためのHAIGフレームワークを紹介する。
我々の分析は、自己監督、推論権限、分散意思決定の技術的進歩が、不均一な信頼の進化をいかに引き起こすかを明らかにする。
論文 参考訳(メタデータ) (2025-05-03T01:57:08Z) - Accountability in Offline Reinforcement Learning: Explaining Decisions
with a Corpus of Examples [70.84093873437425]
本稿では、オフラインデータセットを決定コーパスとして利用するAOC(Accountable Offline Controller)を紹介する。
AOCはローデータシナリオで効果的に動作し、厳密なオフラインの模倣設定まで拡張でき、保存性と適応性の両方の品質を示す。
シミュレーションおよび実世界の医療シナリオにおいて、AOCのパフォーマンスを評価し、説明責任を維持しながら高いレベルのパフォーマンスでオフライン制御タスクを管理する能力を強調した。
論文 参考訳(メタデータ) (2023-10-11T17:20:32Z) - Safety Margins for Reinforcement Learning [53.10194953873209]
安全マージンを生成するためにプロキシ臨界度メトリクスをどのように活用するかを示す。
Atari 環境での APE-X と A3C からの学習方針に対するアプローチを評価する。
論文 参考訳(メタデータ) (2023-07-25T16:49:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。