論文の概要: Towards Auditing AI Systems in the Wild
- arxiv url: http://arxiv.org/abs/2606.17367v1
- Date: Mon, 15 Jun 2026 23:52:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.178558
- Title: Towards Auditing AI Systems in the Wild
- Title(参考訳): 野生におけるAIシステムの監査に向けて
- Authors: Aditya T. Vadlamani, Anutam Srinivasan, Srinivasan Parthasarathy,
- Abstract要約: ライフサイクルを通じてデプロイされたAIシステムを監視する、原則化された監査フレームワークの開発を議論する。
この視点は、不確実性を認識した監視方法、監査基準の社会技術的仕様、監査インフラの必要性を強調している。
- 参考スコア(独自算出の注目度): 3.9549290063964313
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: AI systems are increasingly deployed in real-world settings where their behavior is shaped by dynamic environments, evolving data distributions, and complex interactions with users and infrastructure. Traditional machine learning evaluation focuses on benchmarks and operates within sandboxed environments, providing only a limited view of the true system behavior in the wild. We argue for the development of principled auditing frameworks that monitor deployed AI systems throughout their lifecycle. We further propose framing auditing as a statistical problem of monitoring constraint violations under uncertainty, where desired properties (e.g., fairness and safety) are treated as risk-controlled constraints that must be continuously evaluated as systems evolve through iterative feedback. This perspective highlights the need for uncertainty-aware monitoring methods, socio-technical specifications of audit criteria, and auditing infrastructures that enable ongoing oversight of AI systems in the wild.
- Abstract(参考訳): AIシステムは、動的環境、データ分散の進化、ユーザやインフラストラクチャとの複雑なインタラクションによって、その振る舞いが形作られる現実的な環境に、ますます多くデプロイされている。
従来の機械学習評価は、ベンチマークに焦点を当て、サンドボックス環境内で運用する。
ライフサイクルを通じてデプロイされたAIシステムを監視する、原則化された監査フレームワークの開発を議論する。
また,不確実性下における制約違反の統計的問題としてフレーミング監査を提案し,所望の特性(公正性,安全性)を,反復的フィードバックを通じてシステムの進化とともに継続的に評価されなければならないリスク制御制約として扱う。
この視点は、不確実性を認識した監視方法、監査基準の社会技術的仕様、AIシステムの継続的な監視を可能にする監査インフラストラクチャの必要性を強調している。
関連論文リスト
- Exploring Systems-Thinking Approaches to Loss of Control Risk [0.0]
コーディングと研究のためのエージェントAIシステムの内部展開は、モデル行動を超えた社会技術制御問題を生み出す。
我々は、内部デプロイの損失を、AIによる変更を確実に制限、監査、リバース、または停止することができないものとして扱います。
確立されたシステムセーフティ手法が、モデルレベルの評価が見逃す可能性のあるリスクを識別できるかどうかを問う。
論文 参考訳(メタデータ) (2026-06-11T15:27:31Z) - From Review to Design: Ethical Multimodal Driver Monitoring Systems for Risk Mitigation, Incident Response, and Accountability in Automated Vehicles [4.497527935481453]
本稿では,ドライバ監視システムに特化したモジュール型倫理設計フレームワークを提案する。
このフレームワークは、高レベルの原則を実行可能な設計とデプロイメントのガイダンスに変換する。
これらのコントリビューションは、透明で信頼性が高く、人間中心のドライバー監視システムの開発を知らせることを目的としている。
論文 参考訳(メタデータ) (2026-05-07T15:40:17Z) - Frontier AI Auditing: Toward Rigorous Third-Party Assessment of Safety and Security Practices at Leading AI Companies [57.521647436515785]
私たちはフロンティアAIの監査を、フロンティアAI開発者の安全とセキュリティに関する主張の厳格な第三者による検証として定義しています。
本稿では,AI保証レベル(AAL-1からAAL-4)について紹介する。
論文 参考訳(メタデータ) (2026-01-16T18:44:09Z) - Monitoring Deployed AI Systems in Health Care [8.240297189233528]
医療における人工知能(AI)システムのデプロイ後モニタリングは、その安全性、品質、持続的な利益を保証するために不可欠である。
このフレームワークは,3つの補完的原則 – システムの完全性,パフォーマンス,影響 – に基づいて構成されている。
それは、AIデプロイメントが時間とともに安全で効果的であることを保証するために、医療システムに実用的なテンプレートと出発点を提供する。
論文 参考訳(メタデータ) (2025-12-09T19:06:48Z) - Lost in Vagueness: Towards Context-Sensitive Standards for Robustness Assessment under the EU AI Act [2.740981829798319]
ロバストネスは、EU人工知能法(AI法)に基づくリスクの高いAIシステムにとって重要な要件である
本稿では,AIシステムが堅牢であることの意味を考察し,文脈に敏感な標準化の必要性を示す。
論文 参考訳(メタデータ) (2025-11-19T17:06:36Z) - Variance-Bounded Evaluation of Entity-Centric AI Systems Without Ground Truth: Theory and Measurement [0.0]
本稿では,エンティティ中心型AIシステムのための分散境界評価フレームワークであるVB-Scoreを紹介する。
VB-Scoreは制約緩和とモンテカルロサンプリングを通じて可算解釈を列挙する。
そして、システムの堅牢性を評価するために、システムアウトプットを解釈を越えて予測される成功によって評価し、分散によって罰する。
論文 参考訳(メタデータ) (2025-09-26T07:54:38Z) - Safe and Certifiable AI Systems: Concepts, Challenges, and Lessons Learned [45.44933002008943]
この白書は、T"UV AUSTRIA Trusted AIフレームワークを提示する。
エンド・ツー・エンドの監査カタログであり、機械学習システムの評価と認定のための方法論である。
セキュアなソフトウェア開発、機能要件、倫理とデータプライバシという3つの柱の上に構築されているのは、EU AI Actの高レベルの義務を、特定かつテスト可能な基準に翻訳するものです。
論文 参考訳(メタデータ) (2025-09-08T17:52:08Z) - Verification of Visual Controllers via Compositional Geometric Transformations [49.81690518952909]
到達可能な集合の外部近似を生成できる知覚ベースのコントローラのための新しい検証フレームワークを提案する。
提案手法の音質を理論的に保証し,ベンチマーク制御環境における有効性を示す。
論文 参考訳(メタデータ) (2025-07-06T20:22:58Z) - On Continuous Monitoring of Risk Violations under Unknown Shift [46.65571623109494]
進化するデータストリームにおけるリスク違反のリアルタイムモニタリングのための一般的なフレームワークを提案する。
我々の手法は、遭遇したシフトの性質について最小限の仮定の下で機能する。
本稿では,異常検出におけるリスクの監視と,さまざまなシフト下での予測によるアプローチの有効性について述べる。
論文 参考訳(メタデータ) (2025-06-19T15:52:24Z) - Safely Learning Controlled Stochastic Dynamics [61.82896036131116]
システム力学の安全な探索と効率的な推定を可能にする手法を提案する。
学習後、学習モデルはシステムのダイナミクスの予測を可能にし、任意の制御の安全性検証を可能にする。
我々は、真の力学のソボレフ正則性を高めることにより、安全性と適応学習率の向上を理論的に保証する。
論文 参考訳(メタデータ) (2025-06-03T11:17:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。