論文の概要: A pragmatic classification of AI incident trajectories
- arxiv url: http://arxiv.org/abs/2604.21412v1
- Date: Thu, 23 Apr 2026 08:24:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-24 14:40:06.384143
- Title: A pragmatic classification of AI incident trajectories
- Title(参考訳): AIインシデント軌跡の実用的分類
- Authors: Isaak Mengesha, Branwen Owen, Charlie Collins, Tina Wong, Simon Mylius, Peter Slattery, Sean McGregor,
- Abstract要約: パブリックAIインシデントデータベースは、報告の正確性、デプロイメントの伸び、露出単位当たりの有害頻度のシフトの詳細な変化をカウントする。
我々は、明確な調査ポイントを確立し、有害度傾向からの露出を別々に推定し、その後、ガバナンス決定のための意味のある軌道カテゴリーに分類する単純な枠組みを提案する。
- 参考スコア(独自算出の注目度): 3.660810844382496
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Public AI incident database counts conflate changes in reporting propensity, deployment growth, and shifts in harm frequency per unit of exposure. These issues introduce significant uncertainties challenging public and corporate policy frameworks centred on realized risks. We propose a simple framework that establishes clear points of inquiry, separately estimates exposure from harm-rate trends, and then classifies into meaningful trajectory categories for governance decisions. The framework combines a structured monitoring question format (SORT) to clarify coverage decisions, a tiered estimation procedure calibrated to available evidence, and LLM-assisted incident matching against public databases. Applied to various monitoring questions, we draw conclusions regarding the monitoring ecosystem more broadly: Providing an essential interpretative classification, determining what can and cannot be claimed, and establishing that exposure estimation is required as AI deployments become increasingly common.
- Abstract(参考訳): パブリックAIインシデントデータベースは、報告の正確性、デプロイメントの伸び、露出単位当たりの有害頻度のシフトの詳細な変化をカウントする。
これらの問題は、現実的なリスクを中心とした公共および企業政策の枠組みに挑戦する重大な不確実性をもたらす。
我々は、明確な調査ポイントを確立し、有害度傾向からの露出を別々に推定し、その後、ガバナンス決定のための意味のある軌道カテゴリーに分類する単純な枠組みを提案する。
このフレームワークは、カバー範囲の決定を明らかにするための構造化監視質問フォーマット(SORT)と、利用可能な証拠に合わせて調整された階層化された推定手順と、パブリックデータベースに対するLLM支援インシデントマッチングを組み合わせたものである。
監視エコシステムに関する結論は,より広範なものだ: 本質的な解釈的分類の提供,主張可能なものとできないものの決定,そしてAIデプロイメントがますます一般的になるにつれて,露出推定が求められていること。
関連論文リスト
- Dual-Stage LLM Framework for Scenario-Centric Semantic Interpretation in Driving Assistance [3.7098231493739764]
本稿では,都市交通におけるリスク推論の再現可能な監査のためのシナリオ中心の枠組みを提案する。
LLMに基づく推論を安全に整合した運転支援システムに統合する場合、シナリオ中心の監査と明示的なあいまいさ管理の重要性を強調している。
論文 参考訳(メタデータ) (2026-03-29T06:20:08Z) - From Linear Risk to Emergent Harm: Complexity as the Missing Core of AI Governance [0.0]
リスクベースのAI規制は、予想される損害に対応する比例制御を約束する。
本稿では、そのようなフレームワークは構造上の理由から失敗することが多いと論じる。
我々は,規制を制御ではなく介入として扱う,AIガバナンスのための複雑性ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-14T14:19:21Z) - A Unified and Stable Risk Minimization Framework for Weakly Supervised Learning with Theoretical Guarantees [33.15955234458642]
完全かつ正確なラベルが取得にコストがかかる、あるいは不可能な場合には、完全に教師付き学習の代替として弱教師付き学習が実用化されている。
弱教師付きデータの構造に根ざした安定な代理リスクを定式化することにより、そのようなポストホック調整を回避できる、原則化された統一されたフレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-28T00:57:04Z) - SafeRBench: A Comprehensive Benchmark for Safety Assessment in Large Reasoning Models [60.8821834954637]
LRMの安全性をエンドツーエンドに評価する最初のベンチマークであるSafeRBenchを紹介する。
私たちは、リスクカテゴリとレベルを入力設計に組み込んだ先駆者です。
我々は,長い推論トレースを意味的に一貫性のある単位にセグメント化するためのマイクロシンクのチャンキング機構を導入する。
論文 参考訳(メタデータ) (2025-11-19T06:46:33Z) - Variance-Bounded Evaluation of Entity-Centric AI Systems Without Ground Truth: Theory and Measurement [0.0]
本稿では,エンティティ中心型AIシステムのための分散境界評価フレームワークであるVB-Scoreを紹介する。
VB-Scoreは制約緩和とモンテカルロサンプリングを通じて可算解釈を列挙する。
そして、システムの堅牢性を評価するために、システムアウトプットを解釈を越えて予測される成功によって評価し、分散によって罰する。
論文 参考訳(メタデータ) (2025-09-26T07:54:38Z) - MARBLE: A Multi-Agent Rule-Based LLM Reasoning Engine for Accident Severity Prediction [1.3102025155414727]
交通安全システムにおいて,事故重大度予測が重要な役割を担っている。
既存の方法はしばしばモノリシックモデルやブラックボックスプロンプトに依存している。
本稿では,多エージェントルールに基づくLLMエンジンを提案し,その重大性予測タスクを,専門的推論エージェントのチーム間で分解する。
論文 参考訳(メタデータ) (2025-07-07T11:27:49Z) - On Continuous Monitoring of Risk Violations under Unknown Shift [46.65571623109494]
進化するデータストリームにおけるリスク違反のリアルタイムモニタリングのための一般的なフレームワークを提案する。
我々の手法は、遭遇したシフトの性質について最小限の仮定の下で機能する。
本稿では,異常検出におけるリスクの監視と,さまざまなシフト下での予測によるアプローチの有効性について述べる。
論文 参考訳(メタデータ) (2025-06-19T15:52:24Z) - Few-shot Policy (de)composition in Conversational Question Answering [54.259440408606515]
本稿では,大規模言語モデル(LLM)を用いて数ショット設定でポリシーコンプライアンスを検出するニューラルシンボリックフレームワークを提案する。
提案手法は,回答すべきサブクエストを抽出し,文脈情報から真理値を割り当て,与えられたポリシーから論理文の集合を明示的に生成することで,政策コンプライアンスに関する会話に対して健全な理由を示す。
本手法は,PCDおよび会話機械読解ベンチマークであるShARCに適用し,タスク固有の微調整を伴わずに競合性能を示す。
論文 参考訳(メタデータ) (2025-01-20T08:40:15Z) - Stateful Offline Contextual Policy Evaluation and Learning [88.9134799076718]
我々は、シーケンシャルデータから、政治以外の評価と学習について研究する。
動的パーソナライズされた価格設定などの問題の因果構造を形式化する。
本報告では,本クラスにおけるアウト・オブ・サンプル・ポリシーの性能改善について述べる。
論文 参考訳(メタデータ) (2021-10-19T16:15:56Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。