論文の概要: A Subjective Logic-based method for runtime confidence updates in safety arguments
- arxiv url: http://arxiv.org/abs/2605.22530v1
- Date: Thu, 21 May 2026 14:20:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.292864
- Title: A Subjective Logic-based method for runtime confidence updates in safety arguments
- Title(参考訳): 安全議論における実行時信頼度更新のための主観論理に基づく手法
- Authors: Benjamin Herd, Jessica Kelly, Clarissa Heinemann, João-Vitor Zacchi,
- Abstract要約: 本稿では,静的安全性を向上し,実行時の信頼度を継続的に更新する動的量保証手法を提案する。
設計時エビデンスとウィンドウ化されたランタイム安全性能指標(SPI)を統合することにより、開発ライフサイクル全体の信頼度を定量化し、伝播する手法である。
実行時にSPIエビデンスを継続的に評価し、対象のクレームは、違反の欠如に対する信頼性を高め、違反が発生した場合に即時罰則を課すルールを使用して更新される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a method for dynamic quantitative assurance that enhances static safety cases with continuous, runtime-driven confidence updates. The method quantifies and propagates confidence across the development lifecycle by integrating design-time evidence and windowed runtime Safety Performance Indicators (SPIs) within a single Subjective Logic (SL)-based assurance case. At runtime, SPI evidence is continuously evaluated, and targeted claims are updated using a rule that increases confidence in the absence of violations and imposes prompt penalties when violations occur. This design prioritizes safety-relevant responsiveness over exact classical Bayesian posterior updates. We demonstrate the method using a simulation-based construction zone assist function, focusing on an ML-based construction cone detection component, and show how confidence evolves as SPI evidence is observed in operation.
- Abstract(参考訳): 本稿では,静的安全性を向上し,実行時の信頼度を継続的に更新する動的量保証手法を提案する。
設計時エビデンスとウィンドウ化されたランタイムセーフティパフォーマンス指標(SPI)を1つの主観的論理(SL)ベースの保証ケースに統合することにより、開発ライフサイクル全体の信頼性を定量化し、伝播する。
実行時にSPIエビデンスを継続的に評価し、対象のクレームは、違反の欠如に対する信頼性を高め、違反が発生した場合に即時罰則を課すルールを使用して更新される。
この設計は、古典的ベイズの後続更新よりも安全関連応答性を優先する。
シミュレーションベース構築ゾーンアシスト機能を用いて,MLベース構築コーン検出コンポーネントに着目し,SPIエビデンスが動作中にどのように進化するかを示す。
関連論文リスト
- False Security Confidence in Benign LLM Code Generation [0.0]
このメモは、補完的だが異なるフレーミングを紹介している。 偽セキュリティ信頼(FSC)。
FSCは、通常の非攻撃フレーム生成タスクにおいて、測定ファーストの観点から同じ表面現象を研究する。
我々はFSCレートを,機能的に正しい出力セット内のセキュリティ障害の頻度として定式化する。
論文 参考訳(メタデータ) (2026-04-18T14:52:26Z) - Safe Reinforcement Learning via Recovery-based Shielding with Gaussian Process Dynamics Models [57.006252510102506]
強化学習(Reinforcement Learning, RL)は、最適な意思決定と制御のための強力なフレームワークである。
本稿では,未知および非線形連続力学系に対する安全性を低くした安全RLを実現するための新しい回復型遮蔽フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T22:03:35Z) - SPAN: Continuous Modeling of Suspicion Progression for Temporal Intention Localization [26.07264704956791]
本稿では,個別分類から連続回帰へ移行するSuspicion Progression Analysis Network (SPAN)を提案する。
SPANは低周波のケースでは2.74%のmAPゲインを達成し、微妙な行動変化を捉える優れた能力を示している。
論文 参考訳(メタデータ) (2025-10-23T04:20:07Z) - CARE: Decoding Time Safety Alignment via Rollback and Introspection Intervention [68.95008546581339]
Contrastive Decodingのような既存のデコーディングタイムの介入は、安全と応答品質の間に深刻なトレードオフを強いることが多い。
本稿では,3つの重要なコンポーネントを統合した,復号時安全アライメントのための新しいフレームワークであるCAREを提案する。
このフレームワークは、安全性、品質、効率のバランスが良く、有害な応答率が低く、ユーザエクスペリエンスを最小限に破壊できる。
論文 参考訳(メタデータ) (2025-09-01T04:50:02Z) - Temporalizing Confidence: Evaluation of Chain-of-Thought Reasoning with Signal Temporal Logic [0.12499537119440243]
本稿では,段階的信頼度を時間的信号としてモデル化し,STL(Signal Temporal Logic)を用いて評価する構造化フレームワークを提案する。
特に,定型的なSTLに基づく制約を定義し,望ましい時間特性と,構造化された解釈可能な信頼度推定として機能するスコアを求める。
本手法はキャリブレーションの指標を常に改善し,従来の信頼度集計やポストホックキャリブレーションよりも信頼性の高い不確実性推定を提供する。
論文 参考訳(メタデータ) (2025-06-09T21:21:12Z) - Aurora: Are Android Malware Classifiers Reliable and Stable under Distribution Shift? [51.12297424766236]
AURORAは、その信頼性と運用上のレジリエンスに基づいて、マルウェア分類器を評価するためのフレームワークである。
AURORAは、ポイント・イン・タイムのパフォーマンスを超えるように設計されたメトリクスのセットによって補完される。
さまざまなドリフトのデータセットにわたるSOTAフレームワークの脆弱性は、ホワイトボードへの復帰の必要性を示唆している。
論文 参考訳(メタデータ) (2025-05-28T20:22:43Z) - Advancing Embodied Agent Security: From Safety Benchmarks to Input Moderation [52.83870601473094]
エンボディード・エージェントは、複数のドメインにまたがって大きな潜在能力を示す。
既存の研究は主に、一般的な大言語モデルのセキュリティに重点を置いている。
本稿では, エンボディエージェントの保護を目的とした新しい入力モデレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-22T08:34:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。