論文の概要: Defeater Cards: Characterizing and Managing Safety Assurance Case Defeaters
- arxiv url: http://arxiv.org/abs/2606.11462v1
- Date: Tue, 09 Jun 2026 21:33:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 15:01:10.305367
- Title: Defeater Cards: Characterizing and Managing Safety Assurance Case Defeaters
- Title(参考訳): ディフェータカード:安全保証ケースデフェータの特性と管理
- Authors: Usman Gohar, Michael C. Hunter, Salil Purandare, Jordan J. Rios, Myra B. Cohen, Robyn R. Lutz,
- Abstract要約: 安全保証のケースは、安全クリティカルなシステムが安全要件を満たすような構造化された正当化を提供する。
近年、敗者の概念は、安全議論の妥当性に挑戦する厳格な手段として浮上している。
本論文は,安全事例における敗者の体系的特徴付け,推論,管理を行うための,新たな構造化ドキュメントアーティファクトであるDefeater Cardsを提案する。
- 参考スコア(独自算出の注目度): 4.510181955306307
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Safety assurance cases provide structured justifications that safety-critical systems meet their safety requirements. Recently, the notion of defeaters has emerged as a rigorous means of challenging the validity of safety arguments. Examples of defeaters might include overly strict claims, unreliable evidence, or reasoning gaps. However, defeaters remain ad hoc, lack structured support for critical reflection, are inconsistently described, are difficult to review, and lack documentation standards. To address this, we propose Defeater Cards, a new structured documentation artifact for systematically characterizing, reasoning about, and managing defeaters in safety cases. Drawing on a literature survey and thematic analysis, we identify documentation criteria that inform the card's structure, based on the 5W1H framework. Defeater Cards are designed to support informed analysis and evolution, improve traceability and auditability, and enable the reuse of defeater knowledge across systems and product variants. We demonstrate their applicability through two cross-domain case studies, showing how they expose hidden assumptions, surface reasoning gaps, and support ongoing safety assurance case evolution. To support adoption and community reuse, we also release an open-source repository of defeater cards as a baseline upon which researchers and practitioners can build and describe lessons learned.
- Abstract(参考訳): 安全保証のケースは、安全クリティカルなシステムが安全要件を満たすような構造化された正当化を提供する。
近年、敗者の概念は、安全議論の妥当性に挑戦する厳格な手段として浮上している。
敗北者の例としては、過度に厳格な主張、信頼できない証拠、または推論ギャップがある。
しかし、敗者は厳密なままであり、批判的リフレクションに対する構造化されたサポートが欠如し、矛盾なく説明され、レビューが困難であり、ドキュメント標準が欠如している。
この問題を解決するために,安全事例における敗者の特徴を体系化し,推論し,管理するための新しい構造化文書であるDedeater Cardsを提案する。
文献調査とテーマ分析に基づいて,5W1Hフレームワークに基づいて,カードの構造を通知する文書の基準を特定した。
Defeater Cardsは、情報分析と進化をサポートし、トレーサビリティと監査性を改善し、システムや製品にまたがる敗者知識の再利用を可能にするように設計されている。
2つのクロスドメインケーススタディを通じて、それらの適用性を実証し、隠れた仮定を公開し、表面的推論ギャップを明らかにし、継続的な安全保証ケースの進化をサポートすることを示す。
採用とコミュニティの再利用を支援するため、研究者や実践者が学習した教訓を構築、記述できるベースラインとして、敗者カードのオープンソースリポジトリもリリースしています。
関連論文リスト
- Position: Behavioural Assurance Cannot Verify the Safety Claims Governance Now Demands [4.125187280299246]
我々は、慎重に設計しても、行動保証は検証できないという安全主張を遂行するよう求められていると論じている。
我々は,この構造ミスマッチを監査ギャップ,要求と達成可能な検証アクセスのばらつきとして形式化し,脆弱な保証の概念を導入する。
本稿では,法的文書における行動証拠の重み付けと,機械的証拠クラスによる自発的な事前配備アクセスの延長という技術的転換を提案する。
論文 参考訳(メタデータ) (2026-05-14T17:54:28Z) - When Models Outthink Their Safety: Mitigating Self-Jailbreak in Large Reasoning Models with Chain-of-Guardrails [74.63933201261595]
大規模推論モデル(LRM)は複雑な推論タスクにおいて顕著な能力を示す。
LRMは、有害なコンテンツ生成やジェイルブレイク攻撃など、深刻な安全リスクに弱いままである。
安全でない推論ステップを再構成またはバックトラックするトレーニングフレームワークであるChain-of-Guardrail(CoG)を提案する。
論文 参考訳(メタデータ) (2025-10-24T09:32:25Z) - ARMOR: Aligning Secure and Safe Large Language Models via Meticulous Reasoning [64.32925552574115]
ARMORは、jailbreak戦略を分析し、コアインテントを抽出する、大規模な言語モデルである。
ARMORは最先端の安全性能を達成し、平均有害率は0.002であり、高度な最適化ベースのジェイルブレイクに対する攻撃成功率は0.06である。
論文 参考訳(メタデータ) (2025-07-14T09:05:54Z) - Benchmarking Misuse Mitigation Against Covert Adversaries [80.74502950627736]
既存の言語モデルの安全性評価は、オーバースト攻撃と低レベルのタスクに重点を置いている。
我々は、隠蔽攻撃と対応する防御の評価を自動化するデータ生成パイプラインである、ステートフルディフェンスのためのベンチマーク(BSD)を開発した。
評価の結果,分解攻撃は有効な誤用防止剤であり,その対策としてステートフルディフェンスを強調した。
論文 参考訳(メタデータ) (2025-06-06T17:33:33Z) - Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z) - A Taxonomy of Real-World Defeaters in Safety Assurance Cases [4.4398355848251745]
ソフトウェアエンジニアリングコミュニティは、ソフトウェア保証ケースにおける現実世界の敗者の再利用可能な分類の恩恵を受けることができる。
安全クリティカルシステムにおける敗者の分析・管理を標準化するための基礎を築き,7つの幅広いカテゴリーの分類学を導出した。
論文 参考訳(メタデータ) (2025-02-01T00:38:41Z) - Illusions of Relevance: Using Content Injection Attacks to Deceive Retrievers, Rerankers, and LLM Judges [52.96987928118327]
検索,リランカー,大型言語モデル(LLM)の埋め込みモデルは,コンテンツインジェクション攻撃に対して脆弱であることがわかった。
主な脅威は,(1) 意味不明な内容や有害な内容の挿入,(2) 関連性を高めるために,問合せ全体あるいはキークエリ用語の挿入,の2つである。
本研究は, 注射内容の配置や関連物質と非関連物質とのバランスなど, 攻撃の成功に影響を与える要因を系統的に検討した。
論文 参考訳(メタデータ) (2025-01-30T18:02:15Z) - CoDefeater: Using LLMs To Find Defeaters in Assurance Cases [4.4398355848251745]
本稿では,大言語モデル (LLM) を利用して敗者を見つける自動化プロセスであるCoDefeaterを提案する。
2つのシステムの最初の結果は、LLMが安全アナリストを支援するために、既知の、予期せぬ破壊者を効率的に見つけることができることを示している。
論文 参考訳(メタデータ) (2024-07-18T17:16:35Z) - A PRISMA-Driven Bibliometric Analysis of the Scientific Literature on Assurance Case Patterns [7.930875992631788]
保証ケースはシステム障害を防ぐために使用できる。
それらは構造化された議論であり、様々な安全クリティカルなシステムの要求を議論し、中継することができる。
論文 参考訳(メタデータ) (2024-07-06T05:00:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。