論文の概要: OntoGSN: An Ontology for Dynamic Management of Assurance Cases
- arxiv url: http://arxiv.org/abs/2506.11023v1
- Date: Tue, 20 May 2025 08:15:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-22 23:32:14.484009
- Title: OntoGSN: An Ontology for Dynamic Management of Assurance Cases
- Title(参考訳): OntoGSN:保証事例の動的管理のためのオントロジー
- Authors: Tomas Bueno Momcilovic, Barbara Gallina, Ingmar Kessler, Dian Balta,
- Abstract要約: IntoGSN: Ontology and support OWL for management ACs in the Goalcturing Notation (GSN) standard。
OntoGSNは知識表現とクエリ可能なグラフを提供する。
我々は,大規模言語モデルにおけるロバスト性の保証を含む事例において,コントリビューションの有用性を実証する。
- 参考スコア(独自算出の注目度): 0.3999851878220878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Assurance cases (ACs) are a common artifact for building and maintaining confidence in system properties such as safety or robustness. Constructing an AC can be challenging, although existing tools provide support in static, document-centric applications and methods for dynamic contexts (e.g., autonomous driving) are emerging. Unfortunately, managing ACs remains a challenge, since maintaining the embedded knowledge in the face of changes requires substantial effort, in the process deterring developers - or worse, producing poorly managed cases that instill false confidence. To address this, we present OntoGSN: an ontology and supporting middleware for managing ACs in the Goal Structuring Notation (GSN) standard. OntoGSN offers a knowledge representation and a queryable graph that can be automatically populated, evaluated, and updated. Our contributions include: a 1:1 formalization of the GSN Community Standard v3 in an OWL ontology with SWRL rules; a helper ontology and parser for integration with a widely used AC tool; a repository and documentation of design decisions for OntoGSN maintenance; a SPARQL query library with automation patterns; and a prototypical interface. The ontology strictly adheres to the standard's text and has been evaluated according to FAIR principles, the OOPS framework, competency questions, and community feedback. The development of other middleware elements is guided by the community needs and subject to ongoing evaluations. To demonstrate the utility of our contributions, we illustrate dynamic AC management in an example involving assurance of adversarial robustness in large language models.
- Abstract(参考訳): 保証ケース(AC: Assurance Case)は、安全性や堅牢性といったシステム特性の構築と信頼性維持のための一般的な成果物である。
ACの構築は難しい場合があるが、既存のツールは静的なドキュメント中心のアプリケーションと動的コンテキスト(例えば自律運転)のためのメソッドをサポートする。
残念なことに、ACの管理は依然として課題であり、変更に直面した組み込みの知識を維持するには相当な努力が必要だ。
そこで我々は OntoGSN: Ontology and support middleware for management ACs in the Goal Structuring Notation (GSN) standard。
OntoGSNは知識表現とクエリ可能なグラフを提供する。
SWRLルールを備えたOWLオントロジーにおけるGSN Community Standard v3の1:1の形式化、広く使用されているACツールとの統合のためのヘルパーオントロジーとパーサ、OntoGSN保守のための設計決定のリポジトリとドキュメント、自動化パターンを備えたSPARQLクエリライブラリ、プロトタイプインターフェースなどです。
オントロジーは標準のテキストに厳密に準拠しており、FAIRの原則、OOPSフレームワーク、能力に関する質問、コミュニティからのフィードバックに従って評価されている。
他のミドルウェア要素の開発は、コミュニティのニーズによってガイドされ、継続的な評価の対象となっている。
提案するコントリビューションの有用性を示すために,大規模言語モデルにおける対角的ロバスト性の保証を含む例で,動的AC管理について解説する。
関連論文リスト
- Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.075587392477935]
オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文 参考訳(メタデータ) (2026-01-20T06:42:56Z) - From Completion to Editing: Unlocking Context-Aware Code Infilling via Search-and-Replace Instruction Tuning [81.97788535387286]
本稿では,エージェントによる検証・編集機構を統一された単一パス推論プロセスに内部化するフレームワークを提案する。
最小限のデータで、SRI-Coderは、ChatモデルがBaseモデルの完了性能を上回ることができる。
FIMスタイルのチューニングとは異なり、SRIは一般的なコーディング能力を保持し、標準のFIMに匹敵する推論遅延を維持する。
論文 参考訳(メタデータ) (2026-01-19T20:33:53Z) - ABC-Bench: Benchmarking Agentic Backend Coding in Real-World Development [72.4729759618632]
本稿では,現実的かつ実行可能なワークフロー内でエージェントバックエンドコーディングを評価するベンチマークであるABC-Benchを紹介する。
オープンソースリポジトリから8つの言語と19のフレームワークにまたがる224の実践的なタスクをキュレートしました。
我々の評価は、最先端モデルでさえ、これらの総合的なタスクに対して信頼性の高いパフォーマンスを提供するのに苦労していることを示している。
論文 参考訳(メタデータ) (2026-01-16T08:23:52Z) - AJAR: Adaptive Jailbreak Architecture for Red-teaming [1.356919241968803]
AJARは概念実証フレームワークであり、"赤チーム"と"アクションセキュリティ"のギャップを埋めるように設計されている。
AJARは実行ループから逆ロジックを分離し、X-Teamingのような最先端のアルゴリズムを標準化されたプラグイン・アンド・プレイサービスとしてカプセル化する。
AJARは、この出現する攻撃面の標準化された環境対応評価を容易にするために、オープンソース化されている。
論文 参考訳(メタデータ) (2026-01-16T03:30:40Z) - Monadic Context Engineering [59.95390010097654]
本稿では,エージェント設計の正式な基盤を提供するために,モナディックコンテキストエンジニアリング(MCE)を紹介する。
我々は、モナドがロバストなコンポジションをどのように実現し、Applicativesが並列実行に原則化された構造を提供し、また、モナドトランスフォーマーがこれらの機能の体系的なコンポジションをどのように可能にしているかを実証する。
この階層化されたアプローチにより、開発者は、単純で独立した検証可能なコンポーネントから、複雑でレジリエントで効率的なAIエージェントを構築することができる。
論文 参考訳(メタデータ) (2025-12-27T01:52:06Z) - Autonomous Issue Resolver: Towards Zero-Touch Code Maintenance [0.0]
標準コードプロパティグラフからデータ変換グラフ(DTG)の概念へのパラダイムシフトを提案する。
本稿では,データ整合性ナビゲーションを制御フロー論理で整合するマルチエージェントフレームワークを提案する。
我々の手法はいくつかのSWEベンチマークで良い結果を示し、解像度は87.1%に達した。
論文 参考訳(メタデータ) (2025-12-09T11:11:37Z) - Everything is Context: Agentic File System Abstraction for Context Engineering [11.63011212134865]
本稿では,コンテキスト工学のためのファイルシステム抽象化を提案する。
この抽象化は、異種コンテキストアーティファクトを管理するための永続的で管理されたインフラストラクチャを提供する。
GenAIが意思決定支援の活発な協力者となるにつれ、人間はキュレーター、検証者、共犯者としての中心的な役割を担っている。
論文 参考訳(メタデータ) (2025-12-05T06:56:45Z) - BarrierBench : Evaluating Large Language Models for Safety Verification in Dynamical Systems [4.530582224312311]
バリア証明書合成のための LLM ベースのエージェントフレームワークを提案する。
このフレームワークは自然言語推論を使用して、候補証明書を提案し、洗練し、検証する。
BarrierBenchは、線形、非線形、離散時間、連続時間設定にまたがる100の動的システムのベンチマークである。
論文 参考訳(メタデータ) (2025-11-12T14:23:49Z) - Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - Osprey: A Scalable Framework for the Orchestration of Agentic Systems [0.4970364068620607]
Osprey Frameworkはスケーラブルなエージェントシステムのためのプロダクション対応アーキテクチャで、会話コンテキストと安全なクリティカルドメイン間の堅牢なツールオーケストレーションを統合する。
i) 関連するツールのみを選択する動的機能分類、(ii) 明示的な依存関係とオプションの人間による承認を伴う計画ファーストオーケストレーション、(iii) 対話履歴と外部メモリとドメインリソースを組み合わせたコンテキスト対応タスク抽出。
論文 参考訳(メタデータ) (2025-08-20T20:57:13Z) - Generative AI-Empowered Secure Communications in Space-Air-Ground Integrated Networks: A Survey and Tutorial [107.26005706569498]
宇宙航空地上統合ネットワーク(SAGIN)は、その特性上、前例のないセキュリティ上の課題に直面している。
Generative AI(GAI)は、データを合成し、セマンティクスを理解し、自律的な決定を行うことで、SAGINセキュリティを保護できる変革的アプローチである。
論文 参考訳(メタデータ) (2025-08-04T01:42:57Z) - Think Like an Engineer: A Neuro-Symbolic Collaboration Agent for Generative Software Requirements Elicitation and Self-Review [23.26988707110507]
本稿では、因果効果グラフ(CEG)をニューロシンボリックなコラボレーションアーキテクチャに組み込む、要求誘発と自己レビューエージェントであるRequireCEGを紹介する。
提案手法を評価するため,RGPairベンチマークデータセットを作成し,広範な実験を行った。
論文 参考訳(メタデータ) (2025-07-20T13:59:00Z) - On Automating Security Policies with Contemporary LLMs [3.47402794691087]
本稿では、テキスト内学習と検索強化生成(RAG)の革新的組み合わせにより、攻撃緩和ポリシーコンプライアンスを自動化するフレームワークを提案する。
STIXv2 フォーマットと Windows API ドキュメントで公開されている CTI ポリシを用いて実施した実証評価では,RAG ベースラインに比べて精度,リコール,F1 スコアの大幅な向上が示されている。
論文 参考訳(メタデータ) (2025-06-05T09:58:00Z) - A Novel Zero-Trust Identity Framework for Agentic AI: Decentralized Authentication and Fine-Grained Access Control [7.228060525494563]
本稿では,Agentic AI IAMフレームワークの提案について述べる。
リッチで検証可能なエージェント識別子(ID)に基づく包括的フレームワークを提案する。
また、Zero-Knowledge Proofs(ZKPs)によって、プライバシ保護属性の開示と検証可能なポリシーコンプライアンスを実現する方法について検討する。
論文 参考訳(メタデータ) (2025-05-25T20:21:55Z) - Advancing Neural Network Verification through Hierarchical Safety Abstract Interpretation [52.626086874715284]
我々は、安全でない出力の階層構造を検証する抽象的DNN検証と呼ばれる新しい問題定式化を導入する。
出力到達可能な集合に関する抽象的解釈と推論を活用することにより,形式的検証プロセスにおいて,複数の安全性レベルを評価することができる。
我々の貢献には、新しい抽象的安全性の定式化と既存のアプローチとの関係を理論的に探求することが含まれる。
論文 参考訳(メタデータ) (2025-05-08T13:29:46Z) - Towards Trustworthy GUI Agents: A Survey [64.6445117343499]
本調査では,GUIエージェントの信頼性を5つの重要な次元で検証する。
敵攻撃に対する脆弱性、シーケンシャルな意思決定における障害モードのカスケードなど、大きな課題を特定します。
GUIエージェントが普及するにつれて、堅牢な安全基準と責任ある開発プラクティスを確立することが不可欠である。
論文 参考訳(メタデータ) (2025-03-30T13:26:00Z) - A Survey on (M)LLM-Based GUI Agents [62.57899977018417]
グラフィカルユーザインタフェース (GUI) エージェントは、人間とコンピュータのインタラクションにおいて、トランスフォーメーションパラダイムとして登場した。
大規模言語モデルとマルチモーダル学習の最近の進歩は、デスクトップ、モバイル、Webプラットフォーム全体でGUI自動化に革命をもたらした。
本調査では, 正確な要素位置決定, 効果的な知識検索, 長期計画, 安全に配慮した実行制御など, 重要な技術的課題を明らかにする。
論文 参考訳(メタデータ) (2025-03-27T17:58:31Z) - A Framework for Measuring the Quality of Infrastructure-as-Code Scripts [0.0]
インフラストラクチャ・アズ・コード(IaC)は現代のソフトウェア開発に不可欠なものになっています。
IaCスクリプトの急速な普及は、より良いコード品質評価方法の必要性を強調している。
本稿では,リポジトリを基盤とする新しいIaCコード品質フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-05T12:36:19Z) - Operationalizing Assurance Cases for Data Scientists: A Showcase of
Concepts and Tooling in the Context of Test Data Quality for Machine Learning [1.6403311770639912]
保証事例( Assurance Cases, AC)は、安全工学において、品質主張を構造化された方法で議論するための確立されたアプローチである。
我々は,データサイエンティストが日々使用している技術であるPythonとJupyter Notebookに基づいて,機械学習(ML)コンポーネントのためのACの運用を支援するフレームワークを提案する。
ノートブックを通じて文書化されたフレームワークのアプリケーションの結果は、既存のACツールに統合できる。
論文 参考訳(メタデータ) (2023-12-08T09:34:46Z) - A General Framework for Verification and Control of Dynamical Models via Certificate Synthesis [54.959571890098786]
システム仕様を符号化し、対応する証明書を定義するためのフレームワークを提供する。
コントローラと証明書を形式的に合成する自動化手法を提案する。
我々のアプローチは、ニューラルネットワークの柔軟性を利用して、制御のための安全な学習の幅広い分野に寄与する。
論文 参考訳(メタデータ) (2023-09-12T09:37:26Z) - Towards an Interface Description Template for AI-enabled Systems [77.34726150561087]
再利用(Reuse)は、システムアーキテクチャを既存のコンポーネントでインスタンス化しようとする、一般的なシステムアーキテクチャのアプローチである。
現在、コンポーネントが当初目的としていたものと異なるシステムで運用する可搬性を評価するために必要な情報の選択をガイドするフレームワークは存在しない。
我々は、AI対応コンポーネントの主情報をキャプチャするインターフェイス記述テンプレートの確立に向けて、現在進行中の作業について述べる。
論文 参考訳(メタデータ) (2020-07-13T20:30:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。