論文の概要: Trust-Aware Multi-Agent Traceability: Confidence-Calibrated Knowledge Graphs for Consistent Software Artifact Management
- arxiv url: http://arxiv.org/abs/2606.17203v1
- Date: Mon, 15 Jun 2026 18:41:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.10594
- Title: Trust-Aware Multi-Agent Traceability: Confidence-Calibrated Knowledge Graphs for Consistent Software Artifact Management
- Title(参考訳): 信頼に敏感なマルチエージェントトレーサビリティ: 一貫性のあるソフトウェアアーチファクト管理のための信頼に配慮した知識グラフ
- Authors: Mohamed Essam, Kareem Wael, Azza Hassan, Ahmed Haitham, Mahmoud Soliman, Samer Saber, Ibrahim Habib,
- Abstract要約: ソフトウェアエンジニアリングでは、要求分析、アーキテクチャ設計、テスト生成、トレーサビリティリンクを自動化するために、マルチエージェントAIシステムがますます使われています。
本稿では,共有知識グラフを集中型セマンティックメモリと協調曲面の両方として機能する信頼対応協調フレームワークを提案する。
我々は,リンク予測キャリブレーション,プロトコルの有効性,しきい値感度,トレーサビリティシードの影響を自動車ソフトウェア工学のケーススタディで評価した。
- 参考スコア(独自算出の注目度): 0.7329200485567826
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent AI systems are increasingly used to automate software engineering tasks including requirements analysis, architecture design, test generation, and traceability linking. When these agents operate as a sequential pipeline over shared software artifacts, errors and low-confidence decisions made by upstream agents propagate to downstream stages, producing orphaned requirements, contradictory links, and compliance gaps that pose significant risks in safety-critical domains. We propose a trust-aware coordination framework where a shared knowledge graph serves as both centralized semantic memory and a coordination surface through which agents assess and build upon each other's contributions using calibrated confidence scores. Our approach introduces a two-stage traceability link prediction pipeline combining embedding-based retrieval with LLM-based multi-criteria analysis, a traceability seeding mechanism that enables comparison between derivation-time and validation-time confidence, and a consistency protocol governing pipeline interactions through confidence threshold gating, confidence divergence detection, and conflict resolution. We evaluate on an automotive software engineering case study measuring link prediction calibration, protocol effectiveness, threshold sensitivity, and the impact of traceability seeding. Ablation studies confirm that confidence calibration is essential for effective pipeline coordination.
- Abstract(参考訳): 要求分析、アーキテクチャ設計、テスト生成、トレーサビリティリンクを含むソフトウェアエンジニアリングタスクを自動化するために、マルチエージェントAIシステムがますます使われています。
これらのエージェントが共有ソフトウェアアーティファクト上のシーケンシャルパイプラインとして機能するとき、上流エージェントによるエラーと低信頼の判断が下流のステージに伝播し、孤児の要求、矛盾するリンク、そして安全クリティカルなドメインに重大なリスクをもたらすコンプライアンスギャップを生み出す。
本稿では,共有知識グラフを集中型セマンティックメモリと協調面の両方として機能し,エージェント同士のコントリビューションを評価・構築する信頼対応協調フレームワークを提案する。
提案手法では,組込み型検索とLLMに基づくマルチ基準解析を組み合わせた2段階のトレーサビリティリンク予測パイプライン,導出時間とバリデーション時間との信頼度の比較を可能にするトレーサビリティシード機構,信頼しきい値ゲーティング,信頼分散検出,コンフリクト解決によるパイプラインインタラクションの一貫性プロトコルを提案する。
我々は,リンク予測キャリブレーション,プロトコルの有効性,しきい値感度,トレーサビリティシードの影響を自動車ソフトウェア工学のケーススタディで評価した。
アブレーション研究は、効果的パイプライン調整には信頼性校正が不可欠であることを確認した。
関連論文リスト
- Towards trustworthy agentic AI: a comprehensive survey of safety, robustness, privacy, and system security [57.35851886874902]
エージェントAIシステムは、複雑なタスクを自律的に実行するが、その多段階の軌道には、信頼性に挑戦する新たな障害モードが導入されている。
この調査では、リスクの高いデプロイメントに不可欠な2つのコアディメンションを通じて、信頼できるエージェントAIを精査する。
各次元について、重要な概念を明確にし、エージェントワークフローに沿ってリスクが発生する場所を特定し、ステージ目標の緩和戦略を要約する。
論文 参考訳(メタデータ) (2026-05-17T10:26:37Z) - Process Supervision of Confidence Margin for Calibrated LLM Reasoning [52.373121066425455]
強化学習(RL)によるテスト時間計算のスケーリングは,大規模言語モデル(LLM)推論能力を向上させるための信頼性の高い経路として登場した。
しかし、結果に基づく報酬は、しばしばモデルに過信感を与え、幻覚、信頼できない信頼ベースの制御、不要な計算割り当てをもたらす。
本稿では,信頼性と信頼性を両立させるキャリブレーションを意識したRLフレームワークであるReinforcement Learning with Confidence Margin(textbfRLCM)を紹介する。
論文 参考訳(メタデータ) (2026-04-25T14:40:13Z) - Statistical-Based Metric Threshold Setting Method for Software Fault Prediction in Firmware Projects: An Industrial Experience [4.339839287869652]
マシンラーニングベースのフォールト予測モデルは高い精度を示しているが、解釈可能性の欠如により、産業環境での採用が制限されている。
本稿では,産業環境における故障検出への統合に適したコンテキスト固有のソフトウェアメトリックしきい値を定義するための構造化プロセスを提案する。
提案手法は,一組のプロジェクトからしきい値を取得し,個別に開発したファームウェアに適用することにより,プロジェクト間の障害予測を支援する。
論文 参考訳(メタデータ) (2026-02-06T16:19:36Z) - PaTAS: A Parallel System for Trust Propagation in Neural Networks Using Subjective Logic [1.8485970721272895]
本稿では,ニューラルネットワークの信頼をモデル化し,伝播するフレームワークであるPaTASを紹介する。
実世界および敵対的データセットの実験は、PaTASが解釈可能、対称性、収束信頼推定を生成することを示した。
論文 参考訳(メタデータ) (2025-11-25T18:15:36Z) - Semantic Chain-of-Trust: Autonomous Trust Orchestration for Collaborator Selection via Hypergraph-Aided Agentic AI [57.58120823855315]
本稿では,新たなセマンティック・チェーン・オブ・トラストの概念に基づく自律的信頼オーケストレーション手法を提案する。
我々の技術はエージェントAIとハイパーグラフを用いてデバイス間の信頼関係を確立し維持する。
実験により,提案手法が資源効率の高い信頼評価を実現することを示す。
論文 参考訳(メタデータ) (2025-07-31T13:53:25Z) - Lie Detector: Unified Backdoor Detection via Cross-Examination Framework [68.45399098884364]
半正直な設定で一貫したバックドア検出フレームワークを提案する。
本手法は,SoTAベースラインよりも5.4%,1.6%,11.9%の精度で検出性能が向上する。
特に、マルチモーダルな大規模言語モデルにおいて、バックドアを効果的に検出するのは、これが初めてである。
論文 参考訳(メタデータ) (2025-03-21T06:12:06Z) - Bayesian Methods for Trust in Collaborative Multi-Agent Autonomy [11.246557832016238]
安全クリティカルで競争の激しい環境では、敵は多数のエージェントに侵入し、妥協することがある。
我々は、この妥協されたエージェント脅威モデルの下で、アートマルチターゲット追跡アルゴリズムの状態を解析する。
階層的ベイズ更新を用いた信頼度推定フレームワークを設計する。
論文 参考訳(メタデータ) (2024-03-25T17:17:35Z) - A Factor Graph Model of Trust for a Collaborative Multi-Agent System [8.286807697708113]
信頼とは、エージェントがシステム内の他者の情報、行動、意図、真実性、能力に依存し、信頼することである。
本稿では,エージェント間の相互依存行動と信頼性を表現するために因子グラフを利用する新しいグラフィカルアプローチを提案する。
信頼度評価手法は分散化され, 近接安全性, 一貫性, 協調といった重要な相互依存サブファクタを考察する。
論文 参考訳(メタデータ) (2024-02-10T21:44:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。