論文の概要: ArgRE: Formal Argumentation for Conflict Resolution in Multi-Agent Requirements Negotiation
- arxiv url: http://arxiv.org/abs/2604.23124v1
- Date: Sat, 25 Apr 2026 03:28:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.167933
- Title: ArgRE: Formal Argumentation for Conflict Resolution in Multi-Agent Requirements Negotiation
- Title(参考訳): ArgRE:マルチエージェント要件交渉における紛争解決のための形式的議論
- Authors: Haowei Cheng, Milhan Kim, Chong Liu, Teeradaj Racharak, Truong Vinh Truong Duy, Phan Thi Huyen Thanh, Jialong Li, Naoyasu Ubayashi, Hironori Washizaki,
- Abstract要約: ArgREは交渉段階に抽象的な議論を組み込むマルチエージェント要件システムである。
既存のフレームワークにはない引数レベルのトレーサビリティを提供する。
評価によると、ArgREは既存のフレームワークにはない引数レベルのトレーサビリティを提供する。
- 参考スコア(独自算出の注目度): 3.512547713134864
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As software systems grow in complexity, they must satisfy an increasing number of competing quality attributes, making it essential to balance them in a principled manner -- for example, a safety requirement for sensor-fusion verification may conflict with a tight planning-cycle budget. Multi-agent large language model frameworks support this balancing process by assigning specialized agents to different objectives. However, their conflict resolution is typically heuristic. Requirements are aggregated implicitly without explicit acceptance or rejection, limiting auditability in regulated domains. We present ArgRE, a multi-agent requirements negotiation system that embeds Dung-style abstract argumentation into the negotiation stage. Each proposal, critique, and refinement is modeled as an argument, conflicts are represented as directed attack relations, and the accepted set of arguments is computed under grounded and preferred semantics. The pipeline further integrates KAOS goal modeling, multi-layer verification, and standards-oriented artifact generation. Evaluation across five case studies spanning safety-critical, financial, and information-system domains shows that ArgRE provides argument-level traceability absent from existing frameworks. Independent evaluators rated its decision justifications significantly higher than those of heuristic synthesis (4.32 vs. 3.07, p < 0.001), indicating improved auditability, while semantic intent preservation remains comparable (94.9% BERTScore F1) and compliance coverage reaches 84.7% versus 47.6%--47.8% for baselines. Structural analysis further confirms that the default pairwise protocol yields acyclic graphs in which grounded and preferred semantics coincide, whereas cross-pair arbitration introduces controlled cyclicity, leading to predictable divergence between the two semantics.
- Abstract(参考訳): ソフトウェアシステムが複雑さを増すにつれて、競合する品質特性の増大を満足しなければならないため、原則的にバランスをとることが不可欠である。
マルチエージェントの大規模言語モデルフレームワークは、異なる目的に特別なエージェントを割り当てることで、このバランスをとるプロセスをサポートする。
しかし、その対立解決は概してヒューリスティックである。
要求は明示的な受け入れや拒絶なしに暗黙的に集約され、規制されたドメインの監査性を制限する。
本稿では,Dungスタイルの抽象的議論を交渉段階に組み込むマルチエージェント要求交渉システムArgREを提案する。
それぞれの提案、批判、洗練は議論としてモデル化され、対立は直接攻撃関係として表現され、受け入れられた議論の集合は根拠付きおよび好意的な意味論の下で計算される。
パイプラインはさらに、KAOSの目標モデリング、多層検証、標準指向のアーティファクト生成を統合している。
安全クリティカル、財務、情報システムドメインにまたがる5つのケーススタディによる評価は、ArgREが既存のフレームワークにはない引数レベルのトレーサビリティを提供することを示している。
独立評価者は、その決定の正当性はヒューリスティック合成の正当性(4.32対3.07、p < 0.001)よりも著しく高く評価し、監査性の向上を示し、セマンティックインテントの保存率は94.9%(BERTScore F1)と同等であり、コンプライアンスのカバレッジは84.7%、ベースラインは47.6%-47.8%である。
構造解析により、デフォルトのペアワイズプロトコルは、接地的および好ましいセマンティクスが一致する非巡回グラフを生成するのに対して、クロスペア仲裁は制御されたサイクリック性を導入し、2つのセマンティクスの間に予測可能なばらつきをもたらす。
関連論文リスト
- Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Semantic Invariance in Agentic AI [2.7821684674538347]
大規模言語モデルは、意思決定支援、科学的問題解決、マルチエージェント調整システムにおいて、自律的推論エージェントとしての役割をますます高めている。
LLMエージェントを連続的なアプリケーションにデプロイするには、それらの推論が意味論的に等価な入力変動の下で安定であることを保証する必要がある。
標準ベンチマーク評価は、固定された正準問題定式化の精度を評価するが、この重要な信頼性の次元を捉えることができない。
論文 参考訳(メタデータ) (2026-03-13T17:08:44Z) - QUARE: Multi-Agent Negotiation for Balancing Quality Attributes in Requirements Engineering [5.798725202578518]
QUIRE(Quality-Aware Requirements Engineering)は、要求分析を構造化交渉として定式化するマルチエージェントフレームワークである。
確立されたREベンチマーク(MARE, iReDev)と産業用自動運転仕様の5つのケーススタディを提示する。
論文 参考訳(メタデータ) (2026-03-12T13:03:01Z) - Adversarial Intent is a Latent Variable: Stateful Trust Inference for Securing Multimodal Agentic RAG [5.4716896485317195]
マルチモーダルエージェントRAGに対する現在のステートレスディフェンスは、悪意のあるセマンティクスを配布する敵の戦略を検出するのに失敗する。
MMA-RAGTは,MTA (Modular Trust Agent) が管理する推定時制御フレームワークで,ほぼ信頼状態を維持している。
論文 参考訳(メタデータ) (2026-02-24T23:52:27Z) - Adversarial Yet Cooperative: Multi-Perspective Reasoning in Retrieved-Augmented Language Models [72.4149653187766]
本稿ではAdrialversa Reasoning RAG(ARR)というReasoner-Verifierフレームワークを提案する。
ReasonerとVerifierは、回収された証拠を推論し、プロセス認識の利点によってガイドされながら、互いの論理を批判する。
複数のベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2026-01-08T06:57:03Z) - Eigen-1: Adaptive Multi-Agent Refinement with Monitor-Based RAG for Scientific Reasoning [53.45095336430027]
暗黙的な検索と構造化された協調を組み合わせた統合フレームワークを開発する。
Humanity's Last Exam (HLE) Bio/Chem Goldでは,48.3%の精度を実現している。
SuperGPQAとTRQAの結果はドメイン間の堅牢性を確認した。
論文 参考訳(メタデータ) (2025-09-25T14:05:55Z) - Retrieval is Not Enough: Enhancing RAG Reasoning through Test-Time Critique and Optimization [58.390885294401066]
Retrieval-augmented Generation (RAG) は知識基底型大規模言語モデル(LLM)を実現するためのパラダイムとして広く採用されている。
RAGパイプラインは、モデル推論が得られた証拠と整合性を維持するのに失敗することが多く、事実上の矛盾や否定的な結論につながる。
批判駆動アライメント(CDA)に基づく新しい反復的枠組みであるAlignRAGを提案する。
AlignRAG-autoは、動的に洗練を終了し、批判的な反復回数を事前に指定する必要がなくなる自律的な変種である。
論文 参考訳(メタデータ) (2025-04-21T04:56:47Z) - Debate, Deliberate, Decide (D3): A Cost-Aware Adversarial Framework for Reliable and Interpretable LLM Evaluation [0.0]
本稿では、役割特化エージェント間の構造的議論を組織化する、費用対効果のある多エージェントフレームワークであるDebate, Deliberate, Decide(D3)を紹介する。
我々は,反復的議論の下で信頼性と収束性を特徴付けるスコアギャップの確率論的モデルを開発する。
我々は,人間の判断に対する最先端の合意,匿名化による位置バイアスと冗長性バイアスの低減,そして,適切な費用対精度のフロンティアを示す。
論文 参考訳(メタデータ) (2024-10-07T00:22:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。