論文の概要: Collaborative Agent Reasoning Engineering (CARE): A Three-Party Design Methodology for Systematically Engineering AI Agents with Subject Matter Experts, Developers, and Helper Agents
- arxiv url: http://arxiv.org/abs/2604.28043v1
- Date: Thu, 30 Apr 2026 15:54:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.183338
- Title: Collaborative Agent Reasoning Engineering (CARE): A Three-Party Design Methodology for Systematically Engineering AI Agents with Subject Matter Experts, Developers, and Helper Agents
- Title(参考訳): 協調エージェント推論工学(CARE) - 課題の専門家、開発者、ヘルパーエージェントを対象とするシステム工学AIエージェントのための3要素設計方法論
- Authors: Rahul Ramachandran, Nidhi Jha, Muthukumaran Ramasubramanian,
- Abstract要約: 協調的エージェント推論工学(英: Collaborative Agent Reasoning Engineering、CARE)は、科学分野における大規模言語モデル(LLM)エージェントの専門的な方法論である。
CAREは、振る舞い、グラウンド、ツールオーケストレーション、再利用可能なアーティファクトと、システマティックなステージゲートフェーズによる検証を指定する。
- 参考スコア(独自算出の注目度): 0.16302332606018002
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Collaborative Agent Reasoning Engineering (CARE), a disciplined methodology for engineering Large Language Model (LLM) agents in scientific domains. Unlike ad-hoc trial-and-error approaches, CARE specifies behavior, grounding, tool orchestration, and verification through reusable artifacts and systematic, stage-gated phases. The methodology employs a three-party workflow involving Subject-Matter Experts (SMEs), developers, and LLM-based helper agents. These helper agents function as facilitation infrastructure, transforming informal domain intent into structured, reviewable specifications for human approval at defined gates. CARE addresses the "jagged technological frontier", characterized by uneven LLM performance, by bridging the gap between novice and expert analysts regarding domain constraints and verification practices. By generating concrete artifacts, including interaction requirements, reasoning policies, and evaluation criteria, CARE ensures agent behavior is specifiable, testable, and maintainable. Evaluation results from a scientific use case demonstrate that this stage-gated, artifact-driven methodology yields measurable improvements in development efficiency and complex-query performance.
- Abstract(参考訳): 本稿では,科学領域における大規模言語モデル (LLM) エージェントの専門的方法論である,協調的エージェント推論工学 (CARE) を提案する。
アドホックな試行錯誤アプローチとは異なり、CAREは振る舞い、基盤、ツールオーケストレーション、再利用可能なアーティファクトやシステマティックなステージゲートフェーズによる検証を規定している。
この方法論では、SME(Subject-Matter Experts)、開発者、LLMベースのヘルパーエージェントを含む、サードパーティのワークフローを採用している。
これらのヘルパーエージェントはファシリテーションインフラストラクチャとして機能し、非公式なドメインインテントを、定義されたゲートでの人間の承認のための構造化されたレビュー可能な仕様に変換する。
CAREは、ドメイン制約と検証プラクティスに関する初心者と専門家アナリストのギャップを埋めることによって、不均一なLLMパフォーマンスを特徴とする"タグ付き技術フロンティア"に対処する。
相互作用要件、推論ポリシー、評価基準を含む具体的な成果物を生成することで、CAREはエージェントの振る舞いが特定可能で、テスト可能で、メンテナンス可能であることを保証します。
科学的ユースケースによる評価結果から、この段階的な人工物駆動手法は、開発効率と複雑なクエリのパフォーマンスを測定可能な改善をもたらすことが示されている。
関連論文リスト
- DUCTILE: Agentic LLM Orchestration of Engineering Analysis in Product Development Practice [41.99844472131922]
製品開発におけるエンジニアリング分析の自動化は、ツール、データフォーマット、ドキュメントプロセス間の厳密なインターフェースに依存しています。
本稿では DUCTILE (Delegated, User-supervised Coordination of Tool- and document-Integrated LLM-Enabled) エージェントオーケストレーションについて述べる。
エージェントは、文書化された設計プラクティスを解釈し、入力データを検査し、処理パスを適応し、エンジニアは最終判断を監督し、実行する。
論文 参考訳(メタデータ) (2026-03-10T22:00:47Z) - Agentic Reasoning for Large Language Models [122.81018455095999]
推論は推論、問題解決、意思決定の基礎となる基本的な認知プロセスである。
大規模言語モデル(LLM)は、クローズドワールド設定では強力な推論能力を示すが、オープンエンドおよび動的環境では苦労する。
エージェント推論は、連続的な相互作用を計画し、行動し、学習する自律的なエージェントとしてLLMを解釈することでパラダイムシフトを示す。
論文 参考訳(メタデータ) (2026-01-18T18:58:23Z) - Beyond Task Completion: An Assessment Framework for Evaluating Agentic AI Systems [0.0]
エージェントAIの最近の進歩は、スタンドアロンの大規模言語モデルから統合システムへと焦点を移している。
LLM、メモリ、ツール、環境を含む4つの評価柱を持つエンドツーエンドのエージェントアセスメントフレームワークを提案する。
我々はこのフレームワークを、従来のメトリクスによる振る舞いの偏りを示す、代表的なAutonomous CloudOpsユースケースで検証する。
論文 参考訳(メタデータ) (2025-12-14T18:17:40Z) - Open Agent Specification (Agent Spec): A Unified Representation for AI Agents [10.685555728094338]
我々はAIエージェントとエージェントを定義する宣言型言語Open Agent Specification(Agent Spec)を紹介する。
Agent Specは、コンポーネント、コントロールとデータフローのセマンティクス、スキーマの共通セットを定義し、エージェントを一度定義し、異なるランタイム間で実行できるようにする。
論文 参考訳(メタデータ) (2025-10-05T12:26:42Z) - A Survey of Frontiers in LLM Reasoning: Inference Scaling, Learning to Reason, and Agentic Systems [93.8285345915925]
推論(Reasoning)は、論理的推論、問題解決、意思決定を可能にする基本的な認知プロセスである。
大規模言語モデル(LLM)の急速な進歩により、推論は高度なAIシステムを区別する重要な能力として浮上した。
我々は,(1)推論が達成される段階を定義するレジーム,(2)推論プロセスに関与するコンポーネントを決定するアーキテクチャの2つの側面に沿って既存の手法を分類する。
論文 参考訳(メタデータ) (2025-04-12T01:27:49Z) - Large Language Model Agent: A Survey on Methodology, Applications and Challenges [88.3032929492409]
大きな言語モデル(LLM)エージェントは、目標駆動の振る舞いと動的適応能力を持ち、人工知能への重要な経路を示す可能性がある。
本調査は, LLMエージェントシステムを方法論中心の分類法により体系的に分解する。
私たちの作業は、エージェントの構築方法、コラボレーション方法、時間の経過とともにどのように進化するか、という、統一されたアーキテクチャの視点を提供します。
論文 参考訳(メタデータ) (2025-03-27T12:50:17Z) - Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。