論文の概要: 4D-ARE: Bridging the Attribution Gap in LLM Agent Requirements Engineering
- arxiv url: http://arxiv.org/abs/2601.04556v1
- Date: Thu, 08 Jan 2026 03:36:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-09 17:01:53.021275
- Title: 4D-ARE: Bridging the Attribution Gap in LLM Agent Requirements Engineering
- Title(参考訳): 4D-ARE: LLMエージェント要件エンジニアリングにおける属性ギャップのブリッジ化
- Authors: Bo Yu, Lei Zhao,
- Abstract要約: 属性駆動型エージェントを特定するための予備的方法論である4D-AREを提案する。
金融サービスにおける産業パイロットの展開を通じて,その方法論を実証する。
- 参考スコア(独自算出の注目度): 5.840627997277022
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We deployed an LLM agent with ReAct reasoning and full data access. It executed flawlessly, yet when asked "Why is completion rate 80%?", it returned metrics instead of causal explanation. The agent knew how to reason but we had not specified what to reason about. This reflects a gap: runtime reasoning frameworks (ReAct, Chain-of-Thought) have transformed LLM agents, but design-time specification--determining what domain knowledge agents need--remains under-explored. We propose 4D-ARE (4-Dimensional Attribution-Driven Agent Requirements Engineering), a preliminary methodology for specifying attribution-driven agents. The core insight: decision-makers seek attribution, not answers. Attribution concerns organize into four dimensions (Results -> Process -> Support -> Long-term), motivated by Pearl's causal hierarchy. The framework operationalizes through five layers producing artifacts that compile directly to system prompts. We demonstrate the methodology through an industrial pilot deployment in financial services. 4D-ARE addresses what agents should reason about, complementing runtime frameworks that address how. We hypothesize systematic specification amplifies the power of these foundational advances. This paper presents a methodological proposal with preliminary industrial validation; rigorous empirical evaluation is planned for future work.
- Abstract(参考訳): 我々は、ReAct推論と完全なデータアクセスを備えたLLMエージェントをデプロイした。
完璧に実行されるが、なぜ"完成率80%"を問うと、因果的説明ではなくメトリクスを返した。
エージェントは理屈を知っていたが、私たちは何について理屈を定めていなかった。
実行時推論フレームワーク (ReAct, Chain-of-Thought) は LLM エージェントを変換したが、設計時仕様 -- ドメイン知識エージェントが必要とするものを決定する -- は探索下にある。
本稿では,属性駆動エージェントを特定するための予備的方法論である4次元属性駆動エージェント要求工学(4D-ARE)を提案する。
中心となる洞察は、意思決定者は答えではなく帰属を求めます。
帰属関係は4つの次元(結果 ->プロセス ->サポート ->長期)に分けられ、パールの因果的階層に動機付けられる。
このフレームワークは、システムプロンプトに直接コンパイルするアーティファクトを生成する5つのレイヤを通じて運用する。
金融サービスにおける産業パイロットの展開を通じて,その方法論を実証する。
4D-AREは、どのように対処するかを補完するランタイムフレームワークを補完するエージェントに対処する。
体系的な仕様は、これらの基礎的な進歩の力を増幅する。
本稿では, 先進的な産業評価を取り入れた方法論の提案を行い, 厳密な実証評価を今後の課題として提案する。
関連論文リスト
- AgentPRM: Process Reward Models for LLM Agents via Step-Wise Promise and Progress [71.02263260394261]
大規模言語モデル(LLM)は、マルチターン意思決定タスクにおいて依然として課題に直面している。
プロセス報酬モデル(PRM)を構築し、各意思決定を評価し、エージェントの意思決定プロセスを導く。
AgentPRMは、シーケンシャルな決定と最終的な目標への貢献の間の相互依存の両方をキャプチャする。
論文 参考訳(メタデータ) (2025-11-11T14:57:54Z) - GSM-Agent: Understanding Agentic Reasoning Using Controllable Environments [56.007498767771075]
GSM-Agentは複雑な環境でエージェント推論を評価するための新しいベンチマークである。
我々は,環境文書の埋め込みをノードにクラスタ化することでエージェント推論パターンを分析し,各ツールコールを最も近いノードにマッピングする。
本稿では,LLMのエージェント推論性能を向上させるためのツール拡張テストタイムスケーリング手法を提案する。
論文 参考訳(メタデータ) (2025-09-26T07:24:37Z) - R&D-Agent: An LLM-Agent Framework Towards Autonomous Data Science [70.1638335489284]
高レベルの機械学習エンジニアリングタスクは、労働集約的で反復的である。
機械学習プロセスを形式化する包括的で分離されたフレームワークであるR&D-Agentを紹介します。
R&D-AgentはMLEを2つのフェーズと6つのコンポーネントに定義し、MLEのエージェント設計を原則としてテスト可能なプロセスに変える。
論文 参考訳(メタデータ) (2025-05-20T06:07:00Z) - ReGenesis: LLMs can Grow into Reasoning Generalists via Self-Improvement [70.09541267910974]
学習後の大規模言語モデル (LLM) は推論能力を高めることができる。
既存の自己合成手法は、一般化の貧弱さからドメイン外推論(OOD)タスクに悩まされる。
本稿では,学習後データとして推論経路を自己合成する手法であるSelf-Improvement (ReGenesis) による推論ジェネリストを提案する。
論文 参考訳(メタデータ) (2024-10-03T00:09:15Z) - Demystifying Reinforcement Learning in Production Scheduling via Explainable AI [0.7515066610159392]
深層強化学習(Dep Reinforcement Learning, DRL)はスケジューリング問題の解法としてよく用いられる手法である。
DRLエージェントは、短い計算時間で実行可能な結果を提供するのが得意だが、その推論はいまだに不透明である。
フロー生産における特殊DRLエージェントのスケジューリング決定の背後にある理由を説明するために,2つの説明可能なAI(xAI)フレームワークを適用した。
論文 参考訳(メタデータ) (2024-08-19T09:39:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。