Fugu-MT 論文翻訳(概要): ESAA: Event Sourcing for Autonomous Agents in LLM-Based Software Engineering

論文の概要: ESAA: Event Sourcing for Autonomous Agents in LLM-Based Software Engineering

arxiv url: http://arxiv.org/abs/2602.23193v1
Date: Thu, 26 Feb 2026 16:45:59 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-27 18:41:22.786471
Title: ESAA: Event Sourcing for Autonomous Agents in LLM-Based Software Engineering
Title（参考訳）: ESAA: LLMベースのソフトウェアエンジニアリングにおける自律エージェントのイベントソーシング
Authors: Elzo Brito dos Santos Filho,
Abstract要約: 本稿では,ESAA(Event Sourcing for Autonomous Agents)アーキテクチャについて述べる。アーキテクチャは、イベントソーシングパターンにインスパイアされた、認知意図とプロジェクトの状態突然変異を分離する。 2つのケーススタディは、アーキテクチャを検証し、単一エージェントのシナリオを超えたアーキテクチャのスケーラビリティの実証的な証拠を提供する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Autonomous agents based on Large Language Models (LLMs) have evolved from reactive assistants to systems capable of planning, executing actions via tools, and iterating over environment observations. However, they remain vulnerable to structural limitations: lack of native state, context degradation over long horizons, and the gap between probabilistic generation and deterministic execution requirements. This paper presents the ESAA (Event Sourcing for Autonomous Agents) architecture, which separates the agent's cognitive intention from the project's state mutation, inspired by the Event Sourcing pattern. In ESAA, agents emit only structured intentions in validated JSON (agent.result or issue.report); a deterministic orchestrator validates, persists events in an append-only log (activity.jsonl), applies file-writing effects, and projects a verifiable materialized view (roadmap.json). The proposal incorporates boundary contracts (AGENT_CONTRACT.yaml), metaprompting profiles (PARCER), and replay verification with hashing (esaa verify), ensuring the immutability of completed tasks and forensic traceability. Two case studies validate the architecture: (i) a landing page project (9 tasks, 49 events, single-agent composition) and (ii) a clinical dashboard system (50 tasks, 86 events, 4 concurrent agents across 8 phases), both concluding with run.status=success and verify_status=ok. The multi-agent case study demonstrates real concurrent orchestration with heterogeneous LLMs (Claude Sonnet 4.6, Codex GPT-5, Antigravity/Gemini 3 Pro, and Claude Opus 4.6), providing empirical evidence of the architecture's scalability beyond single-agent scenarios.
Abstract（参考訳）: 大規模言語モデル(LLM)に基づく自律エージェントは、リアクティブアシスタントから、ツールによるアクションの計画、実行、環境観察の反復が可能なシステムへと進化してきた。しかしながら、それらは、ネイティブ状態の欠如、長い地平線上のコンテキスト劣化、確率的生成と決定論的実行要件のギャップといった、構造的な制限に弱いままである。本稿では,イベントソーシングパターンにインスパイアされたESAA(Event Sourcing for Autonomous Agents)アーキテクチャについて述べる。 ESAAでは、エージェントはバリデーションされたJSON(agent.resultまたは issue.report)でのみ構造化された意図を出力し、決定論的オーケストレータが検証し、追加のみのログ(active.jsonl)でイベントを永続化し、ファイル書き込み効果を適用し、検証可能な実体化されたビュー(roadmap.json)を投影する。この提案には境界契約(AGENT_CONTRACT.yaml)、メタプロンプティングプロファイル(PARCER)、ハッシュによる検証(eaa verify)、完了したタスクの不変性と法医学的トレーサビリティの確保が含まれている。アーキテクチャを検証する2つのケーススタディ。 (i)ランディングページプロジェクト(9タスク、49イベント、シングルエージェント構成) (i)臨床ダッシュボードシステム(50のタスク,86のイベント,8フェーズにわたる4つの並行エージェント)はいずれもrun.status=successとverify_status=okで終了する。マルチエージェントケーススタディは、異種LLM(Claude Sonnet 4.6、Codex GPT-5、Antigravity/Gemini 3 Pro、Claude Opus 4.6)による実際の同時オーケストレーションを実証し、単一エージェントシナリオを超えたアーキテクチャのスケーラビリティの実証的な証拠を提供する。

関連論文リスト

Agentic Peer-to-Peer Networks: From Content Distribution to Capability and Action Sharing [10.47562113256175]
本稿では,このようなコラボレーションの実現に必要なネットワーク基盤について概説する。本稿では,接続/ID,意味発見,実行を分離する平面型参照アーキテクチャを提案する。 Tier1は評判信号に依存し、Tier2はフォールバック選択で軽量なカナリアチャレンジ応答を適用し、Tier3は署名されたツールレシートやトラスのようなエビデンスパッケージを必要とします。
論文参考訳（メタデータ） (2026-03-04T05:58:44Z)
ROMA: Recursive Open Meta-Agent Framework for Long-Horizon Multi-Agent Systems [25.131570054560353]
現在のエージェントフレームワークは、ロングホライゾンタスクでパフォーマンスが低い。これらの制限に対処するドメインに依存しないフレームワークであるROMAを紹介します。 ROMAとGEPA+が組み合わさって、推論と長文生成のベンチマークにおいて、システムレベルの主要な性能を提供することを示す。
論文参考訳（メタデータ） (2026-02-02T09:20:59Z)
TriCEGAR: A Trace-Driven Abstraction Mechanism for Agentic AI [5.1181001367075]
TriCEGARはトレース駆動の抽象化メカニズムで、実行ログから状態構築を自動化する。タイプされたエージェントライフサイクルイベントをキャプチャし、トレースから抽象化を構築するフレームワークネイティブ実装について説明する。また, 走行確率が異常検出をガードレール信号として有効にする方法も示す。
論文参考訳（メタデータ） (2026-01-30T14:01:47Z)
Veri-Sure: A Contract-Aware Multi-Agent Framework with Temporal Tracing and Formal Verification for Correct RTL Code Generation [4.723302382132762]
シリコングレードの正しさは、 (i) シミュレーション中心の評価の限られたカバレッジと信頼性、 (ii) 回帰と修復幻覚、 (iii) エージェントハンドオフ間で意図が再解釈される意味的ドリフトによってボトルネックが残っている。エージェントの意図を整合させる設計契約を確立するマルチエージェントフレームワークであるVeri-Sureを提案する。
論文参考訳（メタデータ） (2026-01-27T16:10:23Z)
Sponge Tool Attack: Stealthy Denial-of-Efficiency against Tool-Augmented Agentic Reasoning [58.432996881401415]
最近の作業では、エージェント推論を可能にするために、外部ツールで大きな言語モデル(LLM)を拡張している。本稿では,入力プロンプトを書き換えることのみでエージェント推論を妨害するスポンジツールアタック(STA)を提案する。 STAは、意味的忠実度の高い原文からの良心的な即興的な書き直しを生成する。
論文参考訳（メタデータ） (2026-01-24T19:36:51Z)
A Lightweight Modular Framework for Constructing Autonomous Agents Driven by Large Language Models: Design, Implementation, and Applications in AgentForge [1.932555230783329]
LLM駆動の自律エージェントの構築を民主化するために設計された軽量でオープンソースのPythonフレームワーク。 AgentForgeは、(1)正式に定義された入出力契約できめ細かいタスク分解を可能にする構成可能なスキル抽象化、(2)クラウドベースのAPIとローカル推論エンジンのシームレスな切り替えをサポートする統一されたバックエンドインターフェース、(3)エージェントロジックと実装の詳細を分離する宣言型YAMLベースの構成システムである。
論文参考訳（メタデータ） (2026-01-19T20:33:26Z)
The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check [54.08619694620588]
本稿では,2つの異なるエージェントパラダイムであるEmbodied AgentsとTool-Calling AgentsにまたがるdLLMの包括的評価を行う。 Agentboard と BFCL では,現在の dLLM が信頼できるエージェントバックボーンとして機能しないという,"ビットレッスン" が報告されている。
論文参考訳（メタデータ） (2026-01-19T11:45:39Z)
BackdoorAgent: A Unified Framework for Backdoor Attacks on LLM-based Agents [58.83028403414688]
大規模言語モデル(LLM)エージェントは、計画、メモリ、ツールの使用を組み合わせた多段階ワークフローを通じてタスクを実行する。エージェントワークフローの特定のステージに注入されたバックドアトリガーは、複数の中間状態を通して持続し、下流出力に悪影響を及ぼす可能性がある。 LLMエージェントにおけるバックドア脅威を統一したエージェント中心のビューを提供するモジュールおよびステージアウェアフレームワークである textbfBackdoorAgent を提案する。
論文参考訳（メタデータ） (2026-01-08T03:49:39Z)
Towards Efficient Agents: A Co-Design of Inference Architecture and System [66.59916327634639]
本稿では,エージェントアクセラレーションのための統合フレームワークであるAgentInferを提案する。問題をAgentCollab、AgentSched、AgentSAM、AgentCompressの4つの相乗的コンポーネントに分解する。 BrowseComp-zhとDeepDiverベンチマークの実験では、これらの手法の相乗的コラボレーションを通じて、AgentInferは非効率なトークン消費を50%以上削減することを示した。
論文参考訳（メタデータ） (2025-12-20T12:06:13Z)
DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。 DoVerは失敗試験の18～28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30～60%を検証または否定する。
論文参考訳（メタデータ） (2025-12-07T09:23:48Z)
Extracting Events Like Code: A Multi-Agent Programming Framework for Zero-Shot Event Extraction [21.08753833036094]
本稿では,AEC(Agent-Event-Coder)について紹介する。 AECはZSEEを特別なサブタスク(検索、計画、コーディング、検証)に分解する。 5つの異なる領域と6つのLSMにわたる実験により、AECはゼロショットベースラインを一貫して上回っていることが示された。
論文参考訳（メタデータ） (2025-11-17T08:17:15Z)
Agent4FaceForgery: Multi-Agent LLM Framework for Realistic Face Forgery Detection [108.5042835056188]
この作業では,2つの基本的な問題に対処するため,Agent4FaceForgeryを導入している。人間の偽造の多様な意図と反復的なプロセスを捉える方法。ソーシャルメディアの偽造に付随する複雑な、しばしば敵対的な、テキストと画像のインタラクションをモデル化する方法。
論文参考訳（メタデータ） (2025-09-16T01:05:01Z)
Visual Document Understanding and Question Answering: A Multi-Agent Collaboration Framework with Test-Time Scaling [83.78874399606379]
テスト時間スケーリングを備えたマルチエージェント協調フレームワークであるMACTを提案する。 4つの異なる小規模エージェントから構成され、明確に定義された役割と効果的なコラボレーションがある。一般および数学的タスクの能力を犠牲にすることなく、より小さなパラメータスケールで優れた性能を示す。
論文参考訳（メタデータ） (2025-08-05T12:52:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。