論文の概要: LogAct: Enabling Agentic Reliability via Shared Logs
- arxiv url: http://arxiv.org/abs/2604.07988v1
- Date: Thu, 09 Apr 2026 08:58:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.813182
- Title: LogAct: Enabling Agentic Reliability via Shared Logs
- Title(参考訳): LogAct: 共有ログによるエージェント信頼性の実現
- Authors: Mahesh Balakrishnan, Ashwin Bharambe, Davide Testuggine, David Geraghty, David Mao, Vidhya Venkat, Ilya Mironov, Rithesh Baradi, Gayathri Aiyer, Victoria Dudin,
- Abstract要約: 我々はLogActと呼ばれる新しい抽象化を提案し、各エージェントは共有ログを再生するデコンストラクトステートマシンである。
LogActはエージェントのイントロスペクションを可能にし、エージェントはLSM推論を使用して自身の実行履歴を分析することができる。
評価では、LogActエージェントは、障害から効率的に正確に回復し、自身のパフォーマンスをデバッグし、Swarm内でトークンの使用を最適化します。
- 参考スコア(独自算出の注目度): 1.3220949653718854
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agents are LLM-driven components that can mutate environments in powerful, arbitrary ways. Extracting guarantees for the execution of agents in production environments can be challenging due to asynchrony and failures. In this paper, we propose a new abstraction called LogAct, where each agent is a deconstructed state machine playing a shared log. In LogAct, agentic actions are visible in the shared log before they are executed; can be stopped prior to execution by pluggable, decoupled voters; and recovered consistently in the case of agent or environment failure. LogAct enables agentic introspection, allowing the agent to analyze its own execution history using LLM inference, which in turn enables semantic variants of recovery, health check, and optimization. In our evaluation, LogAct agents recover efficiently and correctly from failures; debug their own performance; optimize token usage in swarms; and stop all unwanted actions for a target model on a representative benchmark with just a 3% drop in benign utility.
- Abstract(参考訳): AgentはLLM駆動のコンポーネントで、強力で任意の方法で環境を変更できる。
運用環境におけるエージェント実行の保証を抽出するのは、非同期性と障害のため、難しい場合がある。
本稿では、各エージェントが共有ログを再生するデコンストラクトステートマシンであるLogActという新しい抽象化を提案する。
LogActでは、エージェントアクションは実行前に共有ログに表示され、プラガブルで分離された有権者によって実行前に停止される。
LogActはエージェントによるイントロスペクションを可能にし、エージェントはLSM推論を使用して独自の実行履歴を分析できる。
評価では、LogActエージェントは、障害から効率的に正確に回復し、自身のパフォーマンスをデバッグし、Swarm内でトークンの使用を最適化し、ターゲットモデルに対するすべての不要なアクションを代表ベンチマーク上で、わずか3%の便益で停止する。
関連論文リスト
- AgentSys: Secure and Dynamic LLM Agents Through Explicit Hierarchical Memory Management [47.49917373646469]
既存の防御は肥大した記憶を与えられたまま扱い、回復力を維持することに集中する。
我々は、明示的なメモリ管理を通じて間接的なインジェクションを防御するフレームワークであるAgentSysを紹介する。
論文 参考訳(メタデータ) (2026-02-07T06:28:51Z) - The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check [54.08619694620588]
本稿では,2つの異なるエージェントパラダイムであるEmbodied AgentsとTool-Calling AgentsにまたがるdLLMの包括的評価を行う。
Agentboard と BFCL では,現在の dLLM が信頼できるエージェントバックボーンとして機能しないという,"ビットレッスン" が報告されている。
論文 参考訳(メタデータ) (2026-01-19T11:45:39Z) - AgentDevel: Reframing Self-Evolving LLM Agents as Release Engineering [8.201374511929538]
AgentDevelは、現行のエージェントを反復的に実行するリリースエンジニアリングパイプラインである。
実行トレースから実装盲の症状レベルの品質信号を生成する。
主要な症状パターンを集約し、監査可能なエンジニアリング仕様を生成する。
論文 参考訳(メタデータ) (2026-01-08T05:49:01Z) - AgentMark: Utility-Preserving Behavioral Watermarking for Agents [20.30614808186259]
AgentMarkは、ユーティリティを保持しながら、計画決定にマルチビット識別子を組み込むフレームワークである。
エージェントから明示的な挙動分布を抽出し、分布保存条件サンプリングを適用する。
具体化、ツール利用、社会環境における実験は、実用的なマルチビット容量、部分ログからの堅牢な回復、ユーティリティ保存を実証している。
論文 参考訳(メタデータ) (2026-01-05T15:42:18Z) - DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文 参考訳(メタデータ) (2025-12-07T09:23:48Z) - Agentic JWT: A Secure Delegation Protocol for Autonomous AI Agents [0.6747475365990533]
エージェント設定の推論、プロンプトインジェクション、マルチエージェントオーケストレーションは、サイレントに特権を拡張することができる。
本稿では,エージェントのアクションをユーザインテントにバインドする2面インテントトークンであるAgentic JWT(A-JWT)を紹介する。
A-JWTはエージェントのアイデンティティを、そのプロンプト、ツール、設定から派生したワンウェイハッシュとして保持する。
論文 参考訳(メタデータ) (2025-09-16T23:43:24Z) - UDora: A Unified Red Teaming Framework against LLM Agents by Dynamically Hijacking Their Own Reasoning [17.448966928905733]
外部ツールを備えた大規模言語モデル(LLM)エージェントは、複雑なタスクに対してますます強力になっている。
UDoraはLDMエージェント用に設計された統一されたレッド・チーム・フレームワークで、エージェントの推論プロセスを動的にハイジャックし、悪意ある振る舞いを強制する。
論文 参考訳(メタデータ) (2025-02-28T21:30:28Z) - DynaSaur: Large Language Agents Beyond Predefined Actions [126.98162266986554]
既存のLLMエージェントシステムは、通常、各ステップで固定セットと事前定義されたセットからアクションを選択する。
動作を動的に生成・構成できるLLMエージェントフレームワークを提案する。
このフレームワークでは、汎用プログラミング言語で書かれたプログラムを生成し実行することで、エージェントが環境と対話する。
論文 参考訳(メタデータ) (2024-11-04T02:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。