論文の概要: Cordon: Semantic Transactions for Tool-Using LLM Agents
- arxiv url: http://arxiv.org/abs/2606.17573v1
- Date: Tue, 16 Jun 2026 06:21:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.307507
- Title: Cordon: Semantic Transactions for Tool-Using LLM Agents
- Title(参考訳): Cordon: LLMエージェントのセマンティックトランザクション
- Authors: Zheng Chen, Hanqing Liu, Duling Xu, Dong Dong, Jialin Li, Bangzheng Pu, Jidong Zhai,
- Abstract要約: 本稿では,コミット前にエージェント効果のステージングと検証を行うトランザクションランタイムシステムであるCordonを紹介する。
適度な承認とレイテンシのオーバーヘッドで、良質なタスク補完を保ちながら、不可逆的な効率の失敗を減らす。
- 参考スコア(独自算出の注目度): 11.567293065381918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tool-using LLM agents are shifting the unit of computation from explicit human-issued commands to model-driven tasks with stateful consequences. Yet today's agent runtimes still expose tools as isolated RPCs. This interface gives runtimes a convenient integration point, but it lacks a task-scoped execution boundary for commit, rollback, recovery, and audit across multi-step agent workflows. We argue that this mismatch calls for a runtime containment boundary rather than another per-call guardrail. This paper introduces Cordon, a transactional runtime system for staging and validating irreversible agent effects before commit. A semantic transaction is a task-level execution boundary that binds tool intents and runtime-tracked result lineage to reversible local state, staged external effects, delegated authority, and audit metadata. Cordon implements this abstraction with a transaction manager that tracks derived result objects, executes reversible mutations in shadow state, stages outward-facing actions in an effect outbox, and records recovery metadata. The runtime then validates the composed execution flow before it commits state or releases external effects. Our evaluation across adversarial and benign workflows shows that Cordon exposes cross-step violations missed by existing defenses. It also reduces irreversible-effect failures while preserving benign task completion with modest approval and latency overhead.
- Abstract(参考訳): ツールを使用するLLMエージェントは、計算単位を明示的な人為的なコマンドからステートフルな結果を伴うモデル駆動タスクにシフトしている。
しかし、今日のエージェントランタイムは、ツールを独立したRPCとして公開している。
このインターフェースはランタイムに便利な統合ポイントを提供するが、コミット、ロールバック、リカバリ、マルチステップエージェントワークフロー間の監査のためのタスクスコープ実行境界がない。
このミスマッチは、呼び出し毎のガードレールではなく、ランタイムの囲い込み境界を要求する。
本稿では,コミット前に不可能なエージェント効果をステージングし,検証するトランザクションランタイムシステムであるCordonを紹介する。
セマンティックトランザクションは、ツールインテントと実行時追跡された結果の行を可逆的なローカル状態、ステージ化された外部エフェクト、委譲された権限、監査メタデータにバインドするタスクレベルの実行バウンダリである。
Cordon氏はこの抽象化を、派生した結果オブジェクトを追跡し、シャドーステートで可逆的な突然変異を実行し、エフェクトアウトボックスで外向きのアクションを実行し、リカバリメタデータを記録するトランザクションマネージャで実装している。
ランタイムは、ステートをコミットする前に、あるいは外部エフェクトをリリースする前に、構成された実行フローを検証する。
敵のワークフローと良心のワークフローによる評価は,既存の防御で欠落したクロスステップ違反をコルドンが露呈していることを示している。
また、適度な承認とレイテンシーのオーバーヘッドで良質なタスク完了を保ちながら、不可逆的な効果の失敗を減らす。
関連論文リスト
- Context-Fractured Decomposition Attacks on Tool-Using LLM Agents: Exploiting Artifact Provenance Gaps [10.07589034106101]
ジェイルブレイクの防御は、孤立したテキストではなく、クロスステップの構成について理にかなっている必要がある。
ツール利用 LLM エージェントのデプロイ障害モード, 改善ギャップを運用する。
トレースレベルの診断で障害モードを計測し、検証可能な緩和方向を概説する。
論文 参考訳(メタデータ) (2026-06-08T06:29:42Z) - A Physical Agentic Loop for Language-Guided Grasping with Execution-State Monitoring [5.437966695589128]
我々は、接地された実行状態上で動作する有界な実施エージェントとして言語誘導の把握を再構築する。
未修正の学習操作プリミティブをラップする物理エージェントループを導入する。
眼内カメラD405を用いた移動マニピュレータのループを検証した。
論文 参考訳(メタデータ) (2026-04-08T08:01:35Z) - A Trace-Based Assurance Framework for Agentic AI Orchestration: Contracts, Testing, and Governance [0.22940141855172028]
本稿では,Large Language Models (LLM) を用いたエージェントAIシステムの保証フレームワークを提案する。
実行は、明示的なステップとトレースコントラクトを備えたメッセージ・アクション・トレース(MAT)として実装される。
このフレームワークは、有界摂動に対する予算付き反例探索として定式化されたストレステストを含む。
論文 参考訳(メタデータ) (2026-03-18T10:23:48Z) - Agents Learn Their Runtime: Interpreter Persistence as Training-Time Semantics [4.774525456207306]
ツール拡張LDMは、自然言語推論と実行可能なPythonアクションをインターリーブするエージェントとして、ますます多くデプロイされている。
インタプリタの永続化は単に実行時の足場なのか、それともエージェントがインタープリタの使い方を学習する方法を形作るトレーニングデータの特性なのかを問う。
ワンショットソリューションを避けるために設計された、部分的に観測可能な最適化タスクの手続き的に生成されたファミリーであるOpaque Knapsackを紹介する。
論文 参考訳(メタデータ) (2026-03-01T18:08:02Z) - Robust and Efficient Tool Orchestration via Layered Execution Structures with Reflective Correction [55.13278005189741]
私たちは、高レベルのツール依存関係をキャプチャする階層化された実行構造を学ぶために、ツールオーケストレーションをモデル化します。
本稿では,局所的にエラーを検出し,修正するスキーマ対応反射補正機構を提案する。
この設計では、エラーを個々のツールコールに限定し、実行軌跡全体の再計画を避ける。
論文 参考訳(メタデータ) (2026-02-21T22:20:01Z) - Atomix: Timely, Transactional Tool Use for Reliable Agentic Workflows [3.1978093202244704]
Atomixは、エージェントツールコールのためのプログレスアウェアなトランザクションセマンティクスを提供するランタイムである。
Atomixは各コールをエポックでタグ付けし、リソースごとのフロンティアを追跡し、進捗予測が安全性を示す場合にのみコミットする。
論文 参考訳(メタデータ) (2026-02-16T15:46:19Z) - The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check [54.08619694620588]
本稿では,2つの異なるエージェントパラダイムであるEmbodied AgentsとTool-Calling AgentsにまたがるdLLMの包括的評価を行う。
Agentboard と BFCL では,現在の dLLM が信頼できるエージェントバックボーンとして機能しないという,"ビットレッスン" が報告されている。
論文 参考訳(メタデータ) (2026-01-19T11:45:39Z) - Runaway is Ashamed, But Helpful: On the Early-Exit Behavior of Large Language Model-based Agents in Embodied Environments [54.67512489842682]
大規模言語モデル(LLM)は、複雑な実施環境において、強力な計画と意思決定能力を示す。
LLMをベースとしたエージェントの早期退避行動を探究する第一歩を踏み出す。
論文 参考訳(メタデータ) (2025-05-23T08:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。