論文の概要: Causal Past Logic for Runtime Verification of Distributed LLM Agent Workflows
- arxiv url: http://arxiv.org/abs/2605.20923v1
- Date: Wed, 20 May 2026 09:09:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.590091
- Title: Causal Past Logic for Runtime Verification of Distributed LLM Agent Workflows
- Title(参考訳): 分散LLMエージェントワークフローの実行時検証のための因果過去の論理
- Authors: Benedikt Bollig,
- Abstract要約: 私たちはCausal Past Logic (CPL)でZipperGenエージェントワークフローフレームワークを拡張します。
CPLは、条件付きおよびループ中のガードのための小さな時間論理である。
我々は,最新の値ビューを持つベクトル時計を提示し,局所的に計算されたモニタ値が現在のイベントにおけるガードの意味論的意味と一致することを証明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Distributed LLM agent workflows should not be monitored as if they produced a single sequential log. In an asynchronous execution, a decision can only depend on events that are causally visible to the lifeline that makes it: an event that appears earlier in some log may still be unknown locally. We extend the ZipperGen agent-workflow framework with Causal Past Logic (CPL), a small past-time temporal logic for guards in conditionals and while loops. In addition to standard past-time modalities such as previous and since, a guard can inspect the latest causally visible event of another lifeline and selected variables stored there. The formula is a source-level guard: it is evaluated online by the owner lifeline and can influence control flow at runtime. We give a vector-clock monitor with latest-value views and prove that the locally computed monitor value coincides with the denotational semantics of the guard at the current event. Thus runtime verification becomes part of the coordination language itself, rather than a post-hoc check over an execution log.
- Abstract(参考訳): 分散LLMエージェントワークフローは、単一のシーケンシャルログを生成するかのように監視するべきではない。
非同期実行では、決定は、それを実現するライフラインに慎重に見えるイベントにのみ依存する。
ZipperGen エージェントワークフローフレームワークを Causal Past Logic (CPL) で拡張する。
前やそれ以降のような標準的な過去のモダリティに加えて、ガードは、他のライフラインの最新の因果的に見えるイベントと、そこに格納された選択された変数を検査することができる。
公式はソースレベルのガードであり、所有者のライフラインによってオンラインで評価され、実行時の制御フローに影響を与える可能性がある。
我々は,最新の値ビューを持つベクトル時計を提示し,局所的に計算されたモニタ値が現在のイベントにおけるガードの意味論的意味と一致することを証明した。
したがって実行時検証は、実行時ログに対するポストホックチェックではなく、コーディネーション言語自体の一部となる。
関連論文リスト
- Monitoring Data-aware Temporal Properties (Extended Version) [56.386411908764494]
有限トレース上の任意のSMT理論に富む線形時間特性の予測モニタリングについて考察する。
この設定での予測モニタリングは非常に困難であり、監視状態はこれまでのトレースプレフィックスと可能な有限継続の両方に依存している。
本研究は,表現的フラグメントオフMTにおける特性モニタリングのための新しい基礎的枠組みの正しさを提示し,正式に証明するものである。
論文 参考訳(メタデータ) (2026-05-14T10:23:11Z) - When Should an AI Workflow Release? Always-Valid Inference for Black-Box Generate-Verify Systems [2.805986764620217]
LLM対応AIは、繰り返し生成・評価・修正ループを通じて出力を生成する。
デプロイメント時間評価器のスコアが適応的に生成され、繰り返し監視されるため、これは統計的課題を提起する。
既存のジェネレータ評価パイプラインに対して,常に有効なリリースラッパーを提案する。
論文 参考訳(メタデータ) (2026-05-13T03:30:39Z) - Logic-Regularized Verifier Elicits Reasoning from LLMs [63.65875399266337]
論理規則で正規化された教師なしの検証器であるLOVERを提案する。
ローバーは、定理を二項潜在変数として扱い、内部の活性化を活用し、3つの論理的制約を課す。
ローバーは教師なしのベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2026-05-07T09:03:49Z) - A Physical Agentic Loop for Language-Guided Grasping with Execution-State Monitoring [5.437966695589128]
我々は、接地された実行状態上で動作する有界な実施エージェントとして言語誘導の把握を再構築する。
未修正の学習操作プリミティブをラップする物理エージェントループを導入する。
眼内カメラD405を用いた移動マニピュレータのループを検証した。
論文 参考訳(メタデータ) (2026-04-08T08:01:35Z) - Quantifying Memory Use in Reinforcement Learning with Temporal Range [51.98491034847041]
時間的範囲(Temporal Range)は、時間的影響プロファイルとして、時間的ウィンドウから入力シーケンスへの複数のベクトル出力の1次感度を扱うモデルに依存しない計量である。
また、タスクレベルメモリのプロキシ読み出しとして、タスク上で訓練されたコンパクトなLong Expressive Memory(LEM)ポリシーについて、テンポラルレンジを報告する。
論文 参考訳(メタデータ) (2025-12-05T22:58:09Z) - Beyond Linear Probes: Dynamic Safety Monitoring for Language Models [67.15793594651609]
従来の安全モニタは、クエリ毎に同じ量の計算を必要とする。
動的アクティベーションモニタリングのための線形プローブの自然な拡張であるTrncated Polynomials (TPCs)を紹介する。
我々の重要な洞察は、TPCを段階的に、短期的に訓練し、評価できるということです。
論文 参考訳(メタデータ) (2025-09-30T13:32:59Z) - A Note on Runtime Verification of Concurrent Systems [0.0]
本稿では,トレースベースの論理を利用して並列システムの検証を行う方法を提案する。
本稿は,LTrL式のためのトレース一貫性B"uchi Automaticaの構築を思い出し,よく理解されたモニタ合成手順でどのように利用するかを説明する。
論文 参考訳(メタデータ) (2025-07-07T09:50:59Z) - Benchmarking Agentic Workflow Generation [80.74757493266057]
複数面シナリオと複雑なグラフワークフロー構造を備えた統合ワークフロー生成ベンチマークであるWorfBenchを紹介する。
また,サブシーケンスとサブグラフマッチングアルゴリズムを利用したシステム評価プロトコルWorfEvalを提案する。
我々は、生成されたタスクが下流のタスクを強化し、推論中により少ない時間で優れたパフォーマンスを達成することを観察する。
論文 参考訳(メタデータ) (2024-10-10T12:41:19Z) - Distributed Monitoring of Timed Properties [0.22499166814992436]
ランタイム監視は、あるプロパティを満たすかどうかをできるだけ早く決定するために、システムの実行を観察することで構成される。
我々は、到達性タイムドオートマトンとして与えられるプロパティについて、分散環境でのモニタリングを検討する。
本稿では,時間特性のオンラインモニタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-01T07:46:59Z) - Sound Concurrent Traces for Online Monitoring Technical Report [0.0]
並列プログラムは通常、抽象的なプログラム実行のためのトレースの収集に依存します。
まず、トレースが並列実行を表すときの概念を定義します。
次に,非ブロッキングベクトルクロックアルゴリズムを提案し,音の同時トレースをハエで収集する。
論文 参考訳(メタデータ) (2024-02-28T15:11:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。