論文の概要: A Methodology for Selecting and Composing Runtime Architecture Patterns for Production LLM Agents
- arxiv url: http://arxiv.org/abs/2605.20173v1
- Date: Tue, 19 May 2026 17:54:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.575308
- Title: A Methodology for Selecting and Composing Runtime Architecture Patterns for Production LLM Agents
- Title(参考訳): 生産LLMエージェントのための実行時アーキテクチャパターンの選択と構成手法
- Authors: Vasundra Srinivasan,
- Abstract要約: 本稿では, 境界決定論的境界(SDB): 提案者, 検証者, コミットステップ, 拒否信号の4部契約について述べる。
我々は、SDBは本番エージェントランタイムの負荷分散プリミティブであると主張している。
本稿では,会話エージェント,自律エージェント,長期エージェント間で異なるSDBを構成する6つの実行パターンのカタログを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Production LLM agents combine stochastic model outputs with deterministic software systems, yet the boundary between the two is rarely treated as a first-class architectural object. This paper names that boundary the stochastic-deterministic boundary (SDB): a four-part contract among a proposer, verifier, commit step, and reject signal that specifies how an LLM output becomes a system action. We argue that the SDB is the load-bearing primitive of production agent runtimes. Around this primitive, we organize agent runtime design into three concerns: Coordination, State, and Control. We present a catalog of six runtime patterns that compose the SDB differently across conversational, autonomous, and long-horizon agents: hierarchical delegation, scatter-gather plus saga, event-driven sequencing, shared state machine, supervisor plus gate, and human in the loop. For each pattern, we trace its lineage to distributed-systems concepts and identify what changes when the worker is stochastic. The paper contributes a five-step methodology for selecting runtime patterns, a diagnostic procedure that maps production failures to pattern weaknesses, and a failure mode called replay divergence, in which LLM-based consumers of a deterministic event log produce different downstream outputs under model-version or prompt changes. A stylized reliability decomposition separates per-call model variance from architectural momentum, motivating the claim that as model variance decreases, pattern choice and SDB strength become increasingly important levers for long-run reliability. We apply the methodology to five workloads and provide one runnable reference implementation for a 90-day contract-renewal agent.
- Abstract(参考訳): LLMエージェントは確率的モデル出力と決定論的ソフトウェアシステムを組み合わせるが、両者の境界は第一級のアーキテクチャオブジェクトとして扱われることは滅多にない。
本稿では,LLMの出力がシステム動作となる方法を特定するための提案者,検証者,コミットステップ,拒否信号の4つの部分契約を,確率-決定的境界(SDB)の境界として挙げる。
我々は、SDBは本番エージェントランタイムの負荷分散プリミティブであると主張している。
このプリミティブの周りに、エージェントランタイム設計を3つの関心事(コーディネーション、ステート、コントロール)にまとめます。
本稿では,SDBを対話型エージェント,自律型エージェント,長距離エージェント間で異なる構成で構成する6つの実行パターンのカタログを示す。
各パターンについて、その系統を分散システムの概念にトレースし、ワーカが確率的であるときの変化を識別する。
本稿では、実行時パターンを選択するための5段階の方法論、生産失敗をパターンの弱点にマッピングする診断手順、リプレイ・ディバイジェンス(replay divergence)と呼ばれる障害モード、そして、LCMベースのイベントログのコンシューマがモデル変換や変更の迅速化の下で異なるダウンストリームアウトプットを生成できるような、リプレイ・ディバイジェンス(replay divergence)を提案する。
スタイル化された信頼性の分解は、呼び出しごとのモデル分散とアーキテクチャのモーメントを分離し、モデル分散が減少するにつれて、パターン選択とSDB強度が長期信頼性にとってますます重要なレバーとなるという主張を動機づける。
提案手法を5つのワークロードに適用し,90日間の契約更新エージェントに対して実行可能な参照実装を提供する。
関連論文リスト
- Coordination as an Architectural Layer for LLM-Based Multi-Agent Systems [0.0]
マルチエージェントLLMシステムは41%から87%の速度で生産に失敗する。
コーディネーションは、エージェントロジックと情報アクセスから分離可能なアーキテクチャ層として扱われるべきである、と我々は主張する。
我々はこれを予測市場における情報制御設計でインスタンス化する。
論文 参考訳(メタデータ) (2026-05-05T02:56:44Z) - From Agent Loops to Structured Graphs:A Scheduler-Theoretic Framework for LLM Agent Execution [1.8222732878503212]
LLMベースのエージェントを構築するための主要なパラダイムはエージェントループ(Agent Loop)である。
この観点では、エージェントループとグラフベースの実行エンジンを単一のセマンティック連続体に配置する。
暗黙の文脈から暗黙の静的DAGへ制御フローを上昇させるSGHを提案する。
論文 参考訳(メタデータ) (2026-04-13T12:16:45Z) - PathWise: Planning through World Model for Automated Heuristic Design via Self-Evolving LLMs [16.59846708454225]
自己進化型LCM(PathWise)による世界自動ヒューリスティックデザインのための計画的計画」と呼ばれる新しいマルチエージェント推論フレームワークを提案する。
PathWiseは、検索軌跡のコンパクトでステートフルなメモリとして機能するエンテーメントグラフ上のシーケンシャルな決定過程を定式化する。
様々なCOP実験により、PathWiseはより高速に収束し、より一般化し、異なるLCMバックボーンをまたいで一般化し、より大きな問題サイズにスケールすることが示された。
論文 参考訳(メタデータ) (2026-01-28T12:34:50Z) - Every Step Counts: Decoding Trajectories as Authorship Fingerprints of dLLMs [63.82840470917859]
本稿では,dLLMの復号化機構をモデル属性の強力なツールとして利用できることを示す。
本稿では、デコードステップ間の構造的関係を捉え、モデル固有の振る舞いをよりよく明らかにする、DDM(Directed Decoding Map)と呼ばれる新しい情報抽出手法を提案する。
論文 参考訳(メタデータ) (2025-10-02T06:25:10Z) - COrAL: Order-Agnostic Language Modeling for Efficient Iterative Refinement [80.18490952057125]
反復改良は、複雑なタスクにおける大規模言語モデル(LLM)の能力を高める効果的なパラダイムとして登場した。
我々はこれらの課題を克服するために、コンテキストワイズ順序非依存言語モデリング(COrAL)を提案する。
当社のアプローチでは、管理可能なコンテキストウィンドウ内で複数のトークン依存関係をモデル化しています。
論文 参考訳(メタデータ) (2024-10-12T23:56:19Z) - DALD: Improving Logits-based Detector without Logits from Black-box LLMs [56.234109491884126]
大規模言語モデル(LLM)はテキスト生成に革命をもたらし、人間の文章を忠実に模倣する出力を生成する。
我々は、ブラックボックステキスト検出における最先端性能を再定義する革新的なフレームワークであるDLD(Dis Distribution-Aligned LLMs Detection)を提案する。
DALDは、サロゲートモデルの分布を未知の目標LLMの分布と整合させ、高速モデルの反復に対する検出能力とレジリエンスを向上するように設計されている。
論文 参考訳(メタデータ) (2024-06-07T19:38:05Z) - Towards Robust Multi-Modal Reasoning via Model Selection [7.6621866737827045]
LLMはエージェントの"脳"として機能し、協調的な多段階タスク解決のための複数のツールを編成する。
我々はテスト時に無視できるランタイムオーバーヘッドを持つプラグインとして、$textitM3$フレームワークを提案する。
実験の結果,我々のフレームワークは,ユーザ入力とサブタスク依存の両方を考慮した動的モデル選択を可能にすることがわかった。
論文 参考訳(メタデータ) (2023-10-12T16:06:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。