論文の概要: OpenRath: Session-Centered Runtime State for Agent Systems
- arxiv url: http://arxiv.org/abs/2606.19409v1
- Date: Wed, 17 Jun 2026 15:19:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.450187
- Title: OpenRath: Session-Centered Runtime State for Agent Systems
- Title(参考訳): OpenRath: エージェントシステムのためのセッション中心のランタイムステート
- Authors: Fukang Wen, Zhijie Wang, Ruilin Xu,
- Abstract要約: OpenRathはマルチエージェント・マルチセッションシステムのためのPyTorchのようなプログラミングモデルである。
セッションはブランチ可能、検査可能、再生可能、バックエンド対応、構成可能である。
レポートは、プログラミングモデル、アーキテクチャ、監査されたマイルストーン、エビデンスプロトコルを提示する。
- 参考スコア(独自算出の注目度): 2.9568259440852
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern agent systems often suffer from fragmented runtime state: transcripts, tool effects, memory events, workspace placement, branch provenance, and replay evidence are recorded separately and become difficult to inspect or reproduce. OpenRath addresses this issue with a PyTorch-like programming model for multi-agent, multi-session systems. The analogy concerns the role of a central first-class runtime abstraction, not tensor computation. Its core abstraction is Session, the runtime value passed between agents and workflows. A Session is branchable, inspectable, replayable, backend-aware, and composable. It records conversation chunks, sandbox placement, lineage metadata, token usage, pending work, and tool evidence, while defining where memory interactions enter the runtime record. Since this state is carried by the same value used in program execution, fork, merge, and replay become explicit runtime operations rather than states reconstructed from external traces. OpenRath further defines Sandbox, Tool, Agent, Memory, Workflow, and Selector, with Selector turning control flow into runtime-routed decisions. This report presents the programming model, architecture, audited milestones, and evidence protocol. Its claims are limited to controlled runtime properties, while broad quantitative comparisons, live-provider quality, optional-backend availability, and memory quality are left for follow-on evaluation. The central thesis is that Session provides agent systems with a first-class runtime value for auditable composition.
- Abstract(参考訳): 現代のエージェントシステムでは、スクリプティング、ツールエフェクト、メモリイベント、ワークスペース配置、ブランチの証明、リプレイエビデンスを別々に記録し、検査や複製が困難になる。
OpenRathはマルチエージェント・マルチセッションシステムのためのPyTorchのようなプログラミングモデルでこの問題に対処する。
このアナロジーは、テンソル計算ではなく、中央のファーストクラスのランタイム抽象化の役割に関係している。
コア抽象化はSessionであり、エージェントとワークフローの間で渡されるランタイム値である。
セッションはブランチ可能、検査可能、再生可能、バックエンド対応、構成可能である。
会話チャンク、サンドボックス配置、継承メタデータ、トークン使用、保留中の作業、ツールエビデンスを記録し、メモリインタラクションが実行時レコードに入る場所を定義する。
この状態は、プログラムの実行、フォーク、マージ、リプレイで使われるのと同じ値で保持されるため、外部トレースから再構築された状態ではなく、明示的な実行時操作になる。
OpenRathはさらに、サンドボックス、ツール、エージェント、メモリ、ワークフロー、セレクタを定義する。
本報告では,プログラミングモデル,アーキテクチャ,監査済みマイルストーン,エビデンスプロトコルについて述べる。
その主張は、コントロールされたランタイムプロパティに限られる一方で、幅広い量比較、ライブプロファイラの品質、オプションのバックエンド可用性、メモリ品質が後続評価のために残されている。
中心的なテーマは、Sessionが監査可能なコンポジションのためのファーストクラスのランタイム値をエージェントシステムに提供することである。
関連論文リスト
- PACMS: Submodular Context Selection as a Pluggable Engine for LLM Agents [0.9134244356393664]
LLMエージェントは、複数の方向から同時に満たされるコンテキストウィンドウ上で動作する。
一般的なメカニズムは、時として周期的な要約と組み合わせて、直流の切り離しである。
Retrieval拡張生成は、外部文書をプロンプトにフェッチするが、エージェントの空白表示されたコンテキストを仲裁しない。
論文 参考訳(メタデータ) (2026-06-18T10:22:57Z) - Cordon: Semantic Transactions for Tool-Using LLM Agents [11.567293065381918]
本稿では,コミット前にエージェント効果のステージングと検証を行うトランザクションランタイムシステムであるCordonを紹介する。
適度な承認とレイテンシのオーバーヘッドで、良質なタスク補完を保ちながら、不可逆的な効率の失敗を減らす。
論文 参考訳(メタデータ) (2026-06-16T06:21:14Z) - Agent libOS: A Library-OS-Inspired Runtime for Long-Running, Capability-Controlled LLM Agents [0.6345523830122165]
大規模言語モデル(LLM)エージェントは、要求応答アシスタントから長期実行中のソフトウェアアクターへと進化している。
本稿では,LLMエージェントのためのライブラリOSをベースとしたランタイム基板であるAgens libOSを提案する。
論文 参考訳(メタデータ) (2026-06-02T16:53:24Z) - Mem-W: Latent Memory-Native GUI Agents [50.87647372904382]
本稿では,メモリをエージェントの連続的コンテキストの一部として扱う,潜在メモリネイティブなGUIエージェントであるMem-Wを紹介する。
4つのWebおよびモバイルナビゲーションベンチマークで、Mem-Wはさまざまなバックボーンとメモリ拡張ベースラインを一貫して改善している。
論文 参考訳(メタデータ) (2026-05-10T04:31:23Z) - ClawMark: A Living-World Benchmark for Multi-Turn, Multi-Day, Multimodal Coworker Agents [77.22389710754452]
マルチターンマルチデイタスクを中心に構築された同僚エージェントのベンチマークであるベンチを紹介する。
現在のリリースには、13のプロのシナリオにわたる100のタスクが含まれており、5つのステートフルなサンドボックスサービスに対して実行される。
最強のモデルは75.8の重み付きスコアに達するが、最も厳格なタスク成功率は20.0%に過ぎず、部分的な進歩が一般的であることを示している。
論文 参考訳(メタデータ) (2026-04-26T16:05:02Z) - Springdrift: An Auditable Persistent Runtime for LLM Agents with Case-Based Memory, Normative Safety, and Ambient Self-Perception [0.20305676256390928]
本稿では、長期LLMエージェントの永続ランタイムであるSpringdriftを紹介する。
我々は,このカテゴリに人工リテーナという用語を導入する。
これは、システム設計とデプロイメントのケーススタディに関する技術的なレポートであり、ベンチマークによる評価ではない。
論文 参考訳(メタデータ) (2026-04-06T13:14:37Z) - MemoryArena: Benchmarking Agent Memory in Interdependent Multi-Session Agentic Tasks [55.145729491377374]
メモリを持つエージェントの既存の評価は、通常、単独で記憶と行動を評価する。
マルチセッションメモリ-エージェント環境ループにおけるエージェントメモリのベンチマークのための統合評価ジムであるMemoryArenaを紹介する。
MemoryArenaは、Webナビゲーション、優先制約付き計画、プログレッシブ情報検索、シーケンシャルなフォーマルな推論を含む評価をサポートする。
論文 参考訳(メタデータ) (2026-02-18T09:49:14Z) - Learning to Share: Selective Memory for Efficient Parallel Agentic Systems [49.78267008828593]
エージェントシステムは、反復的に推論する複数のエージェントを調整することで複雑なタスクを解決し、ツールを呼び出し、中間結果を交換する。
最近のアプローチでは、さまざまな推論の軌跡を探索するために、複数のエージェントチームが並行して運用されている。
我々は並列エージェントフレームワークのための学習された共有メモリ機構であるLearning to Share (LTS)を提案する。
論文 参考訳(メタデータ) (2026-02-05T18:20:21Z) - FS-Researcher: Test-Time Scaling for Long-Horizon Research Tasks with File-System-Based Agents [53.03492387564392]
我々はFS-Researcherを紹介した。FS-Researcherはファイルシステムベースのフレームワークで、永続的なワークスペースを通じてコンテキストウィンドウを超えて深い研究をスケールする。
Context Builderエージェントはインターネットを閲覧し、構造化されたノートを書き、ソースを階層的な知識ベースにアーカイブする。
その後、レポートライターエージェントが最終レポートセクションをセクションごとに構成し、知識ベースを事実のソースとして扱う。
論文 参考訳(メタデータ) (2026-02-02T03:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。