論文の概要: Self-Programmed Execution for Language-Model Agents
- arxiv url: http://arxiv.org/abs/2605.06898v1
- Date: Thu, 07 May 2026 19:58:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:38.591692
- Title: Self-Programmed Execution for Language-Model Agents
- Title(参考訳): 言語モデルエージェントの自己生成的実行
- Authors: Luke J. O'Connor,
- Abstract要約: 本稿では,モデル補完自体がオーケストレータプログラムであるエージェントアーキテクチャである自己プログラム実行(SPE)を紹介する。
私はエージェントマシンを使ってこのアイデアを定式化します: SPE状態は、モデル完了がマシンの埋め込みコピーの状態をロードできる状態です。
そこで、Lispベースの言語であるSpellを紹介します。
- 参考スコア(独自算出の注目度): 0.30458514384586394
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: At the heart of existing language model agents is a fixed orchestrator program responsible for the state transition between consecutive turns. This paper introduces self-programmed execution (SPE), an agent architecture in which the model completion is itself the orchestrator program, and the harness evaluates this program but does not impose its own orchestration policy. I formalize this idea using agentic machines: an SPE state is one from which a model completion can load any state of an embedded copy of the machine, meaning that it is subject to no fixed turn-to-turn orchestration policy. Realizing SPE in practice is nontrivial because the same data is both model context and executable program. I therefore introduce Spell, a Lisp-based language in which programs can edit and re-evaluate themselves, and effectful expressions like model invocations are structured such that re-evaluating an edited program does not replay its side effects. Experiments with existing models, not trained for SPE or Spell, show that frontier models can operate in this regime and accomplish challenging agentic tasks. These results demonstrate how an LM can act as an agent without any fixed orchestration policy, and they raise the question of what self-orchestration strategies might be learned by a model trained for self-programmed execution. Code is available at https://github.com/lukejoconnor/spell .
- Abstract(参考訳): 既存の言語モデルエージェントの中心は、連続するターン間の状態遷移に責任を持つ固定オーケストレータプログラムである。
本稿では,モデル補完自体がオーケストレータプログラムであり,ハーネスがこのプログラムを評価するが,独自のオーケストレーションポリシーを課さないエージェントアーキテクチャである自己プログラム実行(SPE)を紹介する。
エージェントマシンを使ってこのアイデアを形式化する: SPE状態とは、モデル完了がマシンの埋め込みコピーの状態をロードできる状態である。
同じデータがモデルコンテキストと実行可能プログラムの両方であるため、実際にSPEを実現するのは簡単ではない。
そこで私は,プログラムが自分自身を編集・再評価できるLispベースの言語であるSpellを紹介し,編集プログラムの再評価が副作用を再現しないようなモデル呼び出しのような実効的な表現を構造化する。
SPEやSpellのために訓練されていない既存のモデルによる実験は、フロンティアモデルがこの体制で動作し、挑戦的なエージェントタスクを達成できることを示している。
これらの結果は、LMが固定的なオーケストレーションポリシーを使わずにエージェントとして振る舞う方法を示し、自己プログラムされた実行のために訓練されたモデルによって自己組織化戦略が学べるかという疑問を提起する。
コードはhttps://github.com/lukejoconnor/spell で入手できる。
関連論文リスト
- Governed Metaprogramming for Intelligent Systems: Reclassifying Eval as a Governed Effec [0.0]
プログラム表現が第一級値となる言語設計であるメタプログラミングについて述べる。
形式操作の純粋性、非バイパス定理、境界保存の3つの性質を証明している。
中心的な貢献は、evalを言語プリミティブから支配的なエフェクトに再分類することである。
論文 参考訳(メタデータ) (2026-05-05T02:56:43Z) - RunAgent: Interpreting Natural-Language Plans with Constraint-Guided Execution [36.644786364066796]
RunAgentは、自然言語プランを解釈し、制約やルーリックを通じて段階的に実行するマルチエージェントプラン実行プラットフォームである。
RunAgent はベースライン LLM や最先端の PlanGEN 法より優れていることを示す。
論文 参考訳(メタデータ) (2026-05-01T17:29:45Z) - From Agent Loops to Structured Graphs:A Scheduler-Theoretic Framework for LLM Agent Execution [1.8222732878503212]
LLMベースのエージェントを構築するための主要なパラダイムはエージェントループ(Agent Loop)である。
この観点では、エージェントループとグラフベースの実行エンジンを単一のセマンティック連続体に配置する。
暗黙の文脈から暗黙の静的DAGへ制御フローを上昇させるSGHを提案する。
論文 参考訳(メタデータ) (2026-04-13T12:16:45Z) - Act-Observe-Rewrite: Multimodal Coding Agents as In-Context Policy Learners for Robot Manipulation [0.0]
本稿では、LLMエージェントがロボット操作ポリシーを改善するためのフレームワークであるAct-Observe-Rewrite(AOR)を提案する。
AORはLLM推論の単位として、完全な低レベルモーター制御を実装している。
エージェントは、デモンストレーション、報酬工学、勾配更新なしで高い成功率を達成する。
論文 参考訳(メタデータ) (2026-03-03T22:15:55Z) - Robust and Efficient Tool Orchestration via Layered Execution Structures with Reflective Correction [55.13278005189741]
私たちは、高レベルのツール依存関係をキャプチャする階層化された実行構造を学ぶために、ツールオーケストレーションをモデル化します。
本稿では,局所的にエラーを検出し,修正するスキーマ対応反射補正機構を提案する。
この設計では、エラーを個々のツールコールに限定し、実行軌跡全体の再計画を避ける。
論文 参考訳(メタデータ) (2026-02-21T22:20:01Z) - ALRM: Agentic LLM for Robotic Manipulation [3.7473235317736058]
大規模言語モデル(LLM)は最近、高度な推論と計画能力を示すためにエージェントフレームワークに権限を与えた。
大規模言語モデル(LLM)は最近、高度な推論と計画能力を示すためにエージェントフレームワークに権限を与えた。
論文 参考訳(メタデータ) (2026-01-27T11:54:14Z) - Monadic Context Engineering [59.95390010097654]
本稿では,エージェント設計の正式な基盤を提供するために,モナディックコンテキストエンジニアリング(MCE)を紹介する。
我々は、モナドがロバストなコンポジションをどのように実現し、Applicativesが並列実行に原則化された構造を提供し、また、モナドトランスフォーマーがこれらの機能の体系的なコンポジションをどのように可能にしているかを実証する。
この階層化されたアプローチにより、開発者は、単純で独立した検証可能なコンポーネントから、複雑でレジリエントで効率的なAIエージェントを構築することができる。
論文 参考訳(メタデータ) (2025-12-27T01:52:06Z) - BatonVoice: An Operationalist Framework for Enhancing Controllable Speech Synthesis with Linguistic Intelligence from LLMs [84.59993864748195]
音声生成から命令理解を分離する「操作主義」に着想を得た新しいパラダイムを提案する。
本稿では,LLMが導体として機能するフレームワークであるBatonVoiceを紹介し,ユーザの指示を理解する。
別個のTSモデルである「オーケストラ」は、これらの特徴から音声を生成する。
論文 参考訳(メタデータ) (2025-09-30T16:52:14Z) - Reinforcement Learning for Machine Learning Engineering Agents [52.03168614623642]
強化学習によって改善される弱いモデルによって支援されるエージェントは、はるかに大きいが静的モデルによって支援されるエージェントよりも優れていることを示す。
分散非同期RLフレームワークにおいて,高コストかつ高利回りな動作を増幅するための時間依存性の勾配更新を提案する。
また,早期に失敗するプログラムとほぼ正しくないプログラムを区別し,部分クレジットを提供する環境機器を提案する。
論文 参考訳(メタデータ) (2025-09-01T18:04:10Z) - NExT: Teaching Large Language Models to Reason about Code Execution [50.93581376646064]
大規模言語モデル(LLM)のコードは通常、プログラムの表面テキスト形式に基づいて訓練される。
NExTは,プログラムの実行トレースを検査し,実行時の動作を判断する手法である。
論文 参考訳(メタデータ) (2024-04-23T01:46:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。