論文の概要: LLM-as-Code: Agentic Programming for Agent Harness
- arxiv url: http://arxiv.org/abs/2606.15874v2
- Date: Mon, 22 Jun 2026 08:52:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.112676
- Title: LLM-as-Code: Agentic Programming for Agent Harness
- Title(参考訳): LLM-as-Code:エージェントハーネスのためのエージェントプログラミング
- Authors: Junjia Qi, Zichuan Fu, Jingtong Gao, Wenlin Zhang, Hanyu Yan, Xian Wu, Xiangyu Zhao,
- Abstract要約: 我々はトークンの爆発、制御フローの幻覚、信頼できない完成は実装上のバグではないと主張している。
より良いプロンプトやより強力なモデルは、LLMエージェントの信頼性を保証することはできない。
本稿では,プログラムがすべての制御フローを制御し,LLMがそれの一部であるエージェントプログラミングを提案する。
- 参考スコア(独自算出の注目度): 20.350593038902904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Every major LLM agent framework gives the LLM the role of orchestrator; the model decides what to do next, when to call tools, and when to stop. We argue that token explosion, control-flow hallucination, and unreliable completion are not implementation bugs but architectural consequences of assigning the deterministic work of looping, branching, and sequencing to a probabilistic system. A better prompt or a stronger model cannot guarantee the reliability of the LLM agent. We therefore propose Agentic Programming, in which the program governs all control flow, and the LLM is itself part of it, an adaptive component we call LLM-as-Code and invoke only where a task calls for reasoning or generation. Within each call the model keeps full flexibility, but it cannot alter the program's execution path. With control in the program, the LLM's context is built from the execution history's call tree and forms a directed acyclic graph (DAG). Each call's context length is then determined by its call depth rather than by accumulation over steps. A case study of computer-use agents shows that the design is practical, not just a theoretical stance, substantially improving the stability of long visual operation sequences.
- Abstract(参考訳): モデルが次に何をするか、いつツールを呼び出すか、いつ停止するかを決めます。
トークンの爆発、制御フローの幻覚、信頼できない完成は、実装上のバグではなく、ループ、分岐、シークエンシングといった決定論的作業を確率論的システムに割り当てるというアーキテクチャ上の結果であると主張している。
より良いプロンプトやより強力なモデルは、LLMエージェントの信頼性を保証することはできない。
そこで我々は,プログラムが制御フローを全て支配するエージェントプログラミングを提案し,LLM自体がLLM-as-Codeと呼ばれる適応的なコンポーネントであり,タスクが推論や生成を行う場所のみを呼び出す。
各呼び出し内でモデルは完全に柔軟性を保つが、プログラムの実行パスを変更することはできない。
プログラムの制御により、LCMのコンテキストは実行履歴の呼び出しツリーから構築され、有向非巡回グラフ(DAG)を形成する。
それぞれの呼び出しのコンテキスト長は、ステップを積み重ねることよりも、呼び出しの深さによって決定される。
コンピュータ利用エージェントのケーススタディでは、設計は単なる理論的スタンスではなく実用的であり、長い視覚的操作シーケンスの安定性を大幅に改善している。
関連論文リスト
- From Agent Loops to Structured Graphs:A Scheduler-Theoretic Framework for LLM Agent Execution [1.8222732878503212]
LLMベースのエージェントを構築するための主要なパラダイムはエージェントループ(Agent Loop)である。
この観点では、エージェントループとグラフベースの実行エンジンを単一のセマンティック連続体に配置する。
暗黙の文脈から暗黙の静的DAGへ制御フローを上昇させるSGHを提案する。
論文 参考訳(メタデータ) (2026-04-13T12:16:45Z) - SafePilot: A Framework for Assuring LLM-enabled Cyber-Physical Systems [2.2566909388480743]
大規模言語モデル(LLM)は、最近、様々なサイバー物理システムに統合され始めている。
LLMは"ハロシン化"(hallucination)を生成します。
属性ベースおよび時間仕様に従ってCPSのエンドツーエンド保証を提供する新しい階層型ニューロシンボリックフレームワークであるSafePilotを提案する。
論文 参考訳(メタデータ) (2026-03-23T03:31:51Z) - Gecko: A Simulation Environment with Stateful Feedback for Refining Agent Tool Calls [56.407063247662336]
本稿では,ルールとLLMを組み合わせてツール応答をシミュレートする総合環境であるGeckoを紹介する。
GATS は GPT-4o, GPT-5, Gemini-3.0-pro など様々な LLM のツールコール性能を一貫して改善している。
論文 参考訳(メタデータ) (2026-02-22T15:02:00Z) - LLM-Guided Compositional Program Synthesis [16.867355177975387]
大規模言語モデル(LLM)は、異なるターゲット言語でコードを生成することによってPBEタスクを解く能力を持つが、予測不能に失敗する可能性がある。
そこで本研究では,LLMのためのシンプルなサブタスクを構築することで,障害から回復する新しい手法を提案する。
論文 参考訳(メタデータ) (2025-03-12T00:36:43Z) - Efficient Tool Use with Chain-of-Abstraction Reasoning [63.08202389132155]
大規模言語モデル(LLM)は、現実世界の知識に対する推論の基礎となる必要がある。
マルチステップ推論問題におけるツールの実行には,微調整LDMエージェントの課題が残されている。
マルチステップ推論におけるツールの活用方法として, LLM の新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-30T21:53:30Z) - An LLM Compiler for Parallel Function Calling [68.04566807806071]
我々は,複数の関数呼び出しを効率的にオーケストレーションするために並列に関数を実行するLLMCompilerを紹介する。
ReActと比較して、一貫したレイテンシの高速化が3.7倍、コストの削減が6.7倍、精度が9%向上している。
論文 参考訳(メタデータ) (2023-12-07T18:32:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。