論文の概要: Functional Cache Grafting: Robust and Rapid Code-Policy Synthesis for Embodied Agents
- arxiv url: http://arxiv.org/abs/2606.13097v1
- Date: Thu, 11 Jun 2026 09:25:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.693476
- Title: Functional Cache Grafting: Robust and Rapid Code-Policy Synthesis for Embodied Agents
- Title(参考訳): 機能的キャッシュグラフト: 身体的エージェントのロバストおよび迅速コード-ポリシィ合成
- Authors: Saehun Chun, Wonje Choi, Sera Choi, Sanghyun Ahn, Honguk Woo,
- Abstract要約: オープンドメインの具体化環境での政策生成には2つの基本的な制限がある。
本稿では,関数型キャッシュグラフティングフレームワークFCGraftを紹介する。
FCGraftはタスクの成功率を18.31%、ポリシー合成を2.3倍に向上させる。
- 参考スコア(独自算出の注目度): 17.59211966639723
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code-writing large language models (CodeLLMs) generate executable code policies for embodied agents by translating natural language goals and environmental constraints into structured control programs. However, policy generation in open-domain embodied environments suffers from two fundamental limitations: (i) delayed decoding caused by repetitive prefill computation over long prompts, and (ii) limited robustness due to fully generative decoding, which often produces API mismatches, missing safety guards, and unstable control logic. To address these limitations, we present FCGraft, a Functional Cache Grafting framework. FCGraft maintains a library of function-level validated code skeletons and their associated prompt-level Transformer key-value (KV) caches, and synthesizes new policies by retrieving relevant functions and grafting their KV caches when a new task is provided. Given retrieved function caches, FCGraft performs cache grafting via stitching, which composes cached function segments into a composite policy, and patching, which locally adapts only the necessary code regions to satisfy task-specific parameters and constraints with minimal additional decoding. By eliminating redundant prefill computation, this approach reduces generation latency, while reusing validated control structures improves robustness over prompt-level caching methods RAGCache, achieving 18.31% higher task success rate and 2.3x faster policy synthesis.
- Abstract(参考訳): コード記述大型言語モデル (CodeLLMs) は、自然言語の目標と環境制約を構造化制御プログラムに変換することで、エンボディエージェントの実行可能なコードポリシーを生成する。
しかし、オープンドメインの実施環境における政策生成には、以下の2つの基本的な制限がある。
一 長いプロンプトの繰り返しプリフィル計算による遅延復号
APIミスマッチ、安全ガードの欠如、不安定な制御ロジックをしばしば生成します。
これらの制限に対処するため,関数型キャッシュグラフティングフレームワークであるFCGraftを紹介する。
FCGraftは、関数レベルの検証済みコードスケルトンとその関連するプロンプトレベルのトランスフォーマーキー値(KV)キャッシュのライブラリを保持し、関連する関数を検索し、新しいタスクが提供されるときにKVキャッシュを移植することによって、新しいポリシーを合成する。
検索された関数キャッシュが与えられた後、FCGraftはスチュッチによりキャッシュグラフトを行い、キャッシュされた関数セグメントを複合ポリシーに構成し、パッチングはタスク固有のパラメータと制約を最小限のデコードで満たすために、必要なコード領域のみをローカルに適応させる。
冗長なプリフィル計算を排除し、検証された制御構造を再利用することで、プロンプトレベルのキャッシュ手法であるRAGCacheよりも堅牢性が向上し、18.31%のタスク成功率と2.3倍高速なポリシー合成を実現する。
関連論文リスト
- StreamCacheVGGT: Streaming Visual Geometry Transformers with Robust Scoring and Hybrid Cache Compression [39.0869112189715]
StreamCacheVGTは、キャッシュ管理を再定義するトレーニング不要のフレームワークである。
一定のコストの制約に厳格に固執しつつ、より優れた復元精度と長期安定を提供する。
論文 参考訳(メタデータ) (2026-04-16T17:12:10Z) - CodeComp: Structural KV Cache Compression for Agentic Coding [31.344543370007568]
既存の圧縮法はトークンの重要性を推定するために注意信号に依存している。
静的プログラム解析をLLM推論に組み込んだ,トレーニング不要なKVキャッシュ圧縮フレームワークであるCodeCompを提案する。
CodeCompは、同じメモリ予算の下で、アテンションのみの圧縮ベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2026-04-11T14:38:11Z) - Beyond Short-Horizon: VQ-Memory for Robust Long-Horizon Manipulation in Non-Markovian Simulation Benchmarks [96.60530830276281]
RuleSafeは、スケーラブルなLLM支援シミュレーションフレームワーク上に構築された、新しいオペレーティングベンチマークである。
VQ-Memoryはベクトル量子化変分オートエンコーダを用いたコンパクトで構造化された時間表現である。
論文 参考訳(メタデータ) (2026-03-10T11:13:54Z) - RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。
我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文 参考訳(メタデータ) (2026-01-30T08:29:01Z) - Gated Differentiable Working Memory for Long-Context Language Modeling [80.27483324685434]
本稿では,Gdwm(Gated Differentiable Working Memory)を提案する。
ZeroSCROLLS と LongBench v2 の実験では、Gdwm は均一なベースラインよりも 4$times$ の勾配ステップで同等または優れたパフォーマンスを達成している。
論文 参考訳(メタデータ) (2026-01-19T10:00:33Z) - Analyzing and Internalizing Complex Policy Documents for LLM Agents [53.14898416858099]
大規模言語モデル(LLM)ベースのエージェントシステムは、多様なビジネスルールをコードするコンテキスト内ポリシー文書に依存している。
これは、パフォーマンスを保ちながら、ポリシー文書をモデルプリエントに組み込む内部化手法の開発を動機付けます。
CC-Genは4つのレベルにまたがる制御可能な複雑度を持つエージェントベンチマークジェネレータである。
論文 参考訳(メタデータ) (2025-10-13T16:30:07Z) - UniGist: Towards General and Hardware-aligned Sequence-level Long Context Compression [86.33995240043936]
UniGistは、大規模言語モデルのためのシーケンスレベルのロングコンテキスト圧縮フレームワークである。
生のトークンを特別な圧縮トークン(gist)に微粒な方法で置き換えることで、コンテキスト情報を効率的に保存する。
提案手法は,圧縮トークンの実際の除去を可能にすることで,フレキシブルな推論もサポートしている。
論文 参考訳(メタデータ) (2025-09-19T08:47:37Z) - QuantSpec: Self-Speculative Decoding with Hierarchical Quantized KV Cache [67.84112700032007]
大きな言語モデル(LLM)は、長いコンテキスト設定のためにエッジデバイスにデプロイされることが増えている。
これらのシナリオでは、キーバリュー(KV)キャッシュがGPUメモリとレイテンシの両方において主要なボトルネックとなっている。
そこで本研究では,ターゲットモデルのアーキテクチャを共有するが,階層的な4ビット量子化KVキャッシュと4ビット量子化重みを併用して高速化を行う,新たな自己推論型デコーディングフレームワークであるQuantSpecを提案する。
論文 参考訳(メタデータ) (2025-02-05T20:43:48Z) - On the Efficacy of Eviction Policy for Key-Value Constrained Generative
Language Model Inference [40.789027180025286]
大規模言語モデル(LLM)は、リソース制約のある環境でのデプロイに特に費用がかかる。
本稿では,時間的注意スコアとロバストネス測定に基づく堅牢なキャッシュ省略ポリシーであるRoCoを紹介する。
ユーザフレンドリーなキー値制約付き生成推論専用の汎用ソフトウェアパッケージであるEasyKVをリリースする。
論文 参考訳(メタデータ) (2024-02-09T09:20:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。