論文の概要: Hierarchical Prompt-Domain Control and Learning for Resource-Constrained Agentic Language Models
- arxiv url: http://arxiv.org/abs/2605.27703v1
- Date: Tue, 26 May 2026 21:23:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.531213
- Title: Hierarchical Prompt-Domain Control and Learning for Resource-Constrained Agentic Language Models
- Title(参考訳): 資源制約されたエージェント言語モデルのための階層型プロンプトドメイン制御と学習
- Authors: Joan Vendrell Gallart, Russell Bent, Michael Grosskopf,
- Abstract要約: 大規模言語モデルはエージェントシステム内にますます展開されている。
本稿では,要求された出力スキーマを学習するために,まず,コンパクトなモデルを蒸留する階層的な制御・学習フレームワークを提案する。
非階層的,蒸留専用,非蒸留ベースラインに対する信頼性とコスト効率の向上を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large Language Models are increasingly deployed inside agentic systems, where they must follow structured protocols, adapt to evolving states, and operate under memory, latency, and cost constraints. In such regimes, prompt extension is unreliable: growing contexts can push compact models outside their effective prompt domain, while deployment-time fine-tuning remains limited by scarce data and compute. We propose a hierarchical control-and-learning framework in which a compact model is first distilled to learn the required output schema, then supervised online by an oracle-controller loop. The controller monitors protocol validity and semantic performance, projects accumulated histories into a feasible prompt domain, and triggers lightweight oracle-supervised fine-tuning under drift. This separates schema learning for communication compatibility from semantic adaptation for task-level correction. We formalize prompt-domain feasibility and attention-induced saturation, motivating control of the effective prompt state rather than reliance on nominal context length. Using Multi-Fidelity Bayesian Optimization as a controlled sequential testbed, we characterize a core deployment failure mode and show improved reliability and cost-efficiency over non-hierarchical, distillation-only, and non-distilled baselines.
- Abstract(参考訳): 大規模言語モデルはエージェントシステム内にますます展開され、構造化されたプロトコルに従い、進化する状態に適応し、メモリ、レイテンシ、コスト制約の下で運用する必要がある。
このような状況下では、プロンプト拡張は信頼できない: 成長するコンテキストは、効率的なプロンプトドメインの外でコンパクトなモデルをプッシュすることができる。
本稿では,まずコンパクトなモデルを蒸留し,必要な出力スキーマを学習し,オーラクル・コントローラ・ループでオンラインで管理する階層型制御学習フレームワークを提案する。
コントローラはプロトコルの有効性とセマンティックパフォーマンスを監視し、プロジェクトは履歴を実行可能なプロンプトドメインに蓄積し、ドリフト下で軽量なオラクルによる微調整をトリガーする。
これは、コミュニケーション互換性のためのスキーマ学習と、タスクレベルの修正のためのセマンティック適応を分離する。
本稿では,アクシデント・ドメインの実現可能性と注意喚起による飽和を形式化し,コンテキスト長に依存するのではなく,効果的なプロンプト状態の制御を動機づける。
制御された逐次テストベッドとしてMulti-Fidelity Bayesian Optimizationを用いて、コアデプロイメント障害モードを特徴付けるとともに、非階層的、蒸留専用、非蒸留ベースラインに対する信頼性とコスト効率の向上を示す。
関連論文リスト
- A Systematic Post-Train Framework for Video Generation [76.26555417456773]
大規模ビデオ拡散モデルでは、高解像度でセマンティックにリッチなコンテンツを生成できることが顕著に示されている。
迅速な感度、時間的不整合、禁止的推論コストといった重要な問題のために、事前訓練されたパフォーマンスと実際のデプロイメント要件の間には、大きなギャップが残っている。
本研究では,事前学習されたモデルとユーザの意図を4つの相乗的段階を通して体系的に整合させる総合的なポストトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-28T09:34:51Z) - Gated Condition Injection without Multimodal Attention: Towards Controllable Linear-Attention Transformers [69.60693631859411]
本稿では,線形アテンションアーキテクチャ上に構築された制御可能な拡散モデルについて検討する。
本稿では,SANA などのリニアアテンションバックボーンに適した新しい制御可能な拡散フレームワークを提案する。
提案手法は,線形アテンションモデルに基づく最先端の制御可能な生成性能を実現する。
論文 参考訳(メタデータ) (2026-03-29T12:31:34Z) - RuntimeSlicer: Towards Generalizable Unified Runtime State Representation for Failure Management [23.96013849484881]
メトリクス、トレース、ログは、システム実行時の振る舞いを補完するビューを提供する。
Slicerは、メトリクス、トレース、ログを1つの整列したシステム状態の埋め込みにエンコードするタスクに依存しない表現モデルを事前トレーニングする。
State-Aware Task-Oriented Tuningは、ランタイム状態の教師なしパーティショニングを実行し、ダウンストリームタスクに対する状態条件適応を可能にする。
論文 参考訳(メタデータ) (2026-03-23T02:35:13Z) - Embodied Foundation Models at the Edge: A Survey of Deployment Constraints and Mitigation Strategies [3.4385853021313593]
Deployment Gauntletは制約を8つの結合バリアにまとめる。
信頼性の高いデプロイメントは、メモリ、スケジューリング、通信、モデルアーキテクチャ間のシステムレベルの共同設計に依存します。
論文 参考訳(メタデータ) (2026-03-16T21:27:03Z) - Adaptive RAN Slicing Control via Reward-Free Self-Finetuning Agents [26.34195733862222]
本稿では,エージェントシステムが環境との直接対話を通じて継続的に学習することを可能にする,新たな自己ファインタニングフレームワークを提案する。
本フレームワークは,対話履歴から好みのデータセットを構築するために,自律的な言語フィードバックを生成するバイパースペクティブ・リフレクション機構を実装している。
その後の嗜好に基づく微調整プロセスは、長い水平体験をモデルのパラメータに蒸留する。
実験結果から,我々のフレームワークは,サンプル効率,安定性,マルチメトリック最適化において,標準強化学習(RL)ベースラインと既存のLarge Language Model(LLM)ベースエージェントよりも優れていた。
論文 参考訳(メタデータ) (2026-03-11T09:14:56Z) - ScaleWeaver: Weaving Efficient Controllable T2I Generation with Multi-Scale Reference Attention [86.93601565563954]
ScaleWeaverは、高度な視覚的自己回帰(VAR)モデルに基づいて、高忠実で制御可能な生成を実現するために設計されたフレームワークである。
提案された参照注意モジュールは image$rightarrow$condition から不要な注意を排除し、計算コストを削減している。
実験によると、ScaleWeaverは、拡散ベースの方法よりも優れた効率を実現しつつ、高品質な生成と正確な制御を提供する。
論文 参考訳(メタデータ) (2025-10-16T17:00:59Z) - The Gatekeeper Knows Enough [0.0]
Gatekeeper Protocolは、エージェント・システム間のインタラクションを管理するドメインに依存しないフレームワークである。
提案手法は,エージェントの信頼性を著しく向上し,トークン消費を最小化することで計算効率を向上し,複雑なシステムとのスケーラブルな相互作用を可能にする。
論文 参考訳(メタデータ) (2025-10-16T17:00:42Z) - Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z) - PowerGrow: Feasible Co-Growth of Structures and Dynamics for Power Grid Synthesis [75.14189839277928]
本稿では,運用効率を維持しながら計算オーバーヘッドを大幅に削減する,共同生成フレームワークPowerGrowを提案する。
ベンチマーク設定による実験では、PowerGrowはフィデリティと多様性において、事前の拡散モデルよりも優れていた。
これは、運用上有効で現実的な電力グリッドシナリオを生成する能力を示している。
論文 参考訳(メタデータ) (2025-08-29T01:47:27Z) - Lightweight Task-Oriented Semantic Communication Empowered by Large-Scale AI Models [66.57755931421285]
大規模人工知能(LAI)モデルは、リアルタイム通信シナリオにおいて重大な課題を提起する。
本稿では,LAIモデルから知識を抽出・凝縮するために知識蒸留(KD)技術を活用することを提案する。
本稿では,反復推論の必要性を排除したプレストア圧縮機構を備えた高速蒸留法を提案する。
論文 参考訳(メタデータ) (2025-06-16T08:42:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。