論文の概要: TeNet: Text-to-Network for Compact Policy Synthesis
- arxiv url: http://arxiv.org/abs/2601.15912v1
- Date: Thu, 22 Jan 2026 12:42:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.600058
- Title: TeNet: Text-to-Network for Compact Policy Synthesis
- Title(参考訳): TeNet: コンパクトポリシー合成のためのテキスト・ツー・ネットワーク
- Authors: Ariyan Bighashdel, Kevin Sebastian Luck,
- Abstract要約: TeNetは、自然言語記述から直接、コンパクトでタスク固有のロボットポリシーをインスタンス化するフレームワークである。
我々はTeNetがシーケンスベースのベースラインよりも桁違いに小さいポリシーを生成することを示す。
- 参考スコア(独自算出の注目度): 4.562874561676235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robots that follow natural-language instructions often either plan at a high level using hand-designed interfaces or rely on large end-to-end models that are difficult to deploy for real-time control. We propose TeNet (Text-to-Network), a framework for instantiating compact, task-specific robot policies directly from natural language descriptions. TeNet conditions a hypernetwork on text embeddings produced by a pretrained large language model (LLM) to generate a fully executable policy, which then operates solely on low-dimensional state inputs at high control frequencies. By using the language only once at the policy instantiation time, TeNet inherits the general knowledge and paraphrasing robustness of pretrained LLMs while remaining lightweight and efficient at execution time. To improve generalization, we optionally ground language in behavior during training by aligning text embeddings with demonstrated actions, while requiring no demonstrations at inference time. Experiments on MuJoCo and Meta-World benchmarks show that TeNet produces policies that are orders of magnitude smaller than sequence-based baselines, while achieving strong performance in both multi-task and meta-learning settings and supporting high-frequency control. These results show that text-conditioned hypernetworks offer a practical way to build compact, language-driven controllers for ressource-constrained robot control tasks with real-time requirements.
- Abstract(参考訳): 自然言語の指示に従うロボットは、手書きのインターフェイスを使って高レベルに計画するか、あるいはリアルタイム制御のためにデプロイするのが難しい大規模なエンドツーエンドモデルに依存していることが多い。
自然言語記述から直接,タスク固有のロボットポリシーをインスタンス化するためのフレームワークであるTeNet(Text-to-Network)を提案する。
TeNetは、事前訓練された大言語モデル(LLM)によって生成されたテキスト埋め込みにハイパーネットワークを条件付け、完全に実行可能なポリシーを生成し、高い制御周波数で低次元の状態入力のみを実行する。
ポリシーのインスタンス化時にのみ言語を使用することで、TeNetは、実行時に軽量で効率的なまま、事前訓練されたLLMの一般的な知識を継承し、堅牢性を記述する。
一般化を改善するために,テキスト埋め込みと実演動作を整列させて,推論時の実演を不要にすることで,学習中の動作の言語を任意に基礎づける。
MuJoCoとMeta-Worldベンチマークの実験では、TeNetはシーケンスベースのベースラインよりも桁違いに小さいポリシーを生成し、マルチタスクとメタ学習の両方で強力なパフォーマンスを実現し、高周波制御をサポートする。
これらの結果から,テキストコンディショナブルなハイパーネットワークは,リアルタイムに制約されたロボット制御タスクを実現するための,コンパクトな言語駆動型コントローラを構築するための実用的な方法であることがわかった。
関連論文リスト
- Rethinking Testing for LLM Applications: Characteristics, Challenges, and a Lightweight Interaction Protocol [83.83217247686402]
大言語モデル(LLM)は、単純なテキストジェネレータから、検索強化、ツール呼び出し、マルチターンインタラクションを統合する複雑なソフトウェアシステムへと進化してきた。
その固有の非決定主義、ダイナミズム、文脈依存は品質保証に根本的な課題をもたらす。
本稿では,LLMアプリケーションを3層アーキテクチャに分解する: textbftextitSystem Shell Layer, textbftextitPrompt Orchestration Layer, textbftextitLLM Inference Core。
論文 参考訳(メタデータ) (2025-08-28T13:00:28Z) - Text-to-Decision Agent: Offline Meta-Reinforcement Learning from Natural Language Supervision [36.643102023506614]
オフラインメタRLは通常、高品質なサンプルやウォームアップ探索からタスク信念を推測することで一般化に取り組む。
textbfText-to-textbfDecision textbfAgent (textbfT2DA)を提案する。
論文 参考訳(メタデータ) (2025-04-21T12:00:20Z) - The Synergy of LLMs & RL Unlocks Offline Learning of Generalizable Language-Conditioned Policies with Low-fidelity Data [50.544186914115045]
TEDUOは、シンボリック環境におけるオフライン言語条件のポリシー学習のための、新しいトレーニングパイプラインである。
まず、オフラインデータセットをよりリッチなアノテーションで拡張する自動化ツールとして、次に、一般化可能な命令フォローエージェントとして使用します。
論文 参考訳(メタデータ) (2024-12-09T18:43:56Z) - From LLMs to Actions: Latent Codes as Bridges in Hierarchical Robot Control [58.72492647570062]
我々は,制限を克服する代替アーキテクチャとして,Learningable Latent Codes as Bridges (LCB)を導入した。
methodoutperforms baselines that leverage pure language as the interface layer on tasks that requires reasoning and multi-step behaviors。
論文 参考訳(メタデータ) (2024-05-08T04:14:06Z) - Natural Language as Policies: Reasoning for Coordinate-Level Embodied Control with LLMs [7.746160514029531]
ロボットのタスク計画問題に対処するLLMによる実験結果を示す。
提案手法はタスクとシーンオブジェクトのテキスト記述を取得し,自然言語推論によるタスクプランニングを定式化する。
提案手法はマルチモーダル・プロンプト・シミュレーション・ベンチマークを用いて評価する。
論文 参考訳(メタデータ) (2024-03-20T17:58:12Z) - Enhancing Network Management Using Code Generated by Large Language
Models [15.557254786007325]
本稿では,大規模言語モデル(LLM)を用いて自然言語クエリからタスク固有コードを生成することにより,自然言語ベースのネットワーク管理エクスペリエンスを促進する新しいアプローチを提案する。
この方法は、ネットワークオペレーターが生成されたコードを検査できるようにすることで、説明可能性、スケーラビリティ、プライバシの課題に取り組む。
ベンチマークアプリケーションを用いてプロトタイプシステムを設計,評価し,高い精度,コスト効率,さらなる拡張の可能性を示す。
論文 参考訳(メタデータ) (2023-08-11T17:49:15Z) - ProgPrompt: Generating Situated Robot Task Plans using Large Language
Models [68.57918965060787]
大規模言語モデル(LLM)は、タスク計画中の潜在的な次のアクションを評価するために使用することができる。
本稿では, プログラム型LCMプロンプト構造を用いて, 配置環境間での計画生成機能を実現する。
論文 参考訳(メタデータ) (2022-09-22T20:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。