論文の概要: Learning Top-k Subtask Planning Tree based on Discriminative
Representation Pre-training for Decision Making
- arxiv url: http://arxiv.org/abs/2312.11027v1
- Date: Mon, 18 Dec 2023 09:00:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-20 20:40:16.480010
- Title: Learning Top-k Subtask Planning Tree based on Discriminative
Representation Pre-training for Decision Making
- Title(参考訳): 決定のための識別表現事前学習に基づくトップkサブタスク計画木学習
- Authors: Jingqing Ruan, Kaishen Wang, Qingyang Zhang, Dengpeng Xing, Bo Xu
- Abstract要約: 複雑な現実世界のタスクから抽出された事前知識による計画は、人間が正確な決定を行うために不可欠である。
マルチエンコーダと個別予測器を導入し、簡単なサブタスクのための十分なデータからタスク固有表現を学習する。
また、注意機構を用いてトップkのサブタスク計画木を生成し、未確認タスクの複雑な決定を導くためにサブタスク実行計画をカスタマイズする。
- 参考スコア(独自算出の注目度): 9.980589742220587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many complicated real-world tasks can be broken down into smaller, more
manageable parts, and planning with prior knowledge extracted from these
simplified pieces is crucial for humans to make accurate decisions. However,
replicating this process remains a challenge for AI agents and naturally raises
two questions: How to extract discriminative knowledge representation from
priors? How to develop a rational plan to decompose complex problems? Most
existing representation learning methods employing a single encoder structure
are fragile and sensitive to complex and diverse dynamics. To address this
issue, we introduce a multiple-encoder and individual-predictor regime to learn
task-essential representations from sufficient data for simple subtasks.
Multiple encoders can extract adequate task-relevant dynamics without
confusion, and the shared predictor can discriminate the task characteristics.
We also use the attention mechanism to generate a top-k subtask planning tree,
which customizes subtask execution plans in guiding complex decisions on unseen
tasks. This process enables forward-looking and globality by flexibly adjusting
the depth and width of the planning tree. Empirical results on a challenging
platform composed of some basic simple tasks and combinatorially rich synthetic
tasks consistently outperform some competitive baselines and demonstrate the
benefits of our design.
- Abstract(参考訳): 複雑な現実世界のタスクの多くは、より小さく、より管理しやすい部分に分割される可能性がある。
しかし、このプロセスを複製することはAIエージェントにとって課題であり、自然に2つの疑問を提起する。
複雑な問題を分解する合理的プランを開発するには?
単一エンコーダ構造を用いた既存の表現学習手法の多くは脆弱で、複雑で多様な力学に敏感である。
この問題に対処するために,単純なサブタスクのための十分なデータからタスク必須表現を学ぶために,マルチエンコーダと個人予測レジームを導入する。
複数のエンコーダは混乱なく適切なタスク関連ダイナミクスを抽出でき、共有予測器はタスク特性を識別することができる。
また,注意機構を用いてトップkのサブタスクプランニングツリーを生成し,サブタスクの実行計画をカスタマイズし,未知のタスクの複雑な決定を導く。
このプロセスは、計画木の深さと幅を柔軟に調整し、前方視とグローバル性を実現する。
いくつかの基本的な単純なタスクと組合せ的にリッチな合成タスクからなる挑戦的なプラットフォームにおける実証的な結果は、競争力のあるベースラインを一貫して上回り、我々の設計の利点を実証する。
関連論文リスト
- Unlocking Reasoning Potential in Large Langauge Models by Scaling Code-form Planning [94.76546523689113]
CodePlanは、テキストコード形式の計画を生成し、追跡するフレームワークで、高いレベルの構造化された推論プロセスの概要を擬似コードで示します。
CodePlanは、洗練された推論タスク固有のリッチなセマンティクスと制御フローを効果的にキャプチャする。
反応を直接生成するのに比べて25.1%の相対的な改善が達成されている。
論文 参考訳(メタデータ) (2024-09-19T04:13:58Z) - Robot Task Planning Based on Large Language Model Representing Knowledge
with Directed Graph Structures [2.3698227130544547]
本研究では,人間の専門知識をLLMと組み合わせたタスクプランニング手法を提案し,LLMプロンプトテンプレートであるThink_Net_Promptを設計した。
さらに,タスクを段階的に分解し,タスクツリーを生成して各タスクの計画量を削減する手法を提案する。
論文 参考訳(メタデータ) (2023-06-08T13:10:00Z) - Generalization with Lossy Affordances: Leveraging Broad Offline Data for
Learning Visuomotor Tasks [65.23947618404046]
本研究では,広範囲なデータを用いたオフライン強化学習を通じて,時間的拡張タスクの目標条件付きポリシを取得するフレームワークを提案する。
新たなタスク目標に直面した場合、フレームワークは余裕モデルを使用して、元のタスクをより簡単な問題に分解するサブゴールとして、損失のある表現のシーケンスを計画する。
我々は,従来の作業からロボット体験の大規模データセットを事前学習し,手動の報酬工学を使わずに視覚入力から,新しいタスクを効率的に微調整できることを実証した。
論文 参考訳(メタデータ) (2022-10-12T21:46:38Z) - Decomposed Prompting: A Modular Approach for Solving Complex Tasks [55.42850359286304]
本稿では,より単純なサブタスクに分解することで,複雑なタスクを解くための分解プロンプトを提案する。
このモジュール構造は、各プロンプトを特定のサブタスクに最適化することを可能にする。
Decomposed Promptingの柔軟性とモジュラリティは、数発のプロンプトで先行作業より優れていることを示す。
論文 参考訳(メタデータ) (2022-10-05T17:28:20Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Learning Abstract and Transferable Representations for Planning [25.63560394067908]
本稿では,エージェントの環境状態の抽象化を自律的に学習するフレームワークを提案する。
これらの抽象化はタスクに依存しないので、新しいタスクを解決するために再利用することができる。
本稿では,これらの可搬型表現と問題固有の表現を組み合わせて,特定のタスクの音響記述を生成する方法について述べる。
論文 参考訳(メタデータ) (2022-05-04T14:40:04Z) - Multi-Task Learning with Sequence-Conditioned Transporter Networks [67.57293592529517]
シーケンスコンディショニングと重み付きサンプリングのレンズによるマルチタスク学習の実現を目指している。
合成タスクを対象とした新しいベンチマークであるMultiRavensを提案する。
次に,視覚に基づくエンドツーエンドシステムアーキテクチャであるSequence-Conditioned Transporter Networksを提案する。
論文 参考訳(メタデータ) (2021-09-15T21:19:11Z) - CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and
Transfer Learning [138.40338621974954]
CausalWorldは、ロボット操作環境における因果構造と伝達学習のベンチマークである。
タスクは、ブロックのセットから3D形状を構築することで構成される。
論文 参考訳(メタデータ) (2020-10-08T23:01:13Z) - Resource-rational Task Decomposition to Minimize Planning Costs [10.178049366671505]
人々はしばしば階層的に計画する。つまり、タスクのモノリシックな表現を計画するのではなく、タスクを単純なサブタスクに分解し、それを達成する計画を立てる。
本稿では,環境の構造や計画アルゴリズムを考慮し,限られた認知資源の効率的な活用を容易にする方法でタスクを分解することを提案する。
我々の説明では、サブタスクの特定方法の規範的な説明に加えて、リソース・レーショナルな表現を用いて、人々がどのように推論し、計画し、行動するかを研究するための枠組みも提供しています。
論文 参考訳(メタデータ) (2020-07-27T20:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。