論文の概要: Neuro-Symbolic Learning for Long-Horizon Task Planning Under Complex Logical Constraints
- arxiv url: http://arxiv.org/abs/2606.06877v1
- Date: Fri, 05 Jun 2026 03:44:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.550906
- Title: Neuro-Symbolic Learning for Long-Horizon Task Planning Under Complex Logical Constraints
- Title(参考訳): 複雑な論理的制約下での長期タスク計画のためのニューロ・シンボリック学習
- Authors: Qiwei Du, Zitong Zhan, Shaoshu Su, Bowen Li, Yi Du, Zhipeng Zhao, Taimeng Fu, Sebastian Scherer, Jiaoyang Li, Chen Wang,
- Abstract要約: 最近のニューロシンボリックな手法は、課題非関連オブジェクトに対する対象重要度スコアを学習することで、計画効率を向上させる。
並列リカバリ,再スタート,ロールバックを用いて,上位レベルの学習に信頼性と適応的なフィードバックを提供する3R戦略を低レベル計画に導入する。
3つの挑戦的なベンチマークの実験では、失敗率80.04%、計画時間57.14%の削減など、最先端のパフォーマンスが示されている。
- 参考スコア(独自算出の注目度): 12.864903019173106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Task planning often suffers from severe efficiency bottlenecks when robots must reason over long-horizon action sequences under complex logical constraints, including object affordances, spatial relationships, and sequential action dependencies. Recent neuro-symbolic methods improve planning efficiency by learning object-importance scores to prune task-irrelevant objects, but they typically rely on fixed offline supervision generated from full search spaces. This creates a train-test mismatch: at deployment, the planner operates in pruned search spaces induced by the model's own imperfect predictions, leading to exposure bias and degraded planning performance. To address this challenge, we formulate object-importance learning for task planning as an imperative learning-based bilevel optimization problem. The upper level optimizes a neural scorer, while the lower level solves a symbolic planning problem in the score-pruned search space. To stabilize this learning process, we introduce a 3R strategy into the lower-level planning, using parallel Repair, Restart, and Rollback recovery to provide reliable and adaptive feedback for upper-level learning. Experiments on three challenging benchmarks demonstrate state-of-the-art performance, including an 80.04% reduction in failure rate and a 57.14% reduction in planning time. We further validate the framework on a quadruped-based mobile manipulator in simulation and the real world, demonstrating its potential for efficient and deployable neuro-symbolic task planning.
- Abstract(参考訳): タスクプランニングは、オブジェクトの空き時間、空間的関係、シーケンシャルなアクション依存を含む複雑な論理的制約の下で、ロボットが長い水平アクションシーケンスを推論しなければならない場合、深刻な効率のボトルネックに悩まされることが多い。
近年のニューロシンボリックな手法は、タスク非関連オブジェクトに対して、オブジェクト重要度スコアを学習することで計画効率を向上させるが、それらは通常、完全な検索空間から生成される固定されたオフライン監視に依存している。
デプロイ時に、プランナーはモデル自身の不完全な予測によって誘導されるプルーニングされた検索スペースで動作し、露出バイアスと計画性能が低下する。
この課題に対処するために,課題計画のためのオブジェクト指向学習を命令型学習に基づく二段階最適化問題として定式化する。
上位レベルはニューラルスコアラを最適化し、下位レベルはスコア処理された検索空間におけるシンボリックプランニング問題を解く。
この学習プロセスを安定させるために,並列修復,再スタート,ロールバックによる3R戦略を導入し,高次学習に信頼性と適応的なフィードバックを提供する。
3つの挑戦的なベンチマークの実験では、失敗率80.04%、計画時間57.14%の削減など、最先端のパフォーマンスが示されている。
さらに、シミュレーションと実世界における四足歩行型移動マニピュレータの枠組みを検証し、効率よく展開可能なニューロシンボリックタスクプランニングの可能性を示す。
関連論文リスト
- Navigating the Clutter: Waypoint-Based Bi-Level Planning for Multi-Robot Systems [54.887871365121775]
乱雑な環境におけるマルチロボット制御は、複雑な物理的制約を伴う難しい問題である。
タスクとモーションプランニングを協調的に最適化するハイブリッドマルチロボット制御フレームワークを提案する。
我々のアプローチは、動作に依存しないベースラインとVLAベースのベースラインよりもタスクの成功を継続的に改善する。
論文 参考訳(メタデータ) (2026-04-22T22:58:47Z) - Bilevel Planning with Learned Symbolic Abstractions from Interaction Data [1.5772749239784327]
本稿では,学習した確率的シンボリックルールが候補計画を生成する,二段階のニューロシンボリック・フレームワークを提案する。
多目的操作タスクの実験は、提案手法がシンボルのみの手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-03-09T16:47:03Z) - Exploiting Symbolic Heuristics for the Synthesis of Domain-Specific Temporal Planning Guidance using Reinforcement Learning [51.54559117314768]
最近の研究は、時間プランナーの性能向上のためのガイダンスの合成に強化学習(Reinforcement Learning, RL)を用いることを検討した。
本稿では,RLと計画段階の両方において,シンボリックスが提供した情報を活用することに焦点を当てた学習計画フレームワークの進化を提案する。
論文 参考訳(メタデータ) (2025-05-19T17:19:13Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - A Framework for Neurosymbolic Robot Action Planning using Large Language Models [3.0501524254444767]
本稿では,象徴的タスク計画と機械学習アプローチのギャップを埋めることを目的としたフレームワークを提案する。
大規模言語モデル(LLM)を計画ドメイン定義言語(PDDL)と互換性のあるニューロシンボリックタスクプランナーに訓練する根拠
選択されたドメインにおける予備的な結果から, (i) テストデータセットの95.5%の問題を1,000個のサンプルで解決し, (ii) 従来のシンボルプランナーよりも最大13.5%短いプランを作成し, (iii) 計画の可利用性の平均待ち時間を61.4%まで削減する。
論文 参考訳(メタデータ) (2023-03-01T11:54:22Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z) - Sequence-Based Plan Feasibility Prediction for Efficient Task and Motion
Planning [36.300564378022315]
本稿では,移動環境における移動操作問題を解決するための学習可能なタスク・アンド・モーション・プランニング(TAMP)アルゴリズムを提案する。
本アルゴリズムのコアは,タスク計画,目標,初期状態を考慮したトランスフォーマーに基づく新しい学習手法であるPIGINetであり,タスク計画に関連する運動軌跡の発見確率を予測する。
論文 参考訳(メタデータ) (2022-11-03T04:12:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。