論文の概要: Bilevel Planning with Learned Symbolic Abstractions from Interaction Data
- arxiv url: http://arxiv.org/abs/2603.08599v1
- Date: Mon, 09 Mar 2026 16:47:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.116002
- Title: Bilevel Planning with Learned Symbolic Abstractions from Interaction Data
- Title(参考訳): 相互作用データから学習した記号的抽象化による二段階計画
- Authors: Fatih Dogangun, Burcu Kilic, Serdar Bahar, Emre Ugur,
- Abstract要約: 本稿では,学習した確率的シンボリックルールが候補計画を生成する,二段階のニューロシンボリック・フレームワークを提案する。
多目的操作タスクの実験は、提案手法がシンボルのみの手法より優れていることを示す。
- 参考スコア(独自算出の注目度): 1.5772749239784327
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Intelligent agents must reason over both continuous dynamics and discrete representations to generate effective plans in complex environments. Previous studies have shown that symbolic abstractions can emerge from neural effect predictors trained with a robot's unsupervised exploration. However, these methods rely on deterministic symbolic domains, lack mechanisms to verify the generated symbolic plans, and operate only at the abstract level, often failing to capture the continuous dynamics of the environment. To overcome these limitations, we propose a bilevel neuro-symbolic framework in which learned probabilistic symbolic rules generate candidate plans rapidly at the high level, and learned continuous effect models verify these plans and perform forward search when necessary at the low level. Our experiments on multi-object manipulation tasks demonstrate that the proposed bilevel method outperforms symbolic-only approaches, reliably identifying failing plans through verification, and achieves planning performance statistically comparable to continuous forward search while resolving most problems via efficient symbolic reasoning.
- Abstract(参考訳): インテリジェントエージェントは、複雑な環境で効果的な計画を生成するために、連続力学と離散表現の両方を推論しなければならない。
これまでの研究では、ロボットの教師なし探索で訓練された神経効果予測器から象徴的な抽象化が生まれることが示されている。
しかし、これらの手法は決定論的シンボリックドメインに依存しており、生成されたシンボリックプランを検証するメカニズムが欠如しており、抽象レベルでのみ動作し、しばしば環境の連続的なダイナミクスを捉えることに失敗する。
これらの制約を克服するために、学習された確率的シンボル規則がハイレベルで急速に候補計画を生成する二段階のニューロシンボリック・フレームワークを提案し、学習された連続効果モデルがこれらの計画を検証し、低レベルで必要であれば前方探索を行う。
提案手法は,提案手法がシンボルのみの手法よりも優れており,検証によって失敗する計画を確実に識別し,効率的なシンボル推論によってほとんどの問題を解きながら,連続的な前方探索に匹敵する統計的に計画性能を達成することを示す。
関連論文リスト
- Discrete JEPA: Learning Discrete Token Representations without Reconstruction [23.6286989806018]
認知知性の象徴的な基礎は、観測から隠れたパターンを抽出することにある。
本稿では,意味的トークン化による潜在予測符号化フレームワークであるDisdisrete-JEPAを提案する。
我々のアプローチは、人工知能システムにおける世界モデリングと計画能力の進歩に大きな影響を与えることを約束する。
論文 参考訳(メタデータ) (2025-06-17T10:15:17Z) - Exploiting Symbolic Heuristics for the Synthesis of Domain-Specific Temporal Planning Guidance using Reinforcement Learning [51.54559117314768]
最近の研究は、時間プランナーの性能向上のためのガイダンスの合成に強化学習(Reinforcement Learning, RL)を用いることを検討した。
本稿では,RLと計画段階の両方において,シンボリックスが提供した情報を活用することに焦点を当てた学習計画フレームワークの進化を提案する。
論文 参考訳(メタデータ) (2025-05-19T17:19:13Z) - Hierarchical Neuro-Symbolic Decision Transformer [6.4149117677272525]
本稿では,古典的シンボリックプランナーとトランスフォーマーベースのポリシーを密結合した階層型ニューロシンボリックコントロールフレームワークを提案する。
高いレベルでは、プランナーは、タスク制約との論理的一貫性を保証する演算子の解釈可能なシーケンスを組み立てる。
低レベルでは、各オペレータは、決定変換器にきめ細かいアクションを生成するように要求するサブゴールトークンとして描画される。
論文 参考訳(メタデータ) (2025-03-10T10:22:13Z) - VisualPredicator: Learning Abstract World Models with Neuro-Symbolic Predicates for Robot Planning [86.59849798539312]
本稿では,記号的・神経的知識表現の強みを組み合わせた一階抽象言語Neuro-Symbolic Predicatesを提案する。
提案手法は, サンプルの複雑さの向上, 分布外一般化の強化, 解釈可能性の向上を実現する。
論文 参考訳(メタデータ) (2024-10-30T16:11:05Z) - Unified Task and Motion Planning using Object-centric Abstractions of
Motion Constraints [56.283944756315066]
本稿では,タスクとモーションプランニングを一つの検索に統一するTAMP手法を提案する。
我々のアプローチは、オフザシェルフAIサーチの計算効率を活用して、物理的に実現可能な計画が得られるような、オブジェクト中心の動作制約の抽象化に基づいている。
論文 参考訳(メタデータ) (2023-12-29T14:00:20Z) - Hierarchical Imitation Learning with Vector Quantized Models [77.67190661002691]
我々は,専門家の軌跡におけるサブゴールの同定に強化学習を用いることを提案する。
同定されたサブゴールに対するベクトル量子化生成モデルを構築し,サブゴールレベルの計画を行う。
実験では、このアルゴリズムは複雑な長い水平決定問題の解法に優れ、最先端のアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2023-01-30T15:04:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。