論文の概要: Gradient-Based Mixed Planning with Discrete and Continuous Actions
- arxiv url: http://arxiv.org/abs/2110.10007v1
- Date: Tue, 19 Oct 2021 14:21:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-20 13:49:36.465021
- Title: Gradient-Based Mixed Planning with Discrete and Continuous Actions
- Title(参考訳): 離散的および連続的な行動を伴う勾配に基づく混合計画法
- Authors: Kebing Jin, Hankz Hankui Zhuo, Zhanhao Xiao, Hai Wan, Subbarao
Kambhampati
- Abstract要約: 本稿では,連続パラメータと候補計画の動作を同時に最適化する二次的枠組みを提案する。
フレームワークはモジュールと組み合わせて、緩和に基づいて初期状態から目標へ移行する最適な計画候補を推定する。
- 参考スコア(独自算出の注目度): 34.885999774739055
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Dealing with planning problems with both discrete logical relations and
continuous numeric changes in real-world dynamic environments is challenging.
Existing numeric planning systems for the problem often discretize numeric
variables or impose convex quadratic constraints on numeric variables, which
harms the performance when solving the problem. In this paper, we propose a
novel algorithm framework to solve the numeric planning problems mixed with
discrete and continuous actions based on gradient descent. We cast the numeric
planning with discrete and continuous actions as an optimization problem by
integrating a heuristic function based on discrete effects. Specifically, we
propose a gradient-based framework to simultaneously optimize continuous
parameters and actions of candidate plans. The framework is combined with a
heuristic module to estimate the best plan candidate to transit initial state
to the goal based on relaxation. We repeatedly update numeric parameters and
compute candidate plan until it converges to a valid plan to the planning
problem. In the empirical study, we exhibit that our algorithm framework is
both effective and efficient, especially when solving non-convex planning
problems.
- Abstract(参考訳): 実世界の動的環境における離散的論理関係と連続的な数値変化による計画問題に対処することは困難である。
この問題の既存の数値計画システムは、しばしば数値変数を離散化したり、数値変数に凸二次制約を課したりする。
本稿では,勾配降下に基づく離散的および連続的動作と混合する数値計画問題を解くための新しいアルゴリズムフレームワークを提案する。
離散効果に基づくヒューリスティック関数を統合することにより、離散的かつ連続的な行動を最適化問題とする数値計画を行った。
具体的には,連続パラメータと候補計画の動作を同時に最適化する勾配ベースフレームワークを提案する。
このフレームワークはヒューリスティックモジュールと組み合わせることで、リラクゼーションに基づいて初期状態を目標に移行するための最良のプラン候補を見積もる。
我々は,計画問題の有効な計画に収束するまで,数値パラメータと候補計画の繰り返し更新を行う。
実験では,特に非凸計画問題を解く場合,アルゴリズムフレームワークが効率的かつ効率的であることを示す。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Multi-Valued Partial Order Plans in Numeric Planning [14.290119665435121]
まずは、検索問題として制限タスクとして知られる数値計画問題を再構築することから始める。
次に、ブールアンを用いてNP完全計画の断片をいかに見つけられるかを示す。
これを実現するために、我々は、多値部分順序計画の考え方を発展させる。
論文 参考訳(メタデータ) (2023-07-27T07:24:30Z) - Numerical Methods for Convex Multistage Stochastic Optimization [86.45244607927732]
最適化プログラミング(SP)、最適制御(SOC)、決定プロセス(MDP)に焦点を当てる。
凸多段マルコフ問題の解決の最近の進歩は、動的プログラミング方程式のコスト対ゴー関数の切断面近似に基づいている。
切削平面型法は多段階問題を多段階的に扱えるが、状態(決定)変数は比較的少ない。
論文 参考訳(メタデータ) (2023-03-28T01:30:40Z) - Efficient Temporal Piecewise-Linear Numeric Planning with Lazy
Consistency Checking [4.834203844100679]
本稿では,プランナがLP整合性チェックを可能な限り遅延的に計算できる手法を提案する。
また,時間依存ゴールチェックをより選択的に行うアルゴリズムを提案する。
結果として得られるプランナーは、より効率的であるだけでなく、最先端の時間数値とハイブリッドプランナーよりも優れています。
論文 参考訳(メタデータ) (2021-05-21T07:36:54Z) - Multiple Plans are Better than One: Diverse Stochastic Planning [26.887796946596243]
計画上の問題では、望ましい仕様を完全にモデル化することはしばしば困難です。
特に、人間とロボットの相互作用において、そのような困難は、プライベートまたはモデルに複雑である人間の好みによって生じる可能性がある。
我々は、最適に近い代表行動の集合を生成することを目的とした、多種多様な計画と呼ばれる問題を定式化する。
論文 参考訳(メタデータ) (2020-12-31T07:29:11Z) - Consistent Second-Order Conic Integer Programming for Learning Bayesian
Networks [2.7473982588529653]
連続観測データからBNのスパースDAG構造を学習する問題について検討する。
この数学的プログラムの最適解は、ある条件下では望ましい統計的性質を持つことが知られている。
ほぼ最適解を得るために, 分岐・結合プロセスの終了に向け, 早期停止条件を提案する。
論文 参考訳(メタデータ) (2020-05-29T00:13:15Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。