論文の概要: Planning with Submodular Objective Functions
- arxiv url: http://arxiv.org/abs/2010.11863v1
- Date: Thu, 22 Oct 2020 16:55:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 05:20:49.366014
- Title: Planning with Submodular Objective Functions
- Title(参考訳): 部分モジュラー目的関数による計画
- Authors: Ruosong Wang, Hanrui Zhang, Devendra Singh Chaplot, Denis Garagi\'c,
Ruslan Salakhutdinov
- Abstract要約: 準モジュラー目的関数を用いて計画を行い、累積報酬を最大化する代わりに、劣モジュラー関数によって誘導される値の最大化を目標とする。
本フレームワークは, 基本性制約を特別な場合として, 標準計画と準モジュラー目標を仮定する。
- 参考スコア(独自算出の注目度): 118.0376288522372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study planning with submodular objective functions, where instead of
maximizing the cumulative reward, the goal is to maximize the objective value
induced by a submodular function. Our framework subsumes standard planning and
submodular maximization with cardinality constraints as special cases, and thus
many practical applications can be naturally formulated within our framework.
Based on the notion of multilinear extension, we propose a novel and
theoretically principled algorithmic framework for planning with submodular
objective functions, which recovers classical algorithms when applied to the
two special cases mentioned above. Empirically, our approach significantly
outperforms baseline algorithms on synthetic environments and navigation tasks.
- Abstract(参考訳): 本研究の目的は, 累積報酬を最大化する代わりに, サブモジュラー関数によって誘導される目標値を最大化することである。
本フレームワークは, 基準制約を特別な場合として, 標準計画と部分モジュラー最大化を仮定するので, 本フレームワーク内で多くの実用的応用を自然に定式化することができる。
マルチリニア拡張の概念に基づき,上述の2つの特別な場合に適用した場合に古典的アルゴリズムを復元する部分モジュラー目的関数を用いた計画のための,新規かつ理論的に原理化されたアルゴリズムフレームワークを提案する。
提案手法は, 合成環境やナビゲーションタスクにおいて, ベースラインアルゴリズムを著しく上回っている。
関連論文リスト
- Submodular Framework for Structured-Sparse Optimal Transport [7.030105924295838]
非平衡最適輸送(UOT)は、非正規化対策の柔軟な枠組みとロバスト性により、近年注目を集めている。
本研究では,UOT設定における疎輸送計画の学習(構造化)について検討する。
本稿では,最近検討された平均誤差に基づく UOT を用いた新しい空間制約付き UOT の定式化を提案する。
論文 参考訳(メタデータ) (2024-06-07T13:11:04Z) - Data Summarization beyond Monotonicity: Non-monotone Two-Stage
Submodular Maximization [11.296845424426062]
2段階の準モジュラー問題の目的は、サブモジュラーである与えられた訓練関数を用いて、基底集合を減少させることである。
この問題は、データの要約を含む様々な領域に応用されている。
論文 参考訳(メタデータ) (2023-09-11T01:00:10Z) - Reinforcement Learning with Non-Cumulative Objective [12.906500431427716]
強化学習では、その目的は、ほぼ常にプロセスに沿った報酬に対する累積関数として定義される。
本稿では,そのような目的を最適化するための既存アルゴリズムの修正を提案する。
論文 参考訳(メタデータ) (2023-07-11T01:20:09Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Group Equality in Adaptive Submodular Maximization [13.619980548779687]
非適応的条件と適応的条件の両方で群等式制約を受ける古典的部分モジュラー問題について検討する。
この問題に対する最初の定数近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-07-07T15:12:02Z) - srMO-BO-3GP: A sequential regularized multi-objective constrained
Bayesian optimization for design applications [7.571408082650611]
逐次設定でMO最適化問題を解くために, srMO-BO-3GP と呼ばれる新しい多目的拡張(MO)を提案する。
提案手法は,いくつかの数値ベンチマーク関数と,フリップチップパッケージ設計のための熱力学的有限要素モデルを用いて実証される。
論文 参考訳(メタデータ) (2020-07-07T14:40:00Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z) - Continuous Submodular Function Maximization [91.17492610120324]
連続部分モジュラリティ (continuous submodularity) は、幅広い応用を持つ関数のクラスである。
連続的な部分モジュラ最適化の応用は、影響、推論のMAP、フィールドへの推論など多岐にわたる。
論文 参考訳(メタデータ) (2020-06-24T04:37:31Z) - On the Global Optimality of Model-Agnostic Meta-Learning [133.16370011229776]
モデル・ア・メタラーニング(MAML)は、メタラーニングを二段階最適化問題として定式化し、内部レベルが各サブタスクを、共有された事前に基づいて解決する。
学習と教師あり学習の両方においてMAMLが達成した定常点の最適性を特徴付ける。
論文 参考訳(メタデータ) (2020-06-23T17:33:14Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。