論文の概要: Learning Heuristic Selection with Dynamic Algorithm Configuration
- arxiv url: http://arxiv.org/abs/2006.08246v3
- Date: Mon, 12 Apr 2021 14:32:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-21 02:39:13.788860
- Title: Learning Heuristic Selection with Dynamic Algorithm Configuration
- Title(参考訳): 動的アルゴリズム構成による学習ヒューリスティック選択
- Authors: David Speck, Andr\'e Biedenkapp, Frank Hutter, Robert Mattm\"uller,
Marius Lindauer
- Abstract要約: 計画システムの動的選択力学に動的アルゴリズム構成を用いることができることを示す。
提案手法は,既存のアプローチよりも一般化し,ドメイン探索の性能を指数関数的に向上させることができることを示す。
- 参考スコア(独自算出の注目度): 44.91083687014879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A key challenge in satisficing planning is to use multiple heuristics within
one heuristic search. An aggregation of multiple heuristic estimates, for
example by taking the maximum, has the disadvantage that bad estimates of a
single heuristic can negatively affect the whole search. Since the performance
of a heuristic varies from instance to instance, approaches such as algorithm
selection can be successfully applied. In addition, alternating between
multiple heuristics during the search makes it possible to use all heuristics
equally and improve performance. However, all these approaches ignore the
internal search dynamics of a planning system, which can help to select the
most useful heuristics for the current expansion step. We show that dynamic
algorithm configuration can be used for dynamic heuristic selection which takes
into account the internal search dynamics of a planning system. Furthermore, we
prove that this approach generalizes over existing approaches and that it can
exponentially improve the performance of the heuristic search. To learn dynamic
heuristic selection, we propose an approach based on reinforcement learning and
show empirically that domain-wise learned policies, which take the internal
search dynamics of a planning system into account, can exceed existing
approaches.
- Abstract(参考訳): 計画に満足する上で重要な課題は、複数のヒューリスティックを1つのヒューリスティック検索で使うことである。
複数のヒューリスティック推定の集約は、例えば最大値を取ることで、単一のヒューリスティックの悪い推定が全体の探索に悪影響を及ぼすという欠点がある。
ヒューリスティックのパフォーマンスは例によって異なるため、アルゴリズムの選択のようなアプローチをうまく適用することができる。
さらに、探索中に複数のヒューリスティックを交互に組み合わせることで、全てのヒューリスティックを等しく使い、性能を向上させることができる。
しかし、これらすべてのアプローチは、現在の拡張ステップにおいて最も有用なヒューリスティックを選択するのに役立つ計画システムの内部探索力学を無視する。
本研究では,計画システムの内部探索力学を考慮した動的ヒューリスティック選択に動的アルゴリズム構成を用いることができることを示す。
さらに,このアプローチが既存のアプローチを一般化し,ヒューリスティック検索の性能を指数関数的に向上できることを示す。
動的ヒューリスティック選択を学習するために,強化学習に基づくアプローチを提案し,計画システムの内部探索ダイナミクスを考慮したドメイン指向学習ポリシーが既存のアプローチを超越できることを実証的に示す。
関連論文リスト
- Deep Memory Search: A Metaheuristic Approach for Optimizing Heuristic Search [0.0]
本稿では,メタヒューリスティック検索をメモリ駆動プロセスとしてモデル化するDeep Heuristic Search (DHS) という新しい手法を提案する。
DHSは複数の探索層とメモリベースの探索探索機構を用いて、大きな動的探索空間をナビゲートする。
論文 参考訳(メタデータ) (2024-10-22T14:16:49Z) - Dynamic operator management in meta-heuristics using reinforcement learning: an application to permutation flowshop scheduling problems [0.3495246564946556]
本研究では,メタヒューリスティックスにおける探索演算子のポートフォリオを動的に管理する強化学習に基づくフレームワークを開発する。
動的に更新されたポートフォリオから最も適切な演算子を選択するために、Qラーニングに基づく適応演算子選択機構を用いる。
提案するフレームワークの性能は,置換フローホップスケジューリング問題への適用を通して解析する。
論文 参考訳(メタデータ) (2024-08-27T08:38:17Z) - A Multi-Heuristic Search-based Motion Planning for Automated Parking [0.0]
駐車場や建設現場のような非構造環境においては、リアルタイムな計画の実現が困難である。
我々は、複数の関数とその個々の利点を利用できるマルチヒューリスティック検索アプローチを採用しています。
Multi-Heuristic A*アルゴリズムは、非常に人気のある検索ベースのアルゴリズムであるHybrid A*に対してベンチマークされる。
論文 参考訳(メタデータ) (2023-07-15T17:33:06Z) - Optimistic Active Exploration of Dynamical Systems [52.91573056896633]
我々はOPAXと呼ばれる活発な探索のためのアルゴリズムを開発した。
我々は,OPAXを各エピソードで解決可能な最適制御問題に還元する方法を示す。
実験の結果,OPAXは理論的に健全であるだけでなく,新規な下流タスクのゼロショット計画にも有効であることがわかった。
論文 参考訳(メタデータ) (2023-06-21T16:26:59Z) - Representation Learning with Multi-Step Inverse Kinematics: An Efficient
and Optimal Approach to Rich-Observation RL [106.82295532402335]
既存の強化学習アルゴリズムは、計算的難易度、強い統計的仮定、最適なサンプルの複雑さに悩まされている。
所望の精度レベルに対して、レート最適サンプル複雑性を実現するための、最初の計算効率の良いアルゴリズムを提供する。
我々のアルゴリズムMusIKは、多段階の逆運動学に基づく表現学習と体系的な探索を組み合わせる。
論文 参考訳(メタデータ) (2023-04-12T14:51:47Z) - Heuristic Search for Multi-Objective Probabilistic Planning [0.0]
ヒューリスティック検索は、幅広い計画問題にうまく適用された強力なアプローチである。
ここでは、探索の範囲をより多くの問題、すなわちMOSSP(Multi-jective shortest paths)に拡張する。
我々は、よく知られたSSPアルゴリズムを多目的問題に拡張するMOLAO* と MOLRTDP を設計する。
論文 参考訳(メタデータ) (2023-03-25T05:18:22Z) - Offline Reinforcement Learning with Differentiable Function
Approximation is Provably Efficient [65.08966446962845]
歴史的データを用いて意思決定戦略を最適化することを目的としたオフライン強化学習は、現実の応用に広く適用されている。
微分関数クラス近似(DFA)を用いたオフライン強化学習の検討から一歩踏み出した。
最も重要なことは、悲観的な適合Q-ラーニングアルゴリズムを解析することにより、オフライン微分関数近似が有効であることを示すことである。
論文 参考訳(メタデータ) (2022-10-03T07:59:42Z) - Efficient Non-Parametric Optimizer Search for Diverse Tasks [93.64739408827604]
興味のあるタスクを直接検索できる,スケーラブルで汎用的なフレームワークを初めて提示する。
基礎となる数学表現の自然木構造に着想を得て、空間を超木に再配置する。
我々は,モンテカルロ法を木探索に適用し,レジェクションサンプリングと等価形状検出を備える。
論文 参考訳(メタデータ) (2022-09-27T17:51:31Z) - Optimal and Efficient Algorithms for General Mixable Losses against
Switching Oracles [0.0]
動的環境における混合損失関数のオンライン最適化について検討する。
我々の結果は、個々のシーケンス方式で強い決定論的意味を持つことが保証されている。
論文 参考訳(メタデータ) (2021-08-13T21:48:55Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。