論文の概要: Decision-Focused Learning to Predict Action Costs for Planning
- arxiv url: http://arxiv.org/abs/2408.06876v2
- Date: Mon, 26 Aug 2024 11:29:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-27 20:30:25.462917
- Title: Decision-Focused Learning to Predict Action Costs for Planning
- Title(参考訳): 計画における行動コスト予測のための意思決定型学習
- Authors: Jayanta Mandi, Marco Foschini, Daniel Holler, Sylvie Thiebaux, Jorg Hoffmann, Tias Guns,
- Abstract要約: 決定焦点学習(DFL)は最適化問題のパラメータを予測する学習に成功している。
本稿では, 自動計画のためのDFL導入の課題について検討し, アクションコストの予測について考察する。
- 参考スコア(独自算出の注目度): 6.729103498871947
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In many automated planning applications, action costs can be hard to specify. An example is the time needed to travel through a certain road segment, which depends on many factors, such as the current weather conditions. A natural way to address this issue is to learn to predict these parameters based on input features (e.g., weather forecasts) and use the predicted action costs in automated planning afterward. Decision-Focused Learning (DFL) has been successful in learning to predict the parameters of combinatorial optimization problems in a way that optimizes solution quality rather than prediction quality. This approach yields better results than treating prediction and optimization as separate tasks. In this paper, we investigate for the first time the challenges of implementing DFL for automated planning in order to learn to predict the action costs. There are two main challenges to overcome: (1) planning systems are called during gradient descent learning, to solve planning problems with negative action costs, which are not supported in planning. We propose novel methods for gradient computation to avoid this issue. (2) DFL requires repeated planner calls during training, which can limit the scalability of the method. We experiment with different methods approximating the optimal plan as well as an easy-to-implement caching mechanism to speed up the learning process. As the first work that addresses DFL for automated planning, we demonstrate that the proposed gradient computation consistently yields significantly better plans than predictions aimed at minimizing prediction error; and that caching can temper the computation requirements.
- Abstract(参考訳): 多くの自動計画アプリケーションでは、アクションコストを特定するのは難しい。
例えば、ある道路区間を移動するのに必要な時間は、現在の気象条件など、多くの要因に依存する。
この問題に対処するための自然な方法は、入力特徴(例えば天気予報)に基づいてこれらのパラメータを予測し、その後に予測されたアクションコストを自動計画に使用することである。
DFL(Decision-Focused Learning)は、組合せ最適化問題のパラメータを、予測品質よりも解品質を最適化する方法で予測する学習に成功している。
このアプローチは、予測と最適化を別のタスクとして扱うよりも、よりよい結果をもたらす。
本稿では,DFLを自動計画に導入する際の課題を初めて考察し,アクションコストの予測について考察する。
1) 計画において支持されない負の行動コストを伴う計画問題の解決を目的として, 勾配降下学習中に計画システムを呼び出す。
本稿では,この問題を回避するために,勾配計算の新しい手法を提案する。
2) DFLは、トレーニング中に繰り返しプランナーコールを必要とするため、メソッドのスケーラビリティを制限できる。
本研究では,学習過程を高速化するキャッシング機構とともに,最適計画の近似方法を試行する。
自動計画のためのDFLに対処する最初の研究として、提案した勾配計算が予測誤差の最小化を目的とした予測よりもずっと優れた計画を生成することを示し、キャッシングが計算要求を抑えることを示した。
関連論文リスト
- On Learning Action Costs from Input Plans [8.68471096727195]
入力計画の集合が最適であるような行動の集合のコストを学習する新たな問題を導入する。
ラベルのない入力計画からアクションのコストを学習するアルゴリズムであるLACFIPk$を提示する。
論文 参考訳(メタデータ) (2024-08-20T14:20:19Z) - Experiment Planning with Function Approximation [49.50254688629728]
本研究では,文脈的帯域幅問題における関数近似を用いた実験計画の問題点について検討する。
本稿では,関数近似に適合する2つの実験計画戦略を提案する。
そこで, 均一サンプリング器は, 動作数が少ない設定において, 競合最適性を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-10T14:40:23Z) - Planning as In-Painting: A Diffusion-Based Embodied Task Planning
Framework for Environments under Uncertainty [56.30846158280031]
具体的AIのためのタスクプランニングは、最も難しい問題の1つだ。
In-paintingとしての計画」というタスク非依存の手法を提案する。
提案するフレームワークは,様々な具体的AIタスクにおいて,有望なパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-12-02T10:07:17Z) - Score Function Gradient Estimation to Widen the Applicability of Decision-Focused Learning [17.962860438133312]
決定中心学習(DFL)パラダイムは、例えば後悔など、タスク損失を直接最小化するためのトレーニングによって制限を克服する。
そこで我々は,このような仮定をせずに,任意のタスク損失に作用するスコア関数推定とスムースに組み合わせた代替手法を提案する。
実験の結果、一般的に多くのエポックを必要とするが、専門的な手法と同等であり、特にソリューションの品質、スケーラビリティ、あるいはその両方の観点から、制約の不確実性に悩む問題に対して、特にうまく機能していることが示されている。
論文 参考訳(メタデータ) (2023-07-11T12:32:13Z) - On efficient computation in active inference [1.1470070927586016]
計算量を大幅に減らした有限時間地平線に対する新しい計画アルゴリズムを提案する。
また、新規かつ既存のアクティブな推論計画スキームに対して適切な目標分布を設定するプロセスを簡単にする。
論文 参考訳(メタデータ) (2023-07-02T07:38:56Z) - Planning with Dynamically Estimated Action Costs [2.8326418377665346]
実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。
近年のアプローチでは、データからしばしば学習されるブラックボックス外部アクションコスト推定器が計画段階で適用されている。
本稿では,行動コストを考慮した決定論的計画の一般化を提案する。
論文 参考訳(メタデータ) (2022-06-08T21:10:37Z) - Adversarial Plannning [8.930624061602046]
計画アルゴリズムは、自律的な振舞いを指示するために計算システムで使用される。
このようなアルゴリズムが、プランナーを阻止しようとする敵に対してどのように機能するかは不明だ。
論文 参考訳(メタデータ) (2022-05-01T21:43:06Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Generating Useful Accident-Prone Driving Scenarios via a Learned Traffic
Prior [135.78858513845233]
STRIVEは、特定のプランナーが衝突のような望ましくない振る舞いを発生させるような、困難なシナリオを自動的に生成する手法である。
シナリオの妥当性を維持するために、キーとなるアイデアは、グラフベースの条件付きVAEという形で、学習した交通運動モデルを活用することである。
その後の最適化は、シナリオの"解決"を見つけるために使用され、与えられたプランナーを改善するのに有効である。
論文 参考訳(メタデータ) (2021-12-09T18:03:27Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。