Fugu-MT 論文翻訳(概要): Planning with Dynamically Estimated Action Costs

論文の概要: Planning with Dynamically Estimated Action Costs

arxiv url: http://arxiv.org/abs/2206.04166v1
Date: Wed, 8 Jun 2022 21:10:37 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-10 15:25:52.854399
Title: Planning with Dynamically Estimated Action Costs
Title（参考訳）: 動的に見積もった行動コストによる計画
Authors: Eyal Weiss and Gal A. Kaminka
Abstract要約: 実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。近年のアプローチでは、データからしばしば学習されるブラックボックス外部アクションコスト推定器が計画段階で適用されている。本稿では,行動コストを考慮した決定論的計画の一般化を提案する。
参考スコア（独自算出の注目度）: 2.8326418377665346
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Information about action costs is critical for real-world AI planning applications. Rather than rely solely on declarative action models, recent approaches also use black-box external action cost estimators, often learned from data, that are applied during the planning phase. These, however, can be computationally expensive, and produce uncertain values. In this paper we suggest a generalization of deterministic planning with action costs that allows selecting between multiple estimators for action cost, to balance computation time against bounded estimation uncertainty. This enables a much richer -- and correspondingly more realistic -- problem representation. Importantly, it allows planners to bound plan accuracy, thereby increasing reliability, while reducing unnecessary computational burden, which is critical for scaling to large problems. We introduce a search algorithm, generalizing $A^*$, that solves such planning problems, and additional algorithmic extensions. In addition to theoretical guarantees, extensive experiments show considerable savings in runtime compared to alternatives.
Abstract（参考訳）: 実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。宣言的アクションモデルのみに頼るのではなく、近年のアプローチでは、計画段階で適用されるデータから学ぶブラックボックスの外部アクションコスト推定器も使用されている。しかし、これらは計算量的に高価であり、不確定な値を生み出す。本稿では,行動コストに対する複数の推定器間の選択を可能にする行動コストを用いた決定論的計画の一般化を提案する。これにより、よりリッチでより現実的な問題表現が可能になります。重要なことは、プランナーが計画の正確性に縛られ、信頼性が向上すると同時に、不要な計算負担を軽減できることである。本稿では,そのような計画問題の解法を一般化した探索アルゴリズムと,追加のアルゴリズム拡張を導入する。理論的な保証に加えて、広範な実験により、代替よりも実行時の大幅な削減が示されている。

関連論文リスト

Cost-aware Stopping for Bayesian Optimization [53.34052774820105]
本稿では,様々な評価コストに適応し,チューニングが不要なベイズ最適化のためのコスト対応停止則を提案する。我々は,最先端の取得関数と組み合わせた場合,停止規則によって得られる期待累積評価コストを拘束する理論的な保証を証明した。
論文参考訳（メタデータ） (2025-07-16T17:54:14Z)
Collaborative LLM Inference via Planning for Efficient Reasoning [50.04696654679751]
本稿では,プランナーモデルがまず,その問題の蒸留および高レベルの抽象化として定義されたプランを生成するテストタイム協調フレームワークを提案する。小型と大型のモデルは、プランナーと理性士として交代で働き、複雑なタスクを協調的に解決するために、多ラウンドのカスケードでプランを交換する。提案手法は,強力なプロプライエタリモデルに匹敵する精度を実現し,有償推論への依存を著しく低減する。
論文参考訳（メタデータ） (2025-06-13T08:35:50Z)
Cost-Optimal Active AI Model Evaluation [71.2069549142394]
生成AIシステムの開発には、継続的な評価、データ取得、アノテーションが必要である。我々は、安価だがしばしば不正確で弱いレーダの使用を積極的にバランスさせる新しいコスト認識手法を開発した。我々は、弱者と強者の間で所定のアノテーション予算を割り当てるためのコスト最適化政策のファミリーを導出する。
論文参考訳（メタデータ） (2025-06-09T17:14:41Z)
Value-Based Deep RL Scales Predictably [100.21834069400023]
本研究は, 地域社会が病的行動に不安を抱いているにもかかわらず, 価値に基づく非政治的RL法が予測可能であることを示す。 SAC、BRO、PQLの3つのアルゴリズムを使って、DeepMind Control、OpenAI gym、IsaacGymの3つのアプローチを検証する。
論文参考訳（メタデータ） (2025-02-06T18:59:47Z)
The Effect of Scheduling and Preemption on the Efficiency of LLM Inference Serving [8.552242818726347]
INFERMAXは様々なスケジューラを比較するために推論コストモデルを使用する分析フレームワークである。その結果,プリエンプション要求はプリエンプションを回避するよりもGPUコストを30%削減できることがわかった。
論文参考訳（メタデータ） (2024-11-12T00:10:34Z)
Cost-Aware Query Policies in Active Learning for Efficient Autonomous Robotic Exploration [0.0]
本稿では,動作コストを考慮しつつ,ガウス過程回帰のためのALアルゴリズムを解析する。距離制約を持つ伝統的な不確実性計量は、軌道距離上のルート平均二乗誤差を最小化する。
論文参考訳（メタデータ） (2024-10-31T18:35:03Z)
Decision-Focused Learning to Predict Action Costs for Planning [6.729103498871947]
決定焦点学習(DFL)は最適化問題のパラメータを予測する学習に成功している。本稿では, 自動計画のためのDFL導入の課題について検討し, アクションコストの予測について考察する。
論文参考訳（メタデータ） (2024-08-13T13:14:54Z)
MEXGEN: An Effective and Efficient Information Gain Approximation for Information Gathering Path Planning [3.195234044113248]
自律ロボットの計画アルゴリズムは、不確実性の下でのシーケンシャルな意思決定問題を解決する必要がある。我々は,不確実な信念状態からセンサ計測を予測する難しい問題に対して,計算的に効率的かつ効果的に近似する手法を開発した。マルチロータ型空中ロボットを用いた広範囲なシミュレーション・フィールド実験により, 電波源追尾と位置決め問題の性能向上を実証した。
論文参考訳（メタデータ） (2024-05-04T08:09:16Z)
Triple Simplex Matrix Completion for Expense Forecasting [11.52704888524571]
本稿では,潜在空間における特定の費用パターンに関連するプロジェクトの可能性を学習し,コストを予測する制約付き非負行列補完モデルを提案する。 2つの実データセットから得られた結果は、最先端のアルゴリズムと比較して提案手法の有効性を示す。
論文参考訳（メタデータ） (2023-10-23T18:25:33Z)
Nearly Minimax Optimal Reinforcement Learning for Linear Markov Decision Processes [80.89852729380425]
そこで本研究では,最小限の最小残差である$tilde O(dsqrtH3K)$を計算効率よく実現したアルゴリズムを提案する。我々の研究は線形 MDP を用いた最適 RL に対する完全な答えを提供する。
論文参考訳（メタデータ） (2022-12-12T18:58:59Z)
Quantization for decentralized learning under subspace constraints [61.59416703323886]
エージェントがサブスペース制約を最小化するために個々のコスト関数を持つ分散最適化問題を考察する。本稿では,エージェントが確率化量子化器を用いて推定値を圧縮する適応分散型戦略を提案し,検討する。この分析は、量子化ノイズのいくつかの一般的な条件下では、平均二乗誤差と平均ビットレートの両方で戦略が安定であることを示している。
論文参考訳（メタデータ） (2022-09-16T09:38:38Z)
How Much More Data Do I Need? Estimating Requirements for Downstream Tasks [99.44608160188905]
小さなトレーニングデータセットと学習アルゴリズムがあれば、ターゲットの検証やテストのパフォーマンスに到達するのに、どれくらいのデータが必要か? データ要求を過大評価または過小評価すると、十分な予算で回避できる相当なコストが発生する。本ガイドラインを用いることで,機械学習システムのデータ要求を正確に推定し,開発時間とデータ取得コストの双方で節約することができる。
論文参考訳（メタデータ） (2022-07-04T21:16:05Z)
Neural Optimal Transport with General Cost Functionals [66.41953045707172]
一般費用関数の最適輸送計画を計算するニューラルネットワークに基づく新しいアルゴリズムを提案する。アプリケーションとして,クラス単位の構造を保ちながら,データ分布をマップするコスト関数を構築した。
論文参考訳（メタデータ） (2022-05-30T20:00:19Z)
Adaptive Information Belief Space Planning [9.365993173260316]
我々は、不確実性に明示的に対処する報酬関数を使用して、情報決定を効率的に行うことに重点を置いている。期待される情報理論の報奨関数と結果の値関数のバウンダリを導出する。そこで我々は,計算時間のごく一部で同一の動作選択を実現するために集約を洗練させる手法を提案する。
論文参考訳（メタデータ） (2022-01-14T21:12:00Z)
Uncertainty-aware Remaining Useful Life predictor [57.74855412811814]
有効寿命 (Remaining Useful Life, RUL) とは、特定の産業資産の運用期間を推定する問題である。本研究では,Deep Gaussian Processes (DGPs) を,前述の制限に対する解決策と捉える。アルゴリズムの性能はNASAの航空機エンジン用N-CMAPSSデータセットで評価される。
論文参考訳（メタデータ） (2021-04-08T08:50:44Z)
Combining Deep Learning and Optimization for Security-Constrained Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。 SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文参考訳（メタデータ） (2020-07-14T12:38:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。