論文の概要: Ideal Partition of Resources for Metareasoning
- arxiv url: http://arxiv.org/abs/2110.09624v1
- Date: Mon, 18 Oct 2021 21:20:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-21 02:24:05.738775
- Title: Ideal Partition of Resources for Metareasoning
- Title(参考訳): メタエリアソナーリングのための資源の理想的分割
- Authors: Eric Horvitz and John Breese
- Abstract要約: メタ推論や制御に適用したいリソースの一部を、ソリューションプランの実行よりも決定することが重要です。
最近の合理的エージェンシーの研究は、メタレゾン機構による資源消費を制限することの重要性を強調している。
- 参考スコア(独自算出の注目度): 28.275947057354994
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We can achieve significant gains in the value of computation by metareasoning
about the nature or extent of base-level problem solving before executing a
solution. However, resources that are irrevocably committed to metareasoning
are not available for executing a solution. Thus, it is important to determine
the portion of resources we wish to apply to metareasoning and control versus
to the execution of a solution plan. Recent research on rational agency has
highlighted the importance of limiting the consumption of resources by
metareasoning machinery. We shall introduce the metareasoning-partition
problem--the problem of ideally apportioning costly reasoning resources to
planning a solution versus applying resource to executing a solution to a
problem. We exercise prototypical metareasoning-partition models to probe the
relationships between time allocated to metareasoning and to execution for
different problem classes. Finally, we examine the value of metareasoning in
the context of our functional analyses.
- Abstract(参考訳): 我々は,解を実行する前に,基礎レベルの問題解決の性質や程度をメタ推論することで,計算値の大幅な向上を実現することができる。
しかし、メタ推論に不当にコミットされているリソースは、ソリューションの実行には利用できない。
したがって、メタ推論や制御に適用したいリソースの一部を決定することは、ソリューションプランの実行よりも重要である。
近年,機械のメタレゾン化による資源消費抑制の重要性が注目されている。
問題に対する解決策の実行に資源を適用するのに対して、コストのかかる推論資源を計画計画に理想的に割り当てる問題である。
メタレゾン化時間と異なる問題クラスに対する実行時間の関係を探索するために, 原型メタレソン化分割モデルを訓練する。
最後に,機能解析の文脈におけるメタレゾニングの価値を検討する。
関連論文リスト
- Towards Cost Sensitive Decision Making [14.279123976398926]
本研究では,環境から機能を積極的に獲得し,意思決定の質と確実性を向上するRLモデルを考察する。
本稿では,Active-Acquisition POMDPを提案する。
積極的に獲得された部分観測環境においてエージェントを支援するとともに,探索・探索ジレンマを軽減するため,モデルベースアプローチを開発した。
論文 参考訳(メタデータ) (2024-10-04T19:48:23Z) - Meta-RTL: Reinforcement-Based Meta-Transfer Learning for Low-Resource Commonsense Reasoning [61.8360232713375]
低リソースコモンセンス推論のための強化型マルチソースメタトランスファー学習フレームワーク(Meta-RTL)を提案する。
本稿では,メタトランスファー学習において,対象タスクに対するタスクの寄与を動的に推定する手法を提案する。
実験の結果,Meta-RTLは,強いベースラインと以前のタスク選択戦略を大幅に上回ることがわかった。
論文 参考訳(メタデータ) (2024-09-27T18:22:22Z) - Metareasoning in uncertain environments: a meta-BAMDP framework [1.0923877073891441]
本稿では,未知の報酬/遷移分布を持つ環境におけるメタ推論を扱うメタベイズ適応型MDPフレームワークを提案する。
最初のステップとして、人間の意思決定によく使われる2本腕のBernoulli bandit(TABB)タスクにこのフレームワークを適用します。
論文 参考訳(メタデータ) (2024-08-02T13:15:01Z) - Differentiation of Multi-objective Data-driven Decision Pipeline [34.577809430781144]
実世界のシナリオは、しばしば多目的データ駆動最適化問題を含む。
従来の2段階の手法では、機械学習モデルを用いて問題係数を推定し、続いて予測された最適化問題に取り組むためにソルバを呼び出す。
近年の取り組みは、下流最適化問題から導かれる意思決定損失を用いた予測モデルのエンドツーエンドトレーニングに重点を置いている。
論文 参考訳(メタデータ) (2024-06-02T15:42:03Z) - Divide-or-Conquer? Which Part Should You Distill Your LLM? [38.62667131299918]
我々は、推論タスクを問題解決フェーズと問題解決フェーズに分解する同様の戦略を考案する。
戦略が単一ステージソリューションより優れていることを示す。
論文 参考訳(メタデータ) (2024-02-22T22:28:46Z) - Estimating Barycenters of Distributions with Neural Optimal Transport [93.28746685008093]
本稿では,Wasserstein Barycenter問題を解くための新しいスケーラブルなアプローチを提案する。
我々の手法は最近のNeural OTソルバをベースとしている。
また,提案手法の理論的誤差境界も確立する。
論文 参考訳(メタデータ) (2024-02-06T09:17:07Z) - Proactive Resource Request for Disaster Response: A Deep Learning-based
Optimization Model [0.2580765958706854]
我々は,要求される資源の最適量を積極的に決定する新たな資源管理問題を開発する。
我々は,問題の健全な特性を考慮に入れ,今後の需要予測のための新しいディープラーニング手法を開発した。
実世界とシミュレーションデータの両方を用いて,既存手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-07-31T13:44:01Z) - Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。
本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文 参考訳(メタデータ) (2022-01-28T05:53:28Z) - Automated Machine Learning, Bounded Rationality, and Rational
Metareasoning [62.997667081978825]
有界合理性の観点から、自動機械学習(AutoML)と関連する問題を考察する。
リソース境界の下でアクションを取るには、エージェントがこれらのリソースを最適な方法で利用する方法を反映する必要がある。
論文 参考訳(メタデータ) (2021-09-10T09:10:20Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Decentralized Reinforcement Learning: Global Decision-Making via Local
Economic Transactions [80.49176924360499]
我々は、シーケンシャルな意思決定問題を解決するために、単純で専門的で自己関心のあるエージェントの社会を指示する枠組みを確立する。
我々は分散強化学習アルゴリズムのクラスを導出する。
我々は、より効率的な移動学習のための社会固有のモジュラー構造の潜在的な利点を実証する。
論文 参考訳(メタデータ) (2020-07-05T16:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。