論文の概要: Present-Biased Optimization
- arxiv url: http://arxiv.org/abs/2012.14736v1
- Date: Tue, 29 Dec 2020 12:40:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-19 02:28:03.715483
- Title: Present-Biased Optimization
- Title(参考訳): バイアスド最適化
- Authors: Fedor V. Fomin, Pierre Fraigniaud, and Petr A. Golovach
- Abstract要約: 論文は,akerlof (1991) が提唱した,時間的一貫性のない計画に関する人間の行動の様々な側面を研究する枠組みを拡張した。
その結果,現在偏りのあるエージェントが計算している解のコストと最適解のコストの比率は,問題制約によって大きく異なることがわかった。
- 参考スコア(独自算出の注目度): 8.775878711928591
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper explores the behavior of present-biased agents, that is, agents
who erroneously anticipate the costs of future actions compared to their real
costs. Specifically, the paper extends the original framework proposed by
Akerlof (1991) for studying various aspects of human behavior related to
time-inconsistent planning, including procrastination, and abandonment, as well
as the elegant graph-theoretic model encapsulating this framework recently
proposed by Kleinberg and Oren (2014). The benefit of this extension is
twofold. First, it enables to perform fine grained analysis of the behavior of
present-biased agents depending on the optimisation task they have to perform.
In particular, we study covering tasks vs. hitting tasks, and show that the
ratio between the cost of the solutions computed by present-biased agents and
the cost of the optimal solutions may differ significantly depending on the
problem constraints. Second, our extension enables to study not only
underestimation of future costs, coupled with minimization problems, but also
all combinations of minimization/maximization, and
underestimation/overestimation. We study the four scenarios, and we establish
upper bounds on the cost ratio for three of them (the cost ratio for the
original scenario was known to be unbounded), providing a complete global
picture of the behavior of present-biased agents, as far as optimisation tasks
are concerned.
- Abstract(参考訳): 本稿では,現在のバイアスエージェントの行動,すなわち,将来の行動のコストを,実際のコストと比較して誤って予測するエージェントについて検討する。
具体的には、Akerlof (1991) が提案したもともとの枠組みを拡張し、プロクラステネーションや放棄を含む時間的一貫性のない計画に関する人間の行動の様々な側面を研究するとともに、Kleinberg と Oren (2014) によって最近提案されたこの枠組みを包含するエレガントなグラフ理論モデルも拡張した。
この拡張の利点は2つあります。
まず、実行すべき最適化タスクに応じて、現在のバイアスエージェントの挙動をきめ細かい分析を行うことができる。
特に,タスク対ヒットタスクについて検討し,現在バイアスのかかったエージェントが計算した解のコストと最適解のコストとの比が問題制約によって大きく異なることを示す。
第2に、我々の拡張は、将来のコストの過小評価だけでなく、最小化/最大化と過小評価/過小評価の組合せについても研究することができる。
4つのシナリオについて検討し,3つのシナリオのコスト比率の上限(原シナリオのコスト比率はアンバウンドであることが知られている)を確立し,最適化タスクが考慮される限り,現在のバイアスエージェントの行動の完全な全体像を提供する。
関連論文リスト
- Triple Simplex Matrix Completion for Expense Forecasting [11.52704888524571]
本稿では,潜在空間における特定の費用パターンに関連するプロジェクトの可能性を学習し,コストを予測する制約付き非負行列補完モデルを提案する。
2つの実データセットから得られた結果は、最先端のアルゴリズムと比較して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2023-10-23T18:25:33Z) - Leaving the Nest: Going Beyond Local Loss Functions for
Predict-Then-Optimize [57.22851616806617]
本手法は,文献から得られた4つの領域において,最先端の成果が得られることを示す。
提案手法は, 局所性仮定が破られた場合, 既存手法よりも200%近く性能が向上する。
論文 参考訳(メタデータ) (2023-05-26T11:17:45Z) - Online Learning under Budget and ROI Constraints via Weak Adaptivity [57.097119428915796]
制約付きオンライン学習問題に対する既存の原始双対アルゴリズムは、2つの基本的な仮定に依存している。
このような仮定は、標準の原始双対テンプレートを弱適応的後悔最小化器で与えることによって、どのように回避できるのかを示す。
上記の2つの前提が満たされていない場合に保証される、世界の最高の保証を証明します。
論文 参考訳(メタデータ) (2023-02-02T16:30:33Z) - Quantization for decentralized learning under subspace constraints [61.59416703323886]
エージェントがサブスペース制約を最小化するために個々のコスト関数を持つ分散最適化問題を考察する。
本稿では,エージェントが確率化量子化器を用いて推定値を圧縮する適応分散型戦略を提案し,検討する。
この分析は、量子化ノイズのいくつかの一般的な条件下では、平均二乗誤差と平均ビットレートの両方で戦略が安定であることを示している。
論文 参考訳(メタデータ) (2022-09-16T09:38:38Z) - Resource Allocation to Agents with Restrictions: Maximizing Likelihood
with Minimum Compromise [28.2469613376685]
原理は、各エージェントが何らかの確率でリソースにマッチするように、ランダムに最大マッチングを選択することを示す。
エージェントは、制限を一定の範囲内で変更することで、マッチする可能性を改善したいと考えています。
本研究では,合成データセットと2つの新しい実世界のデータセットについて実験的に評価した。
論文 参考訳(メタデータ) (2022-09-12T11:58:19Z) - Planning with Dynamically Estimated Action Costs [2.8326418377665346]
実際のAI計画アプリケーションには、アクションコストに関する情報が不可欠だ。
近年のアプローチでは、データからしばしば学習されるブラックボックス外部アクションコスト推定器が計画段階で適用されている。
本稿では,行動コストを考慮した決定論的計画の一般化を提案する。
論文 参考訳(メタデータ) (2022-06-08T21:10:37Z) - Probabilistically Robust Recourse: Navigating the Trade-offs between
Costs and Robustness in Algorithmic Recourse [34.39887495671287]
本稿では,達成された(反感)と所望のリコース無効率とのギャップを同時に最小化する目的関数を提案する。
我々は,任意のインスタンスに対応するリコース無効化率を特徴付けるために,新しい理論的結果を開発した。
複数の実世界のデータセットを用いた実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-13T21:39:24Z) - Online Learning with Knapsacks: the Best of Both Worlds [54.28273783164608]
オンライン学習の課題として,意思決定者が,リソース制約の有限セットに違反することなく,期待する報酬を最大化したい,という課題を提起する。
当社のフレームワークは,意思決定者がそのエビデンスを柔軟かつコスト論的に扱えるようにします。
論文 参考訳(メタデータ) (2022-02-28T12:10:48Z) - Towards Robust and Reliable Algorithmic Recourse [11.887537452826624]
モデルシフトに堅牢なリコースを見つけるための敵対的トレーニングを活用する新しいフレームワークであるRObust Algorithmic Recourse(ROAR)を提案します。
また,モデルシフトにロバストなリコースの構築の重要性を強調する詳細な理論解析を行う。
論文 参考訳(メタデータ) (2021-02-26T17:38:52Z) - VCG Mechanism Design with Unknown Agent Values under Stochastic Bandit
Feedback [104.06766271716774]
本研究では,エージェントが自己の価値を知らない場合に,マルチラウンドの福祉最大化機構設計問題について検討する。
まず、福祉に対する後悔の3つの概念、各エージェントの個々のユーティリティ、メカニズムの3つの概念を定義します。
当社のフレームワークは価格体系を柔軟に制御し、エージェントと販売者の後悔のトレードオフを可能にする。
論文 参考訳(メタデータ) (2020-04-19T18:00:58Z) - Cost-Sensitive Portfolio Selection via Deep Reinforcement Learning [100.73223416589596]
深層強化学習を用いたコスト依存型ポートフォリオ選択手法を提案する。
具体的には、価格系列パターンと資産相関の両方を抽出するために、新しい2ストリームポートフォリオポリシーネットワークを考案した。
蓄積したリターンを最大化し、強化学習によるコストの両立を抑えるため、新たなコスト感受性報酬関数が開発された。
論文 参考訳(メタデータ) (2020-03-06T06:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。