論文の概要: Causal Strategic Learning with Competitive Selection
- arxiv url: http://arxiv.org/abs/2308.16262v1
- Date: Wed, 30 Aug 2023 18:43:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-01 18:37:51.719705
- Title: Causal Strategic Learning with Competitive Selection
- Title(参考訳): 競争選択による因果戦略学習
- Authors: Kiet Q. H. Vo, Muneeb Aadil, Siu Lun Chau, Krikamol Muandet
- Abstract要約: 複数の意思決定者の下で因果戦略学習におけるエージェント選択の問題について検討する。
最適な選択規則は、最適なエージェントを選択することと、エージェントの改善を最大化するためのインセンティブを提供することの間のトレードオフであることを示す。
我々は、真の因果パラメータを回復するために、すべての意思決定者がまとめて採用しなければならない協調プロトコルを提供する。
- 参考スコア(独自算出の注目度): 10.237954203296187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of agent selection in causal strategic learning under
multiple decision makers and address two key challenges that come with it.
Firstly, while much of prior work focuses on studying a fixed pool of agents
that remains static regardless of their evaluations, we consider the impact of
selection procedure by which agents are not only evaluated, but also selected.
When each decision maker unilaterally selects agents by maximising their own
utility, we show that the optimal selection rule is a trade-off between
selecting the best agents and providing incentives to maximise the agents'
improvement. Furthermore, this optimal selection rule relies on incorrect
predictions of agents' outcomes. Hence, we study the conditions under which a
decision maker's optimal selection rule will not lead to deterioration of
agents' outcome nor cause unjust reduction in agents' selection chance. To that
end, we provide an analytical form of the optimal selection rule and a
mechanism to retrieve the causal parameters from observational data, under
certain assumptions on agents' behaviour. Secondly, when there are multiple
decision makers, the interference between selection rules introduces another
source of biases in estimating the underlying causal parameters. To address
this problem, we provide a cooperative protocol which all decision makers must
collectively adopt to recover the true causal parameters. Lastly, we complement
our theoretical results with simulation studies. Our results highlight not only
the importance of causal modeling as a strategy to mitigate the effect of
gaming, as suggested by previous work, but also the need of a benevolent
regulator to enable it.
- Abstract(参考訳): 複数の意思決定者による因果戦略学習におけるエージェント選択の問題を調査し,それに伴う2つの課題に対処した。
まず, 先行研究の多くは, 評価によらず静的なエージェントプールの研究に焦点が当てられているが, エージェントが評価されるだけでなく, 選択される際の選択手順の影響を考察する。
各意思決定者が自身の効用を最大化してエージェントを一方的に選択した場合、最適な選択規則は、最適なエージェントを選択し、エージェントの改善を最大化するためのインセンティブを提供することの間のトレードオフであることを示す。
さらに、この最適選択規則は、エージェントの結果の誤った予測に依存する。
したがって、意思決定者の最適選択規則がエージェントの結果の劣化を招き、エージェントの選択確率を不当に低下させることのない条件について検討する。
この目的のために, 最適選択規則の分析形式と, エージェントの行動に関する一定の仮定の下で, 観測データから因果パラメータを抽出する機構を提案する。
第二に、複数の意思決定者がいる場合、選択規則間の干渉は、基礎となる因果パラメータを推定する別のバイアス源をもたらす。
この問題に対処するために,我々は,意思決定者が一体となって真の因果パラメータを回復しなければならない協調プロトコルを提供する。
最後に,シミュレーション研究により理論的結果を補完する。
本研究は,ゲームの効果を緩和するための戦略としての因果モデリングの重要性を強調するだけでなく,それを実現するために善意のレギュレータが必要である。
関連論文リスト
- Algorithmic Decision-Making under Agents with Persistent Improvement [9.296248945826084]
人間の戦略的行動下でのアルゴリズムによる意思決定について検討する。
まず、永続的な改善を特徴付ける動的モデルを開発する。
次に、意思決定者がエージェントの集団の中で最大の改善をインセンティブにするための最適なポリシーを設計する方法について研究する。
論文 参考訳(メタデータ) (2024-05-03T01:36:35Z) - Online Decision Mediation [72.80902932543474]
意思決定支援アシスタントを学習し、(好奇心)専門家の行動と(不完全)人間の行動の仲介役として機能することを検討する。
臨床診断では、完全に自律的な機械行動は倫理的余裕を超えることが多い。
論文 参考訳(メタデータ) (2023-10-28T05:59:43Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - Rational Decision-Making Agent with Internalized Utility Judgment [91.80700126895927]
大規模言語モデル(LLM)は目覚ましい進歩を示し、従来のNLPアプリケーションを超えて複雑な多段階決定タスクを実行できるエージェントにLLMを開発するための重要な努力を惹きつけている。
本稿では,RadAgentを提案する。このRadAgentは,経験探索とユーティリティ学習を含む反復的なフレームワークを通じて,合理性の発展を促進する。
ToolBenchデータセットの実験結果は、RadAgentがベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2023-08-24T03:11:45Z) - Incentive-Theoretic Bayesian Inference for Collaborative Science [59.15962177829337]
未知のパラメータについて、プライベートな先行エージェントが存在する場合の仮説テストについて検討する。
エージェントの戦略行動によって明らかにされる情報を活用する統計的推論を行う方法を示す。
論文 参考訳(メタデータ) (2023-07-07T17:59:01Z) - In Search of Insights, Not Magic Bullets: Towards Demystification of the
Model Selection Dilemma in Heterogeneous Treatment Effect Estimation [92.51773744318119]
本稿では,異なるモデル選択基準の長所と短所を実験的に検討する。
選択戦略,候補推定器,比較に用いるデータの間には,複雑な相互作用があることを強調した。
論文 参考訳(メタデータ) (2023-02-06T16:55:37Z) - Explainability's Gain is Optimality's Loss? -- How Explanations Bias
Decision-making [0.0]
説明は、アルゴリズムと人間の意思決定者とのコミュニケーションを促進するのに役立つ。
因果モデルに関する特徴に基づく説明のセマンティクスは、意思決定者の以前の信念から漏れを引き起こす。
このような違いは、準最適かつ偏った決定結果をもたらす可能性がある。
論文 参考訳(メタデータ) (2022-06-17T11:43:42Z) - Bayesian Persuasion for Algorithmic Recourse [28.586165301962485]
いくつかの状況では、根底にある予測モデルはゲームを避け、競争上の優位性を維持するために意図的に秘密にされている。
我々はベイズ的説得のゲームのような設定を捉え、意思決定者は、例えばアクションレコメンデーションのようなシグナルを、望ましい行動を取るためのインセンティブを与える決定対象に送信する。
本稿では,最適化問題として最適なベイズ的インセンティブ互換(BIC)行動推薦ポリシーを見出すという意思決定者の問題を定式化し,線形プログラムを用いて解を特徴づける。
論文 参考訳(メタデータ) (2021-12-12T17:18:54Z) - Peer Selection with Noisy Assessments [43.307040330622186]
現在最も正確なピアレビューアルゴリズムであるPeerNominationをWeightedPeerNominationに拡張します。
重み付け方式により、選択の全体的な精度が大幅に向上できることを解析的に示す。
論文 参考訳(メタデータ) (2021-07-21T14:47:11Z) - Learning Strategies in Decentralized Matching Markets under Uncertain
Preferences [91.3755431537592]
エージェントの選好が不明な場合,共有資源の不足の設定における意思決定の問題について検討する。
我々のアプローチは、再生されたカーネルヒルベルト空間における好みの表現に基づいている。
エージェントの期待した利益を最大化する最適な戦略を導出する。
論文 参考訳(メタデータ) (2020-10-29T03:08:22Z) - Causal Strategic Linear Regression [5.672132510411465]
信用スコアや学術試験のような多くの予測的な意思決定シナリオでは、意思決定者は、決定ルールを「ゲーム」するためにエージェントの正当性を説明するモデルを構築しなければならない。
私たちは、変更可能な属性の関数として、モデリングエージェントの結果の同時処理に参加します。
3つの異なる意思決定目標を最適化する意思決定ルールを学習するための効率的なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-02-24T03:57:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。