論文の概要: Strategyproof Decision-Making in Panel Data Settings and Beyond
- arxiv url: http://arxiv.org/abs/2211.14236v3
- Date: Mon, 29 May 2023 14:23:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 02:56:25.874583
- Title: Strategyproof Decision-Making in Panel Data Settings and Beyond
- Title(参考訳): パネルデータの設定等における戦略的意思決定
- Authors: Keegan Harris, Anish Agarwal, Chara Podimata, Zhiwei Steven Wu
- Abstract要約: 主成分が各単位の結果を観察する前介入期間が存在するような設定を考察する。
この古典的な設定とは異なり、パネルデータを生成するユニットは戦略的であり、例えば、より望ましい介入を受けるために、ユニットは事前介入の結果を変更することができる。
プリンシパルの目標は、戦略的な介入政策、すなわち、その潜在的な戦略にもかかわらず、正しい介入にユニットを割り当てる政策を設計することである。
- 参考スコア(独自算出の注目度): 35.84916049031641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the classical problem of decision-making using panel data, in
which a decision-maker gets noisy, repeated measurements of multiple units (or
agents). We consider a setup where there is a pre-intervention period, when the
principal observes the outcomes of each unit, after which the principal uses
these observations to assign a treatment to each unit. Unlike this classical
setting, we permit the units generating the panel data to be strategic, i.e.
units may modify their pre-intervention outcomes in order to receive a more
desirable intervention. The principal's goal is to design a strategyproof
intervention policy, i.e. a policy that assigns units to their correct
interventions despite their potential strategizing. We first identify a
necessary and sufficient condition under which a strategyproof intervention
policy exists, and provide a strategyproof mechanism with a simple closed form
when one does exist. Along the way, we prove impossibility results for
strategic multiclass classification, which may be of independent interest. When
there are two interventions, we establish that there always exists a
strategyproof mechanism, and provide an algorithm for learning such a
mechanism. For three or more interventions, we provide an algorithm for
learning a strategyproof mechanism if there exists a sufficiently large gap in
the principal's rewards between different interventions. Finally, we
empirically evaluate our model using real-world panel data collected from
product sales over 18 months. We find that our methods compare favorably to
baselines which do not take strategic interactions into consideration, even in
the presence of model misspecification.
- Abstract(参考訳): パネルデータを用いた意思決定の古典的問題は、意思決定者がうるさくなり、複数の単位(またはエージェント)を繰り返し測定することである。
本稿では,各単位の結果を主が観察し,その後,主がこれらの観測結果を用いて各単位に治療を割り当てる,事前介入期間が存在することを考察する。
この古典的な設定とは異なり、パネルデータを生成するユニットは戦略的であり、例えば、より望ましい介入を受けるために、ユニットは事前介入の結果を変更することができる。
プリンシパルの目標は、戦略的な介入政策、すなわち、その潜在的な戦略にもかかわらず、正しい介入にユニットを割り当てる政策を設計することである。
まず,戦略的介入政策が存在する必要十分条件を特定し,その存在時に簡単な閉じた形で戦略的防御機構を提供する。
その過程で,戦略的多クラス分類における不合理性(不合理性)の証明を行う。
2つの介入がある場合、我々は常に防御機構が存在し、そのようなメカニズムを学習するためのアルゴリズムを提供する。
3以上の介入に対して,各介入の報酬に十分に大きな差がある場合,戦略的防御機構を学習するためのアルゴリズムを提供する。
最後に,18ヶ月にわたって製品販売から収集した実世界のパネルデータを用いて,実証的にモデルを評価する。
提案手法は, モデル不特定性が存在する場合でも, 戦略的相互作用を考慮に入れないベースラインと良好に比較できる。
関連論文リスト
- Navigating Trade-offs: Policy Summarization for Multi-Objective Reinforcement Learning [10.848218400641466]
多目的強化学習(MORL)は、複数の目的を含む問題を解決するために用いられる。
本稿では,MORL が生成する解集合をクラスタリングする手法を提案する。
論文 参考訳(メタデータ) (2024-11-07T15:26:38Z) - Automatic Generation of Attention Rules For Containment of Machine
Learning Model Errors [1.4987559345379062]
我々は、観測を分離するために最適な規則を決定するためのいくつかのアルゴリズム(ストラテジー')を提案する。
特に,機能ベースのスライシングを利用する戦略は,人間の解釈可能で,モデル非依存であり,補足的な入力や知識を最小限に抑える必要がある。
戦略を評価するために、我々は、その性能、安定性、そして、目に見えないデータに対する一般化可能性など、様々な望ましい品質を測定するための指標を導入する。
論文 参考訳(メタデータ) (2023-05-14T10:15:35Z) - On the Fusion Strategies for Federated Decision Making [47.87035227391866]
エージェントのグループは、中央のプロセッサや互いにプライベートデータを共有せずに、基礎となる自然状態を推測するために協力します。
我々は,ベイズルールを用いて,エージェントが個々の観察を意見に組み込む非ベイズ的社会学習戦略を解析し,中央プロセッサが算術的あるいは平均化によってこれらの意見を集約する。
論文 参考訳(メタデータ) (2023-03-10T17:57:40Z) - Strategic Decision-Making in the Presence of Information Asymmetry:
Provably Efficient RL with Algorithmic Instruments [55.41685740015095]
我々は,戦略MDPと呼ばれる新しいモデルの下で,オフライン強化学習について検討する。
アルゴリズムiNstruments(PLAN)を用いたペシミスティックポリシー学習法を提案する。
論文 参考訳(メタデータ) (2022-08-23T15:32:44Z) - A Prototype-Oriented Framework for Unsupervised Domain Adaptation [52.25537670028037]
メモリと計算効率のよい確率的フレームワークを提供し、クラスプロトタイプを抽出し、ターゲットとなる特徴をそれらと整合させる。
本稿では,単一ソース,マルチソース,クラス不均衡,ソースプライベートドメイン適応など,幅広いシナリオにおいて,本手法の汎用性を実証する。
論文 参考訳(メタデータ) (2021-10-22T19:23:22Z) - Matching a Desired Causal State via Shift Interventions [13.89612747723388]
我々は,能動的学習を通じて,システムの望ましい平均値と一致するシフト介入を特定することの問題点を考察する。
目的と正確に一致することが保証される2つのアクティブな学習戦略を提案する。
我々の戦略は、これまで検討されたアプローチよりも指数関数的に少ない介入を必要とする可能性がある。
論文 参考訳(メタデータ) (2021-07-05T08:11:36Z) - Stateful Strategic Regression [20.7177095411398]
結果のゲームにおけるスタックルバーグ均衡を記述し、計算のための新しいアルゴリズムを提供する。
分析の結果,ゲームの結果を形作る上でのマルチインタラクションの役割について,いくつかの興味深い知見が得られた。
最も重要なことは、処理時に複数ラウンドの相互作用を行うことで、主成分は、目的の方向に努力を蓄積するために、エージェントにインセンティブを与えるのにより効果的であることを示すことである。
論文 参考訳(メタデータ) (2021-06-07T17:46:29Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - Deep Interactive Bayesian Reinforcement Learning via Meta-Learning [63.96201773395921]
他のエージェントの戦略に対する不確実性下での最適適応行動は、インタラクティブベイズ強化学習フレームワークを用いて計算することができる。
本稿では,メタラーン近似的信念推論とベイズ最適行動を提案する。
提案手法は, モデルフリーアプローチ, 近似後部からのサンプル採取, 他者のメモリフリーモデル維持, あるいは環境の既知の構造を完全に活用しない既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-01-11T13:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。