論文の概要: Strategic Hypothesis Testing
- arxiv url: http://arxiv.org/abs/2508.03289v1
- Date: Tue, 05 Aug 2025 10:08:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.906206
- Title: Strategic Hypothesis Testing
- Title(参考訳): 戦略的仮説テスト
- Authors: Safwan Hossain, Yatong Chen, Yiling Chen,
- Abstract要約: エージェントの参加行動と報告行動がプリンシパルの統計的決定ルールにどのように反応するかをキャプチャするゲーム理論モデルを開発する。
相互作用の複雑さにもかかわらず、効率よく計算可能な臨界p値しきい値で区切られた場合、主成分の誤差は明確な単調な振る舞いを示す。
- 参考スコア(独自算出の注目度): 7.960225901913547
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We examine hypothesis testing within a principal-agent framework, where a strategic agent, holding private beliefs about the effectiveness of a product, submits data to a principal who decides on approval. The principal employs a hypothesis testing rule, aiming to pick a p-value threshold that balances false positives and false negatives while anticipating the agent's incentive to maximize expected profitability. Building on prior work, we develop a game-theoretic model that captures how the agent's participation and reporting behavior respond to the principal's statistical decision rule. Despite the complexity of the interaction, we show that the principal's errors exhibit clear monotonic behavior when segmented by an efficiently computable critical p-value threshold, leading to an interpretable characterization of their optimal p-value threshold. We empirically validate our model and these insights using publicly available data on drug approvals. Overall, our work offers a comprehensive perspective on strategic interactions within the hypothesis testing framework, providing technical and regulatory insights.
- Abstract(参考訳): 提案手法は,製品の有効性に関する個人的信念を持つ戦略エージェントが,承認を決定するプリンシパルにデータを提出する,プリンシパルエージェントの仮説テストである。
プリンシパルは仮説テストルールを採用し、期待される利益率を最大化するためのエージェントのインセンティブを期待しながら、偽陽性と偽陰性のバランスをとるp値しきい値を選択することを目的としている。
先行研究に基づいて,エージェントの参加と報告行動が主の統計的決定ルールにどのように反応するかをキャプチャするゲーム理論モデルを構築した。
相互作用の複雑さにもかかわらず、効率よく計算可能な臨界p値しきい値で区切られた場合、主成分の誤差は明確な単調な振る舞いを示し、最適p値しきい値の解釈可能なキャラクタリゼーションをもたらす。
我々は、薬物承認に関する公開データを用いて、我々のモデルとこれらの洞察を実証的に検証する。
全体的に、私たちの研究は仮説テストフレームワーク内の戦略的相互作用に関する包括的な視点を提供し、技術的および規制的な洞察を提供します。
関連論文リスト
- Generating Causal Explanations of Vehicular Agent Behavioural Interactions with Learnt Reward Profiles [13.450023647228843]
我々はエージェント間相互作用の説明を因果的に推測できるようなエージェントに対する報酬指標の重み付けを学習する。
3つの実世界の運転データセットに対して定量的かつ定性的にアプローチを検証する。
論文 参考訳(メタデータ) (2025-03-18T01:53:59Z) - PredictaBoard: Benchmarking LLM Score Predictability [50.47497036981544]
大きな言語モデル(LLM)は予測不能に失敗することが多い。
これは、安全なデプロイメントを保証する上で、大きな課題となる。
PredictaBoardは,新しいベンチマークフレームワークである。
論文 参考訳(メタデータ) (2025-02-20T10:52:38Z) - Sharp Results for Hypothesis Testing with Risk-Sensitive Agents [32.38246810091696]
本研究では,統計学者(プリンシパルとしても知られる)がデータを生成する戦略エージェントと相互作用する仮説テストのゲーム理論バージョンについて検討する。
統計学者は、制御されたエラーを伴うテストプロトコルを設計し、データ生成エージェントは、ユーティリティと事前情報によってガイドされ、オプトインするかどうかを選択する。
論文 参考訳(メタデータ) (2024-12-21T02:51:56Z) - Incentive-Theoretic Bayesian Inference for Collaborative Science [59.15962177829337]
未知のパラメータについて、プライベートな先行エージェントが存在する場合の仮説テストについて検討する。
エージェントの戦略行動によって明らかにされる情報を活用する統計的推論を行う方法を示す。
論文 参考訳(メタデータ) (2023-07-07T17:59:01Z) - An active learning method for solving competitive multi-agent decision-making and control problems [1.2430809884830318]
競合エージェントの集団に対する定常行動プロファイルを特定するための,新しいアクティブラーニング手法を提案する。
提案手法は,典型的なマルチエージェント制御と意思決定問題に適用可能であることを示す。
論文 参考訳(メタデータ) (2022-12-23T19:37:39Z) - Domain Adaptation with Adversarial Training on Penultimate Activations [82.9977759320565]
教師なし領域適応(Unsupervised Domain Adaptation, UDA)の重要な目的は、ラベルなし対象データに対するモデル予測の信頼性を高めることである。
我々は,この戦略が,入力画像や中間特徴に対する敵対的訓練よりも予測信頼性を高める目的と,より効率的で相関性が高いことを示す。
論文 参考訳(メタデータ) (2022-08-26T19:50:46Z) - Alternative Microfoundations for Strategic Classification [33.67797984699066]
完全な情報を持つ合理的なエージェントは、決定規則に対する集合的応答において不連続を生じさせることを示す。
標準的なマイクロファウンデーションの下での最適決定ルールは、社会的負担として知られる負の外部性の尺度を最大化する。
我々のモデルは、分析的トラクタビリティを保持し、安定点に関するより堅牢な洞察をもたらし、最適性において社会的負担を低くする。
論文 参考訳(メタデータ) (2021-06-24T00:30:58Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - A General Framework for Distributed Inference with Uncertain Models [14.8884251609335]
異種エージェントのネットワークを用いた分散分類の問題について検討する。
我々は、エージェントの不確実性を可能性に組み込む不確実性モデルの概念に基づいて構築する。
論文 参考訳(メタデータ) (2020-11-20T22:17:12Z) - Catch Me if I Can: Detecting Strategic Behaviour in Peer Assessment [61.24399136715106]
我々は、試験やホームワークの査定や採用・昇進の査定など、様々な査定課題における戦略的行動の課題について考察する。
我々はこのような操作を検出する方法の設計に重点を置いている。
具体的には、エージェントがピアのサブセットを評価し、後に集約されたランキングを最終的な順序付けとして出力する設定について検討する。
論文 参考訳(メタデータ) (2020-10-08T15:08:40Z) - On the model-based stochastic value gradient for continuous
reinforcement learning [50.085645237597056]
モデルベースエージェントは,サンプル効率と最終報酬の両方の観点から,最先端のモデルフリーエージェントより優れていることを示す。
以上の結果から,モデルに基づく政策評価がより注目に値することが示唆された。
論文 参考訳(メタデータ) (2020-08-28T17:58:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。