論文の概要: Optimizing Social Utility in Sequential Experiments
- arxiv url: http://arxiv.org/abs/2605.06520v1
- Date: Thu, 07 May 2026 16:28:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.994911
- Title: Optimizing Social Utility in Sequential Experiments
- Title(参考訳): 連続実験における社会的ユーティリティの最適化
- Authors: Ander Artola Velasco, Stratis Tsirtsis, Manuel Gomez-Rodriguez,
- Abstract要約: 本稿では,製品開発業者がランダム化比較試験を順次実施し,規制当局がその費用の一部を補助する統計プロトコルを提案する。
信念マルコフ決定プロセスを用いてプロトコルをモデル化することにより、エージェントの最適な戦略を動的プログラミングを用いて効率的に見つけることができることを示す。
我々のプロトコルは、標準的な非シーケンスプロトコルと比較して、$35$%以上のソーシャルユーティリティを向上するために使用することができる。
- 参考スコア(独自算出の注目度): 11.795056270534287
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Regulatory approval of products in high-stakes domains such as drug development requires statistical evidence of safety and efficacy through large-scale randomized controlled trials. However, the high financial cost of these trials may deter developers who lack absolute certainty in their product's efficacy, ultimately stifling the development of `moonshot' products that could offer high social utility. To address this inefficiency, in this paper, we introduce a statistical protocol for experimentation where the product developer (the agent) conducts a randomized controlled trial sequentially and the regulator (the principal) partially subsidizes its cost. By modeling the protocol using a belief Markov decision process, we show that the agent's optimal strategy can be found efficiently using dynamic programming. Further, we show that the social utility is a piecewise linear and convex function over the subsidy level the principal selects, and thus the socially optimal subsidy can also be found efficiently using divide-and-conquer. Simulation experiments using publicly available data on antibiotic development and approval demonstrate that our statistical protocol can be used to increase social utility by more than $35$$\%$ relative to standard, non-sequential protocols.
- Abstract(参考訳): 医薬品開発のような高額な領域における製品の規制的承認には、大規模なランダム化試験による安全性と有効性の統計的証拠が必要である。
しかし、これらのトライアルの高額な費用は、製品の有効性の絶対的な確実性に欠ける開発者を妨げ、最終的には高いソーシャルユーティリティを提供する「ムーンショット」製品の開発を阻害する可能性がある。
そこで本研究では,製品開発業者(エージェント)がランダム化制御試験を順次実施し,規制当局(プリンシパル)がそのコストの一部を補助する,実験用統計プロトコルを提案する。
信念マルコフ決定プロセスを用いてプロトコルをモデル化することにより、エージェントの最適な戦略を動的プログラミングを用いて効率的に見つけることができることを示す。
さらに, 社会的効用は主選択した助成レベルに対する一括線形凸関数であり, 配当を用いて社会的に最適な助成関数を効率よく見つけることができることを示す。
抗生物質開発および承認に関する公開データを用いたシミュレーション実験により,我々の統計プロトコルは,標準的な非逐次プロトコルと比較して,35ドル以上の社会利用率向上に有効であることが実証された。
関連論文リスト
- Budget-aware Test-time Scaling via Discriminative Verification [29.169164125933538]
テスト時間のスケーリングは、複雑な推論タスクにおいて、大きな言語モデルのパフォーマンスを高めるための強力な戦略です。
この作業では、焦点をより予算対応のパラダイム、差別的検証にシフトします。
固定された計算予算の下では、このハイブリッドアプローチは最先端の生成検証をかなりの差で上回る。
論文 参考訳(メタデータ) (2025-10-16T17:30:02Z) - Profit over Proxies: A Scalable Bayesian Decision Framework for Optimizing Multi-Variant Online Experiments [0.0352925259310339]
オンライン制御実験(A/Bテスト)は、デジタル経済におけるデータ駆動型意思決定の基礎である。
p-value"は偽陽性率を膨らませ、変換レートのようなプロキシメトリクスへの過度な依存は、必然的にビジネスの黒字化を損なう決定につながる可能性がある。
本稿では,多変量(A/B/n)実験における利益最適化を目的とした包括的かつスケーラブルなベイズ決定フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-16T02:24:20Z) - Cost-aware Stopping for Bayesian Optimization [46.95172329282389]
本稿では,様々な評価コストに適応し,チューニングが不要なベイズ最適化のためのコスト対応停止則を提案する。
我々は,最先端の取得関数と組み合わせた場合,停止規則によって得られる期待累積評価コストを拘束する理論的な保証を証明した。
論文 参考訳(メタデータ) (2025-07-16T17:54:14Z) - Cost-Optimal Active AI Model Evaluation [71.2069549142394]
生成AIシステムの開発には、継続的な評価、データ取得、アノテーションが必要である。
我々は、安価だがしばしば不正確で弱いレーダの使用を積極的にバランスさせる新しいコスト認識手法を開発した。
我々は、弱者と強者の間で所定のアノテーション予算を割り当てるためのコスト最適化政策のファミリーを導出する。
論文 参考訳(メタデータ) (2025-06-09T17:14:41Z) - Probabilistic Conformal Prediction with Approximate Conditional Validity [81.30551968980143]
本研究では,共形手法の柔軟性と条件分布の推定を組み合わせ,予測セットを生成する手法を開発した。
我々の手法は、条件付きカバレッジの観点から既存の手法よりも一貫して優れています。
論文 参考訳(メタデータ) (2024-07-01T20:44:48Z) - Ranking by Lifts: A Cost-Benefit Approach to Large-Scale A/B Tests [0.0]
A/Bテストは、特にデジタルプラットフォームや市場において、ビジネス実験における意思決定のための中核的なツールである。
本稿では、コスト重み付き偽発見率(FDR)の制約を受けることにより、期待される利益を最大化する決定論的枠組みを開発する。
提案手法は, 提案手法を用いて, 予測昇降率とコストとの比に基づいて実験をランク付けし, 局所的偽発見率(lfdr)を重要な統計量として組み込んだ実験ベイズ手法を提案する。
論文 参考訳(メタデータ) (2024-07-01T07:40:08Z) - Principal-Agent Hypothesis Testing [54.154244569974864]
我々は、規制当局(プリンシパル)と医薬品会社のような実験者(エージェント)との関係を考察する。
医薬品の有効性は規制当局に知られていないため、医薬品会社は規制当局に有効性を証明するために費用がかかる裁判を行わなければならない。
エージェントの戦略行動に頑健なプロトコルを設計する方法を示し、戦略参加者の存在下で最適なプロトコルを導出する。
論文 参考訳(メタデータ) (2022-05-13T17:59:23Z) - Reinforcement Learning with Efficient Active Feature Acquisition [59.91808801541007]
実生活では、情報取得は患者の医療検査に該当する可能性がある。
本稿では,アクティブな特徴獲得ポリシーを学習するモデルに基づく強化学習フレームワークを提案する。
この成功の鍵は、部分的に観察された状態から高品質な表現を学ぶ新しい逐次変分自動エンコーダである。
論文 参考訳(メタデータ) (2020-11-02T08:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。