論文の概要: Policy-Aware Design of Large-Scale Factorial Experiments
- arxiv url: http://arxiv.org/abs/2604.08804v1
- Date: Thu, 09 Apr 2026 22:39:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.60195
- Title: Policy-Aware Design of Large-Scale Factorial Experiments
- Title(参考訳): 大規模因子実験の政策意識設計
- Authors: Xin Wen, Xi Chen, Will Wei Sun, Yichen Zhang,
- Abstract要約: 重なり合う実験は、分散A/Bテストによって処理が不十分な相互作用効果を生成することができる。
本研究の目的は,全ての治療効果を見積もらない場合に,大規模な因子分析実験を設計する方法を検討することである。
重なり合う実験を1つの因数分解問題に集約し,低ランクテンソルとして期待される結果をモデル化する2段階設計を提案する。
- 参考スコア(独自算出の注目度): 10.530820072207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Digital firms routinely run many online experiments on shared user populations. When product decisions are compositional, such as combinations of interface elements, flows, messages, or incentives, the number of feasible interventions grows combinatorially, while available traffic remains limited. Overlapping experiments can therefore generate interaction effects that are poorly handled by decentralized A/B testing. We study how to design large-scale factorial experiments when the objective is not to estimate every treatment effect, but to identify a high-performing policy under a fixed experimentation budget. We propose a two-stage design that centralizes overlapping experiments into a single factorial problem and models expected outcomes as a low-rank tensor. In the first stage, the platform samples a subset of intervention combinations, uses tensor completion to infer performance on untested combinations, and eliminates weak factor levels using estimated marginal contributions. In the second stage, it applies sequential halving to the surviving combinations to select a final policy. We establish gap-independent simple-regret bounds and gap-dependent identification guarantees showing that the relevant complexity scales with the degrees of freedom of the low-rank tensor and the separation structure across factor levels, rather than the full factorial size. In an offline evaluation based on a product-bundling problem constructed from 100 million Taobao interactions, the proposed method substantially outperforms one-shot tensor completion and unstructured best-arm benchmarks, especially in low-budget and high-noise settings. These results show how centralized, policy-aware experimentation can make combinatorial product design operationally feasible at platform scale.
- Abstract(参考訳): デジタル企業は、共有ユーザ人口に関する多くのオンライン実験を定期的に実施している。
インターフェース要素、フロー、メッセージ、インセンティブの組み合わせなど、製品決定が構成的であれば、利用可能なトラフィックが制限されたまま、実現可能な介入の数は組合せ的に増加する。
重なり合う実験は、分散A/Bテストによって処理が不十分な相互作用効果を生成することができる。
本研究の目的は、全ての治療効果を見積もるのではなく、固定的な実験予算の下で高いパフォーマンスの政策を特定することにある。
重なり合う実験を1つの因数分解問題に集約し,低ランクテンソルとして期待される結果をモデル化する2段階設計を提案する。
第1段階では、プラットフォームは介入結合のサブセットをサンプリングし、テンソル補完を用いて未検証結合の性能を推定し、推定限界寄与を用いて弱い因子レベルを除去する。
第2段階では、最後のポリシーを選択するために、生き残った組み合わせに順次半減する。
ギャップ非依存の単純回帰境界とギャップ依存の識別保証を確立することで、関連する複雑性が、低ランクテンソルの自由度と分解構造とでスケールすることを示す。
1億万のタオバオ相互作用から構築された製品バンドル問題に基づくオフライン評価において、提案手法は、特に低予算・高雑音設定において、単発テンソル完了と非構造ベストアームベンチマークを大幅に上回る。
これらの結果から,集中的かつ政策対応的な実験が,プラットフォーム規模で組み合わせた製品設計を運用的に実現できることが示唆された。
関連論文リスト
- Towards Reliable Social A/B Testing: Spillover-Contained Clustering with Robust Post-Experiment Analysis [11.30339991179317]
A/Bテストはオンラインプラットフォームにおける意思決定の基礎であるが、ソーシャル製品はネットワークの干渉に悩まされることが多い。
本稿では,2段階のこぼこぼこ込みを伴う実験フレームワークを提案する。
当社のアプローチは,数億のユーザを対象とするプラットフォームであるKuaishou上での大規模ソーシャル共有実験を通じて検証する。
論文 参考訳(メタデータ) (2026-02-09T12:08:29Z) - Q-function Decomposition with Intervention Semantics with Factored Action Spaces [51.01244229483353]
元の作用空間の低次元射影部分空間上で定義されるQ-函数を考察し、分解されたQ-函数の不偏性について考察する。
これにより、標準モデルフリー強化学習アルゴリズムにおいて、予測Q関数を用いてQ関数を近似する動作分解強化学習と呼ばれる一般的なスキームが導かれる。
論文 参考訳(メタデータ) (2025-04-30T05:26:51Z) - Efficient Biological Data Acquisition through Inference Set Design [3.9633147697178996]
本研究は,システム全体としての所望の精度を実現するため,最小の候補群を選択することを目的とする。
本稿では,このメカニズムを推論セット設計と呼び,信頼性に基づくアクティブラーニングソリューションを用いて,挑戦的な事例を抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-10-25T15:34:03Z) - Data-light Uncertainty Set Merging with Admissibility [5.140740197135575]
本稿では、多種多様かつ潜在的に依存する不確実性集合を単一の統一集合にマージする、Synthetics, Aggregation, and Test Inversion (SAT) アプローチを紹介する。
SATは初期セットと制御レベルのみが利用可能である場合、不確実セットを統合するという課題によって動機付けられている。
主要な理論的貢献はSATの特性の厳密な解析であり、決定論的集合の融合の文脈における許容性を含む。
論文 参考訳(メタデータ) (2024-10-16T03:52:47Z) - Adaptive Experimentation When You Can't Experiment [55.86593195947978]
本稿では,Emphcon founded the pure exploration transductive linear bandit (textttCPET-LB) problem。
オンラインサービスは、ユーザーを特定の治療にインセンティブを与える、適切にランダム化された励ましを利用することができる。
論文 参考訳(メタデータ) (2024-06-15T20:54:48Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Enhanced Principal Component Analysis under A Collaborative-Robust
Framework [89.28334359066258]
重み学習とロバストな損失を非自明な方法で組み合わせる,一般的な協調ロバスト重み学習フレームワークを提案する。
提案されたフレームワークでは、トレーニング中の重要度を示す適切なサンプルの一部のみがアクティブになり、エラーが大きい他のサンプルは無視されません。
特に、不活性化試料の負の効果はロバスト損失関数によって軽減される。
論文 参考訳(メタデータ) (2021-03-22T15:17:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。