論文の概要: Choosing the Better Bandit Algorithm under Data Sharing: When Do A/B Experiments Work?
- arxiv url: http://arxiv.org/abs/2507.11891v1
- Date: Wed, 16 Jul 2025 04:14:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.218549
- Title: Choosing the Better Bandit Algorithm under Data Sharing: When Do A/B Experiments Work?
- Title(参考訳): データ共有下での帯域幅アルゴリズムの選択: A/B実験はいつうまくいくか?
- Authors: Shuangning Li, Chonghuan Wang, Jingyan Wang,
- Abstract要約: 本研究では,2つの推薦アルゴリズムの性能を比較するためのA/B実験について検討する。
処理および制御アルゴリズムの下でのユニットはデータの共有プールに寄与し、後に両方のアルゴリズムを訓練し、2つのグループ間の干渉を引き起こす。
我々は、この知見を多武装の盗聴フレームワークで定式化し、データ共有における予測GTE推定の符号が真のGTEの符号と一致しているか矛盾するかを理論的に特徴付ける。
- 参考スコア(独自算出の注目度): 5.113739955215433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study A/B experiments that are designed to compare the performance of two recommendation algorithms. Prior work has shown that the standard difference-in-means estimator is biased in estimating the global treatment effect (GTE) due to a particular form of interference between experimental units. Specifically, units under the treatment and control algorithms contribute to a shared pool of data that subsequently train both algorithms, resulting in interference between the two groups. The bias arising from this type of data sharing is known as "symbiosis bias". In this paper, we highlight that, for decision-making purposes, the sign of the GTE often matters more than its precise magnitude when selecting the better algorithm. We formalize this insight under a multi-armed bandit framework and theoretically characterize when the sign of the expected GTE estimate under data sharing aligns with or contradicts the sign of the true GTE. Our analysis identifies the level of exploration versus exploitation as a key determinant of how symbiosis bias impacts algorithm selection.
- Abstract(参考訳): 本研究では,2つの推薦アルゴリズムの性能を比較するためのA/B実験について検討する。
従来の研究では、標準差分推定器は、実験単位間の特定の干渉形態により、大域的処理効果(GTE)を推定する際に偏っていることが示されている。
具体的には、処理と制御アルゴリズムの下のユニットはデータの共有プールに寄与し、その後に両方のアルゴリズムを訓練し、2つのグループ間の干渉を引き起こす。
このタイプのデータ共有から生じるバイアスは「共生バイアス」として知られている。
本稿では、意思決定のために、GTEの符号がより良いアルゴリズムを選択する際の精度よりも重要であることを強調する。
我々は、この知見を多武装の盗聴フレームワークで定式化し、データ共有における予測GTE推定の符号が真のGTEの符号と一致しているか矛盾するかを理論的に特徴付ける。
本分析では,共生バイアスがアルゴリズム選択にどのように影響するかを決定づける重要な要因として,探索と搾取のレベルを特定した。
関連論文リスト
- ClusterUCB: Efficient Gradient-Based Data Selection for Targeted Fine-Tuning of LLMs [22.68421108740517]
本稿では、クラスタリングと修正されたアッパー信頼境界(UCB)アルゴリズムを用いた効率的な勾配に基づくデータ選択フレームワークを提案する。
各種ベンチマーク実験の結果,提案フレームワークであるClusterUCBは,従来の勾配に基づくデータ選択法と同等の結果が得られることがわかった。
論文 参考訳(メタデータ) (2025-06-12T01:53:01Z) - Inference of Causal Networks using a Topological Threshold [0.10241134756773226]
本稿では,因果関係しきい値を自動的に決定する制約に基づくアルゴリズムを提案する。
このアルゴリズムは一般にPCアルゴリズムよりも高速で精度が高いことを示す。
論文 参考訳(メタデータ) (2024-04-21T21:56:39Z) - Enhancing Adversarial Robustness in Low-Label Regime via Adaptively
Weighted Regularization and Knowledge Distillation [1.675857332621569]
ラベル付きデータが少ない半教師付き対人訓練について検討した。
提案する正則化項と知識蒸留を組み合わせた半教師付き対角訓練アルゴリズムを開発した。
提案アルゴリズムは,既存のアルゴリズムと比較して,最先端の性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-08-08T05:48:38Z) - Influence of Swarm Intelligence in Data Clustering Mechanisms [0.0]
自然にインスパイアされたSwarmベースのアルゴリズムは、データの欠如と一貫性のない大規模なデータセットに対処するために、データクラスタリングに使用される。
本稿では、これらの新しいアプローチの性能を概観し、問題のある状況に最適な方法の比較を行う。
論文 参考訳(メタデータ) (2023-05-07T08:40:50Z) - A Gold Standard Dataset for the Reviewer Assignment Problem [70.45113777449373]
類似度スコア(Similarity score)とは、論文のレビューにおいて、レビュアーの専門知識を数値で見積もるものである。
既存のアルゴリズムを比較し、より良いアルゴリズムを開発する上で重要な課題は、公開された金標準データの欠如である。
研究コミュニティにリリースした類似度スコアの新しいデータセットを収集します。
論文 参考訳(メタデータ) (2023-03-23T16:15:03Z) - Valid Inference After Causal Discovery [73.87055989355737]
我々は、因果関係発見後の推論に有効なツールを開発する。
因果発見とその後の推論アルゴリズムの組み合わせは,高度に膨らんだ誤発見率をもたらすことを示す。
論文 参考訳(メタデータ) (2022-08-11T17:40:45Z) - D-BIAS: A Causality-Based Human-in-the-Loop System for Tackling
Algorithmic Bias [57.87117733071416]
D-BIASは、人間のループ内AIアプローチを具現化し、社会的バイアスを監査し軽減する視覚対話型ツールである。
ユーザは、因果ネットワークにおける不公平な因果関係を識別することにより、グループに対する偏見の存在を検出することができる。
それぞれのインタラクション、例えばバイアスのある因果縁の弱体化/削除は、新しい(偏りのある)データセットをシミュレートするために、新しい方法を用いている。
論文 参考訳(メタデータ) (2022-08-10T03:41:48Z) - Mean-based Best Arm Identification in Stochastic Bandits under Reward
Contamination [80.53485617514707]
本稿では,ギャップベースアルゴリズムと逐次除去に基づく2つのアルゴリズムを提案する。
具体的には、ギャップベースのアルゴリズムでは、サンプルの複雑さは定数要素まで最適であり、連続的な除去では対数因子まで最適である。
論文 参考訳(メタデータ) (2021-11-14T21:49:58Z) - Dynamic Selection in Algorithmic Decision-making [9.172670955429906]
本稿では,内因性データを用いたオンライン学習アルゴリズムにおいて,動的選択問題を特定し,対処する。
データの内在性が決定の選択に影響を与えるため、新しいバイアス(自己充足バイアス)が発生する。
バイアスを補正するインストゥルメンタル変数ベースのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-08-28T01:41:37Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - Towards causal benchmarking of bias in face analysis algorithms [54.19499274513654]
顔分析アルゴリズムのアルゴリズムバイアスを測定する実験手法を開発した。
提案手法は,一致したサンプル画像の合成トランスクター'を生成することに基づく。
性別分類アルゴリズムの偏見を従来の観察法を用いて分析することにより,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2020-07-13T17:10:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。