論文の概要: Addressing Distribution Shift in RTB Markets via Exponential Tilting
- arxiv url: http://arxiv.org/abs/2308.07424v1
- Date: Mon, 14 Aug 2023 19:31:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-16 15:00:18.587159
- Title: Addressing Distribution Shift in RTB Markets via Exponential Tilting
- Title(参考訳): 指数的傾きによるrtb市場の分布変化への対応
- Authors: Minji Kim, Seong Jin Lee, Bumsik Kim
- Abstract要約: 本稿では,データ分散シフトに対処するExTRAアルゴリズムを提案する。
この手法の顕著な利点は、ラベル付きソースデータとラベルなしターゲットデータを使って操作できることである。
実世界のシミュレーションデータを用いて,分布変化の性質を調査し,提案モデルの適用性を評価する。
- 参考スコア(独自算出の注目度): 2.883257292731477
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distribution shift in machine learning models can be a primary cause of
performance degradation. This paper delves into the characteristics of these
shifts, primarily motivated by Real-Time Bidding (RTB) market models. We
emphasize the challenges posed by class imbalance and sample selection bias,
both potent instigators of distribution shifts. This paper introduces the
Exponential Tilt Reweighting Alignment (ExTRA) algorithm, as proposed by Marty
et al. (2023), to address distribution shifts in data. The ExTRA method is
designed to determine the importance weights on the source data, aiming to
minimize the KL divergence between the weighted source and target datasets. A
notable advantage of this method is its ability to operate using labeled source
data and unlabeled target data. Through simulated real-world data, we
investigate the nature of distribution shift and evaluate the applicacy of the
proposed model.
- Abstract(参考訳): 機械学習モデルにおける分散シフトは、パフォーマンス劣化の主な原因である。
本稿では,RTB(Real-Time Bidding)市場モデルを中心に,これらのシフトの特徴を考察する。
我々は,クラス不均衡とサンプル選択バイアスによって引き起こされる課題を強調した。
本稿では,データ分散シフトに対応するために,Marty et al. (2023) が提案した Exponential Tilt Reweighting Alignment (ExTRA) アルゴリズムを提案する。
ExTRA法は、重み付きソースとターゲットデータセット間のKLばらつきを最小限に抑え、ソースデータに対する重み付けの重要度を決定するように設計されている。
この手法の顕著な利点は、ラベル付きソースデータとラベルなしターゲットデータを使って操作できることである。
実世界のシミュレーションデータを用いて分布シフトの性質を調査し,提案モデルの適用性を評価する。
関連論文リスト
- Estimating calibration error under label shift without labels [47.57286245320775]
既存のCE推定器は、ターゲットドメインからのラベルへのアクセスを前提としており、実際には利用できないことが多い。
本研究は、ラベルシフト中の新しいCE推定器を提案し、ソースとターゲットの分布間の条件付き$p(X|Y)$定数を維持しながら、境界ラベル分布の$p(Y)$の変化を特徴とする。
我々の貢献は、ラベル付きソース分布の重要度再重み付けを活用することによって、シフトしたターゲット分布に対する一貫性と偏りのないCE推定を提供するアプローチである。
論文 参考訳(メタデータ) (2023-12-14T01:18:51Z) - Aggregation Weighting of Federated Learning via Generalization Bound
Estimation [65.8630966842025]
フェデレートラーニング(FL)は通常、サンプル比率によって決定される重み付けアプローチを使用して、クライアントモデルパラメータを集約する。
上記の重み付け法を,各局所モデルの一般化境界を考慮した新しい戦略に置き換える。
論文 参考訳(メタデータ) (2023-11-10T08:50:28Z) - Dr. FERMI: A Stochastic Distributionally Robust Fair Empirical Risk
Minimization Framework [12.734559823650887]
分散シフトが存在する場合、公正な機械学習モデルはテストデータに対して不公平に振る舞うことがある。
既存のアルゴリズムはデータへの完全なアクセスを必要とし、小さなバッチを使用する場合には使用できない。
本稿では,因果グラフの知識を必要としない収束保証付き分布安定度フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-20T23:25:28Z) - Chasing Fairness Under Distribution Shift: A Model Weight Perturbation
Approach [72.19525160912943]
まず,分布シフト,データ摂動,モデルウェイト摂動の関連性を理論的に検証した。
次に、ターゲットデータセットの公平性を保証するのに十分な条件を分析します。
これらの十分な条件により、ロバストフェアネス正則化(RFR)を提案する。
論文 参考訳(メタデータ) (2023-03-06T17:19:23Z) - Accuracy on the Line: On the Strong Correlation Between
Out-of-Distribution and In-Distribution Generalization [89.73665256847858]
分布外性能は,広範囲なモデルと分布シフトに対する分布内性能と強く相関していることを示す。
具体的には,CIFAR-10 と ImageNet の変種に対する分布内分布と分布外分布性能の強い相関関係を示す。
また,CIFAR-10-Cと組織分類データセットCamelyon17-WILDSの合成分布の変化など,相関が弱いケースについても検討した。
論文 参考訳(メタデータ) (2021-07-09T19:48:23Z) - Mandoline: Model Evaluation under Distribution Shift [8.007644303175395]
マシンラーニングモデルは、トレーニングや検証対象と異なる設定でデプロイされることが多い。
これらの問題を緩和する新しい評価フレームワークであるMandolineを開発した。
ユーザーは単純な"スライシング関数" - ノイズがあり、分散シフトの可能な軸をキャプチャすることを目的とした、潜在的に相関したバイナリ関数を書く。
論文 参考訳(メタデータ) (2021-07-01T17:57:57Z) - Robust Generalization despite Distribution Shift via Minimum
Discriminating Information [46.164498176119665]
我々は、トレーニングデータに加えて、シフトしたテスト分布に関する部分的な構造的知識を持つモデリングフレームワークを導入する。
我々は、利用可能な事前知識を埋め込むために、最小限の識別情報の原則を用いる。
未知のシフト分布に関する明示的な一般化境界を得る。
論文 参考訳(メタデータ) (2021-06-08T15:25:35Z) - WILDS: A Benchmark of in-the-Wild Distribution Shifts [157.53410583509924]
分散シフトは、ワイルドにデプロイされた機械学習システムの精度を実質的に低下させることができる。
分散シフトの多様な範囲を反映した8つのベンチマークデータセットのキュレーションコレクションであるWILDSを紹介します。
本研究は, 標準訓練の結果, 分布性能よりも, 分布域外性能が有意に低下することを示す。
論文 参考訳(メタデータ) (2020-12-14T11:14:56Z) - Learning Invariant Representations and Risks for Semi-supervised Domain
Adaptation [109.73983088432364]
半教師付きドメイン適応(Semi-DA)の設定の下で不変表現とリスクを同時に学習することを目的とした最初の手法を提案する。
共同で textbfLearning textbfInvariant textbfRepresentations と textbfRisks の LIRR アルゴリズムを導入する。
論文 参考訳(メタデータ) (2020-10-09T15:42:35Z) - Estimating Generalization under Distribution Shifts via Domain-Invariant
Representations [75.74928159249225]
未知の真のターゲットラベルのプロキシとして、ドメイン不変の予測器のセットを使用します。
結果として生じるリスク見積の誤差は、プロキシモデルのターゲットリスクに依存する。
論文 参考訳(メタデータ) (2020-07-06T17:21:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。