論文の概要: Pairwise Ranking Losses of Click-Through Rates Prediction for Welfare
Maximization in Ad Auctions
- arxiv url: http://arxiv.org/abs/2306.01799v1
- Date: Thu, 1 Jun 2023 15:42:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-07 00:08:47.961993
- Title: Pairwise Ranking Losses of Click-Through Rates Prediction for Welfare
Maximization in Ad Auctions
- Title(参考訳): 広告オークションにおける福祉最大化のためのクリックスルー率予測の対数ランキング損失
- Authors: Boxiang Lyu, Zhe Feng, Zachary Robertson, Sanmi Koyejo
- Abstract要約: 本稿では,クリックスルーレート(CTR)における損失関数の設計と,広告オークションにおける社会的福祉の最適化について検討する。
そこで本研究では,CTRモデルのトレーニングを行うために,新しい重み付きランクロスを提案する。
合成および実世界のデータにおける損失の利点を実証する。
- 参考スコア(独自算出の注目度): 12.67468905841272
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study the design of loss functions for click-through rates (CTR) to
optimize (social) welfare in advertising auctions. Existing works either only
focus on CTR predictions without consideration of business objectives (e.g.,
welfare) in auctions or assume that the distribution over the participants'
expected cost-per-impression (eCPM) is known a priori, then use various
additional assumptions on the parametric form of the distribution to derive
loss functions for predicting CTRs. In this work, we bring back the welfare
objectives of ad auctions into CTR predictions and propose a novel weighted
rankloss to train the CTR model. Compared to existing literature, our approach
provides a provable guarantee on welfare but without assumptions on the eCPMs'
distribution while also avoiding the intractability of naively applying
existing learning-to-rank methods. Further, we propose a theoretically
justifiable technique for calibrating the losses using labels generated from a
teacher network, only assuming that the teacher network has bounded $\ell_2$
generalization error. Finally, we demonstrate the advantages of the proposed
loss on synthetic and real-world data.
- Abstract(参考訳): 本稿では,クリックスルーレート(CTR)における損失関数の設計と,広告オークションにおける社会福祉の最適化について検討する。
既存の作業は、オークションにおけるビジネス目的(例えば、福祉)を考慮せずにCTRの予測にのみ焦点をあてるか、または、参加者の期待するコスト・パー・プレッション(eCPM)の分布が予め知られていると仮定するかのいずれかであり、CTRの予測のための損失関数を導出するために、分布のパラメトリックな形式に関する様々な仮定を用いる。
本研究では,広告オークションの福祉目的をCTR予測に戻すとともに,CTRモデルをトレーニングするための新たなランクロスを提案する。
既存の文献と比較して,本手法は,eCPMの分布を前提とせず,既存の学習からランクへの手法の適用の難しさを回避しつつ,福祉の保証を提供する。
さらに,教師ネットワークが$\ell_2$一般化誤差を持つことを前提として,教師ネットワークから生成したラベルを用いて損失を校正する理論的正当化手法を提案する。
最後に,提案する合成データおよび実世界のデータに対する損失の利点を示す。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - Conformal Online Auction Design [6.265829744417118]
COADは入札者とアイテム機能の両方を取り入れ、オンラインオークションのインセンティブ互換メカニズムを提供する。
この手法は、共形予測手法を用いて、分布のない予測間隔に基づくアプローチを採用する。
COADは、ランダムフォレスト、カーネルメソッド、ディープニューラルネットを含む、幅広い現代的な機械学習手法の使用を認めている。
論文 参考訳(メタデータ) (2024-05-11T15:28:25Z) - Adversarial Reweighting with $α$-Power Maximization for Domain Adaptation [56.859005008344276]
我々は、$alpha$-Power Maximization (ARPM) を用いたAdversarial Reweightingと呼ばれる新しいアプローチを提案する。
本稿では,ソースプライマリなクラスサンプルを特定するために,逆向きにソースドメインデータを再重み付けすることを学習する,新しい逆方向再重み付けモデルを提案する。
提案手法は最近のPDA法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-26T09:29:55Z) - Ranking with Abstention [27.3569897539488]
そこで本研究では,学習者が限られたコストで予測を行うのを阻止できる,控えめなランキングの枠組みを紹介した。
線形関数の族と1つの隠れ層を持つニューラルネットワークの両方に対して、一連の$H$一貫性境界を示す。
論文 参考訳(メタデータ) (2023-07-05T05:37:13Z) - Inference-time Stochastic Ranking with Risk Control [19.20938164194589]
ランク付け方法の学習はオンライン経済において不可欠であり、ユーザやアイテムプロバイダに影響を与える。
本稿では,事前学習されたスコアリング関数に対して,保証されたユーティリティや公平さで推論時にランク付けを行う新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-12T15:44:58Z) - Benefits of Permutation-Equivariance in Auction Mechanisms [90.42990121652956]
競売人の収益を最大化しつつ、競売人の過去の後悔を最小限にする競売メカニズムは、経済学において重要であるが複雑な問題である。
ニューラルネットワークによる最適なオークションメカニズムの学習を通じて、注目すべき進歩が達成されている。
論文 参考訳(メタデータ) (2022-10-11T16:13:25Z) - Rethinking Position Bias Modeling with Knowledge Distillation for CTR
Prediction [8.414183573280779]
本研究では,位置バイアスの影響を緩和し,位置情報を活用してCTR予測を改善する知識蒸留フレームワークを提案する。
提案手法は現実世界のオンライン広告システムに展開され、世界最大の電子商取引プラットフォームの1つで主要なトラフィックを提供する。
論文 参考訳(メタデータ) (2022-04-01T07:58:38Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Arbitrary Distribution Modeling with Censorship in Real-Time Bidding
Advertising [2.562910030418378]
インベントリプライシングの目的は、オンライン広告の機会に適切な価格を入札することであり、これはデマンド・サイド・プラットフォーム(DSP)がリアルタイム入札(RTB)で競売に勝つために不可欠である。
以前の作品の多くは、勝利価格の分布形式を強く仮定し、その正確さを減らし、一般化する能力を弱めた。
我々は,新たな損失関数であるNLL(Neighborhood Likelihood Loss)を提案し,検閲下での勝利価格分布を予測するためのフレームワークであるArbitrary Distribution Modeling(ADM)と協調する。
論文 参考訳(メタデータ) (2021-10-26T11:40:00Z) - Off-policy Reinforcement Learning with Optimistic Exploration and
Distribution Correction [73.77593805292194]
我々は、政治以外のアクター批判的枠組みにおいて、批評家のほぼ上位信頼度を最大化するために、別の調査政策を訓練する。
最近導入されたDICEフレームワークを応用して、非政治アクター犯罪訓練のための分布補正比を学習する。
論文 参考訳(メタデータ) (2021-10-22T22:07:51Z) - Online Learning of Competitive Equilibria in Exchange Economies [94.24357018178867]
経済学では、複数の有理エージェント間の資源不足の共有は古典的な問題である。
エージェントの好みを学習するためのオンライン学習機構を提案する。
数値シミュレーションにより,本機構の有効性を実証する。
論文 参考訳(メタデータ) (2021-06-11T21:32:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。