論文の概要: Statistical Learning from Attribution Sets
- arxiv url: http://arxiv.org/abs/2602.06276v1
- Date: Fri, 06 Feb 2026 00:27:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.165742
- Title: Statistical Learning from Attribution Sets
- Title(参考訳): 属性集合からの統計的学習
- Authors: Lorne Applebaum, Robert Busa-Fekete, August Y. Chen, Claudio Gentile, Tomer Koren, Aryan Mokhtari,
- Abstract要約: プライバシ制約下での広告ドメインにおける変換予測モデルのトレーニングの問題に対処する。
プライバシ保護ブラウザAPIとサードパーティクッキーの非推奨化を動機として,学習者が一連のクリックと一連の変換を観察する環境について検討する。
我々はこれを、候補者に対する事前分布を備えた不愉快な敵が生成した帰属集合からの学習として定式化する。
- 参考スコア(独自算出の注目度): 38.149441146737615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We address the problem of training conversion prediction models in advertising domains under privacy constraints, where direct links between ad clicks and conversions are unavailable. Motivated by privacy-preserving browser APIs and the deprecation of third-party cookies, we study a setting where the learner observes a sequence of clicks and a sequence of conversions, but can only link a conversion to a set of candidate clicks (an attribution set) rather than a unique source. We formalize this as learning from attribution sets generated by an oblivious adversary equipped with a prior distribution over the candidates. Despite the lack of explicit labels, we construct an unbiased estimator of the population loss from these coarse signals via a novel approach. Leveraging this estimator, we show that Empirical Risk Minimization achieves generalization guarantees that scale with the informativeness of the prior and is also robust against estimation errors in the prior, despite complex dependencies among attribution sets. Simple empirical evaluations on standard datasets suggest our unbiased approach significantly outperforms common industry heuristics, particularly in regimes where attribution sets are large or overlapping.
- Abstract(参考訳): 我々は、広告クリックと変換の間の直接リンクが利用できないプライバシー制約の下で、広告ドメインにおける変換予測モデルをトレーニングする問題に対処する。
プライバシ保護ブラウザAPIとサードパーティクッキーの非推奨化を動機として,学習者が一連のクリックと一連の変換を観察する環境について検討するが,変換はユニークな情報源ではなく,一連の候補クリック(属性セット)にのみリンクできる。
我々はこれを、候補者に対する事前分布を備えた不愉快な敵が生成した帰属集合からの学習として定式化する。
明示的なラベルの欠如にもかかわらず、我々はこれらの粗い信号からの人口損失の偏りのない推定器を、新しいアプローチで構築する。
この推定器を用いて,経験的リスク最小化は,事前の情報量に比例したスケールの一般化を保証するとともに,帰属集合間の複雑な依存関係にもかかわらず,先行推定誤差に対して頑健であることを示す。
標準データセットに対する単純な経験的評価は、我々の偏見のないアプローチが、一般的な業界ヒューリスティックス、特に属性セットが大きい、あるいは重複しているレジームを著しく上回っていることを示唆している。
関連論文リスト
- A Causal Information-Flow Framework for Unbiased Learning-to-Rank [52.54102347581931]
Web検索とレコメンデーションシステムでは、ユーザクリックがランキングモデルのトレーニングに広く使用されている。
本稿では,Unbiased Learning-to-Rankを拡張する因果学習に基づく新たなランキングフレームワークを提案する。
本手法は測定されたバイアスリークを一貫して低減し,ランキング性能を向上させる。
論文 参考訳(メタデータ) (2026-01-09T07:19:35Z) - Class-Conditional Distribution Balancing for Group Robust Classification [11.525201208566925]
間違った理由からモデルが正しい予測に導かれるような豪華な相関関係は、堅牢な現実世界の一般化にとって重要な課題である。
クラス-条件分布における不均衡やミスマッチとして、突発的な相関を緩和することで、新しい視点を提供する。
本稿では,バイアスアノテーションと予測の両方を必要としない,シンプルで効果的な頑健な学習手法を提案する。
論文 参考訳(メタデータ) (2025-04-24T07:15:53Z) - Probabilistic Test-Time Generalization by Variational Neighbor-Labeling [62.158807685159736]
本稿では、ドメインの一般化を試み、モデルが未確認のターゲットドメインにデプロイされる前に、ソースドメインにのみトレーニングされる。
ソーストレーニングされたモデルをテスト時にターゲットドメインに一般化するための、ターゲットサンプルの擬似ラベル化の確率。
より堅牢な擬似ラベルを生成するために、近隣のターゲットサンプルの情報を含む変分隣接ラベル。
論文 参考訳(メタデータ) (2023-07-08T18:58:08Z) - Correcting Underrepresentation and Intersectional Bias for Classification [49.1574468325115]
我々は、表現不足のバイアスによって破損したデータから学習する問題を考察する。
偏りのないデータの少ない場合、グループワイドのドロップアウト率を効率的に推定できることが示される。
本アルゴリズムは,有限VC次元のモデルクラスに対して,効率的な学習を可能にする。
論文 参考訳(メタデータ) (2023-06-19T18:25:44Z) - Look Beyond Bias with Entropic Adversarial Data Augmentation [4.893694715581673]
ディープニューラルネットワークは、スパイラルパターンと因果パターンを区別せず、他を無視しながら最も予測的なパターンのみを学ぶ。
ネットワークをこのような刺激的なバイアスに頑健にするためにデバイアス法が開発されたが、データセットがバイアスを受けているかどうかを事前に知る必要がある。
本稿では,「隠された」因果情報がバイアス画像に含まれる場合が多いため,このようなサンプルは必ずしも必要ではない,と論じる。
論文 参考訳(メタデータ) (2023-01-10T08:25:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。