論文の概要: Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank
- arxiv url: http://arxiv.org/abs/2309.15560v3
- Date: Fri, 24 May 2024 12:29:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-27 23:56:12.643816
- Title: Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank
- Title(参考訳): 未熟な学習のランク付けにおける隠れた回復条件の解明
- Authors: Mouxiang Chen, Chenghao Liu, Zemin Liu, Zhuo Li, Jianling Sun,
- Abstract要約: クリックデータから関連性を回復できる条件について検討する。
関連性の回復は、同一性グラフ(IG)が接続されている場合にのみ可能となる。
我々は,ノード介入とノードマージという2つの手法を導入し,データセットの修正とIGの接続性回復を図った。
- 参考スコア(独自算出の注目度): 37.15089945367366
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unbiased Learning to Rank (ULTR) aims to train unbiased ranking models from biased click logs, by explicitly modeling a generation process for user behavior and fitting click data based on examination hypothesis. Previous research found empirically that the true latent relevance is mostly recoverable through click fitting. However, we demonstrate that this is not always achievable, resulting in a significant reduction in ranking performance. This research investigates the conditions under which relevance can be recovered from click data in the first principle. We initially characterize a ranking model as identifiable if it can recover the true relevance up to a scaling transformation, a criterion sufficient for the pairwise ranking objective. Subsequently, we investigate an equivalent condition for identifiability, articulated as a graph connectivity test problem: the recovery of relevance is feasible if and only if the identifiability graph (IG), derived from the underlying structure of the dataset, is connected. The presence of a disconnected IG may lead to degenerate cases and suboptimal ranking performance. To tackle this challenge, we introduce two methods, namely node intervention and node merging, designed to modify the dataset and restore the connectivity of the IG. Empirical results derived from a simulated dataset and two real-world LTR benchmark datasets not only validate our proposed theory but also demonstrate the effectiveness of our methods in alleviating data bias when the relevance model is unidentifiable.
- Abstract(参考訳): Unbiased Learning to Rank (ULTR)は、ユーザの振る舞いの生成プロセスを明示的にモデル化し、検証仮説に基づいてクリックデータを適合させることによって、バイアス付きクリックログからバイアスなしランキングモデルをトレーニングすることを目的としている。
以前の研究では、真の潜伏関係はほとんどクリックフィッティングによって回復可能であることが実証された。
しかし、これは必ずしも達成可能なものではないことが示され、結果としてランキング性能は大幅に低下する。
本研究は,第1原理でクリックデータから関連性を回復できる条件について検討する。
当初我々は、スケール変換の真の関連性、すなわちペアのランク付け目的に十分な基準を回復できるならば、ランク付けモデルを識別可能なものとして特徴付けている。
その後、グラフ接続テスト問題として具体化され、データセットの基盤構造から派生した識別可能性グラフ(IG)が接続された場合にのみ、妥当性の回復が実現可能であることを示す。
切断されたIGの存在は、退化ケースや準最適ランキングパフォーマンスにつながる可能性がある。
この課題に対処するために,データセットの変更とIGの接続性回復を目的としたノード介入とノードマージという2つの手法を導入する。
シミュレーションデータセットと実世界の2つのLTRベンチマークデータセットから得られた実験結果は,提案した理論を検証するだけでなく,妥当性モデルが不明な場合のデータバイアスを軽減するための手法の有効性も示している。
関連論文リスト
- TCGU: Data-centric Graph Unlearning based on Transferable Condensation [36.670771080732486]
Transferable Condensation Graph Unlearning (TCGU)は、ゼロガンスグラフアンラーニングのためのデータ中心のソリューションである。
我々は,TGUが既存のGU手法よりもモデルユーティリティ,未学習効率,未学習効率において優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2024-10-09T02:14:40Z) - Hybrid Reinforcement Learning from Offline Observation Alone [19.14864618744221]
エージェントがオフラインデータとオンラインインタラクティブアクセスの両方にアクセス可能なハイブリッド強化学習環境について検討する。
リセットモデルを利用するアルゴリズムの性能を確実に一致させるトレースモデル設定における最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T13:34:05Z) - Demystifying amortized causal discovery with transformers [21.058343547918053]
観測データからの因果発見のための教師付き学習アプローチは、しばしば競争性能を達成する。
本研究では,CSIvAについて検討する。CSIvAは,合成データのトレーニングと実データへの転送を約束するトランスフォーマーモデルである。
既存の識別可能性理論とギャップを埋め、トレーニングデータ分布の制約がテスト観測の事前を暗黙的に定義していることを示します。
論文 参考訳(メタデータ) (2024-05-27T08:17:49Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - Score-based Causal Representation Learning: Linear and General Transformations [31.786444957887472]
本稿は、識別可能性と達成可能性の両方に対処する。
スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。
結果は構造化された合成データと画像データの実験によって実証的に検証される。
論文 参考訳(メタデータ) (2024-02-01T18:40:03Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - General Identifiability and Achievability for Causal Representation
Learning [33.80247458590611]
本稿では,潜伏因果グラフにおけるノード毎の2つのハードアンカップリング介入を用いて,識別可能性と達成性を評価する。
同定可能性について,未結合の介入の下で潜伏因果モデルと変数の完全回復が保証されることを示す。
さらに、この分析は、2つのハードカップリングされた介入に対して、同一ノードが介在する2つの環境に関するメタデータが知られている場合に、識別可能性の結果を回復する。
論文 参考訳(メタデータ) (2023-10-24T01:47:44Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Federated Causal Discovery [74.37739054932733]
本稿では,DAG-Shared Federated Causal Discovery (DS-FCD) という勾配学習フレームワークを開発する。
ローカルデータに直接触れることなく因果グラフを学習し、データの不均一性を自然に扱うことができる。
合成および実世界の両方のデータセットに対する大規模な実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2021-12-07T08:04:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。