論文の概要: Identifiability Matters: Revealing the Hidden Recoverable Condition in
Unbiased Learning to Rank
- arxiv url: http://arxiv.org/abs/2309.15560v2
- Date: Mon, 29 Jan 2024 17:47:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-30 21:58:20.679242
- Title: Identifiability Matters: Revealing the Hidden Recoverable Condition in
Unbiased Learning to Rank
- Title(参考訳): 未熟な学習のランク付けにおける隠れた回復条件の解明
- Authors: Mouxiang Chen, Chenghao Liu, Zemin Liu, Zhuo Li, Jianling Sun
- Abstract要約: 基礎レベルでのクリックデータから関連性を回復できる条件について検討する。
妥当性の回復は、データセットの基盤構造から派生した識別可能性グラフ(IG)が接続されている場合にのみ可能である。
我々は,ノード介入とノードマージという2つの手法を導入し,データセットの修正とIGの接続性回復を図った。
- 参考スコア(独自算出の注目度): 39.85719217055178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unbiased Learning to Rank (ULTR) aims to train unbiased ranking models from
biased click logs, by explicitly modeling a generation process for user
behavior and fitting click data based on examination hypothesis. Previous
research found empirically that the true latent relevance is mostly recoverable
through perfect click fitting. However, we demonstrate that this is not always
achievable, resulting in a significant reduction in ranking performance. This
research investigates the conditions under which relevance can be recovered
from click data at a foundational level. We initially characterize a ranking
model as identifiable if it can recover the true relevance up to a scaling
transformation, a criterion sufficient for the pairwise ranking objective.
Subsequently, we investigate an equivalent condition for identifiability,
articulated as a graph connectivity test problem: the recovery of relevance is
feasible if and only if the identifiability graph (IG), derived from the
underlying structure of the dataset, is connected. The presence of a
disconnected IG may lead to degenerate cases and suboptimal ranking
performance. To tackle this challenge, we introduce two methods, namely node
intervention and node merging, designed to modify the dataset and restore the
connectivity of the IG. Empirical results derived from a simulated dataset and
two real-world LTR benchmark datasets not only validate our proposed theorems
but also demonstrate the effectiveness of our methods in alleviating data bias
when the relevance model is unidentifiable.
- Abstract(参考訳): unbiased learning to rank (ultr) は,ユーザの行動生成プロセスを明示的にモデル化し,試験仮説に基づいてクリックデータを適合させることによって,バイアス付きクリックログから偏りのないランキングモデルをトレーニングすることを目的としている。
以前の研究では、真の潜在性は完全なクリックフィッティングによってほぼ回復可能であることが実証された。
しかし,これは必ずしも達成可能とは限らないため,ランキング性能が著しく低下することを示した。
本研究では,クリックデータから基礎レベルの関連性を回復できる条件について検討する。
まず、ランク付けモデルを、スケーリング変換による真の関連性を回復可能で、ペアワイズランキング目標に十分な基準であるとして識別可能であると特徴付ける。
その後、グラフ接続テスト問題として具体化され、データセットの基盤構造から派生した識別可能性グラフ(IG)が接続された場合にのみ、妥当性の回復が実現可能であることを示す。
切断されたIGの存在は、退化ケースや準最適ランキングパフォーマンスにつながる可能性がある。
この課題に対処するために,データセットの変更とIGの接続性回復を目的としたノード介入とノードマージという2つの手法を導入する。
シミュレーションデータセットと実世界の2つのLTRベンチマークデータセットから得られた実証結果は,提案した定理の検証だけでなく,妥当性モデルが不明な場合のデータバイアスを軽減するための手法の有効性も示している。
関連論文リスト
- TCGU: Data-centric Graph Unlearning based on Transferable Condensation [36.670771080732486]
Transferable Condensation Graph Unlearning (TCGU)は、ゼロガンスグラフアンラーニングのためのデータ中心のソリューションである。
我々は,TGUが既存のGU手法よりもモデルユーティリティ,未学習効率,未学習効率において優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2024-10-09T02:14:40Z) - Hybrid Reinforcement Learning from Offline Observation Alone [19.14864618744221]
エージェントがオフラインデータとオンラインインタラクティブアクセスの両方にアクセス可能なハイブリッド強化学習環境について検討する。
リセットモデルを利用するアルゴリズムの性能を確実に一致させるトレースモデル設定における最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T13:34:05Z) - Demystifying amortized causal discovery with transformers [21.058343547918053]
観測データからの因果発見のための教師付き学習アプローチは、しばしば競争性能を達成する。
本研究では,CSIvAについて検討する。CSIvAは,合成データのトレーニングと実データへの転送を約束するトランスフォーマーモデルである。
既存の識別可能性理論とギャップを埋め、トレーニングデータ分布の制約がテスト観測の事前を暗黙的に定義していることを示します。
論文 参考訳(メタデータ) (2024-05-27T08:17:49Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - Score-based Causal Representation Learning: Linear and General Transformations [31.786444957887472]
本稿は、識別可能性と達成可能性の両方に対処する。
スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。
結果は構造化された合成データと画像データの実験によって実証的に検証される。
論文 参考訳(メタデータ) (2024-02-01T18:40:03Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - General Identifiability and Achievability for Causal Representation
Learning [33.80247458590611]
本稿では,潜伏因果グラフにおけるノード毎の2つのハードアンカップリング介入を用いて,識別可能性と達成性を評価する。
同定可能性について,未結合の介入の下で潜伏因果モデルと変数の完全回復が保証されることを示す。
さらに、この分析は、2つのハードカップリングされた介入に対して、同一ノードが介在する2つの環境に関するメタデータが知られている場合に、識別可能性の結果を回復する。
論文 参考訳(メタデータ) (2023-10-24T01:47:44Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Federated Causal Discovery [74.37739054932733]
本稿では,DAG-Shared Federated Causal Discovery (DS-FCD) という勾配学習フレームワークを開発する。
ローカルデータに直接触れることなく因果グラフを学習し、データの不均一性を自然に扱うことができる。
合成および実世界の両方のデータセットに対する大規模な実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2021-12-07T08:04:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。