論文の概要: Identifiability Matters: Revealing the Hidden Recoverable Condition in
Unbiased Learning to Rank
- arxiv url: http://arxiv.org/abs/2309.15560v1
- Date: Wed, 27 Sep 2023 10:31:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-28 14:14:49.847586
- Title: Identifiability Matters: Revealing the Hidden Recoverable Condition in
Unbiased Learning to Rank
- Title(参考訳): 未熟な学習のランク付けにおける隠れた回復条件の解明
- Authors: Mouxiang Chen, Chenghao Liu, Zemin Liu, Zhuo Li, Jianling Sun
- Abstract要約: アンバイアスド・ラーニング・トゥ・ランク(ULTR)の応用は、バイアスド・クリックログからアンバイアスド・ランキングモデルをトレーニングするための近代システムで広く使われている。
以前の研究では、クリックが完全に適合している限り、ほとんどのケースで真の潜伏関係を回復できることがわかった。
本稿では,ノード介入とノードマージという2つの手法を提案する。
- 参考スコア(独自算出の注目度): 39.85719217055178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The application of Unbiased Learning to Rank (ULTR) is widespread in modern
systems for training unbiased ranking models from biased click logs. The key is
to explicitly model a generation process for user behavior and fit click data
based on examination hypothesis. Previous research found empirically that the
true latent relevance can be recovered in most cases as long as the clicks are
perfectly fitted. However, we demonstrate that this is not always achievable,
resulting in a significant reduction in ranking performance. In this work, we
aim to answer if or when the true relevance can be recovered from click data,
which is a foundation issue for ULTR field. We first define a ranking model as
identifiable if it can recover the true relevance up to a scaling
transformation, which is enough for pairwise ranking objective. Then we explore
an equivalent condition for identifiability that can be novely expressed as a
graph connectivity test problem: if and only if a graph (namely identifiability
graph, or IG) constructed on the underlying structure of the dataset is
connected, we can guarantee that the relevance can be correctly recovered. When
the IG is not connected, there may be bad cases leading to poor ranking
performance. To address this issue, we propose two methods, namely node
intervention and node merging, to modify the dataset and restore connectivity
of the IG. Empirical results obtained on a simulation dataset and two LTR
benchmark datasets confirm the validity of our proposed theorems and show the
effectiveness of our methods in mitigating data bias when the relevance model
is unidentifiable.
- Abstract(参考訳): unbiased learning to rank(ultr)の応用は、バイアス付きクリックログから偏りのないランキングモデルをトレーニングするための現代のシステムで広く使われている。
鍵となるのは、ユーザー行動の生成プロセスを明示的にモデル化し、試験仮説に基づいてクリックデータを適合させることである。
以前の研究では、真の潜在性はクリックが完全に適合している限り、ほとんどのケースで回復できることが実証された。
しかし,これは必ずしも達成可能とは限らないため,ランキング性能が著しく低下することを示した。
本研究では,ULTRフィールドの基本問題であるクリックデータから真の関連性を取り戻すことができるかどうかを問う。
まず、ランク付けモデルを、スケーリング変換による真の関連性を回復できるかどうかを識別可能と定義します。
次に,グラフ接続テスト問題として新たに表現可能な識別可能性の等価条件について検討し,データセットの基盤構造上に構築されたグラフ(すなわち識別可能性グラフ,IG)が接続されている場合,その妥当性が正しく回復できることを保証する。
IGが接続されていない場合、ランキングパフォーマンスの低下につながる悪いケースがあります。
この問題に対処するため,ノード介入とノードマージという2つの手法を提案し,データセットの修正とIGの接続性回復を行う。
シミュレーションデータセットと2つのltrベンチマークデータセットで得られた実験結果は,提案する定理の有効性を確認し,妥当性が不明なデータバイアスを緩和する手法の有効性を示す。
関連論文リスト
- TCGU: Data-centric Graph Unlearning based on Transferable Condensation [36.670771080732486]
Transferable Condensation Graph Unlearning (TCGU)は、ゼロガンスグラフアンラーニングのためのデータ中心のソリューションである。
我々は,TGUが既存のGU手法よりもモデルユーティリティ,未学習効率,未学習効率において優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2024-10-09T02:14:40Z) - Hybrid Reinforcement Learning from Offline Observation Alone [19.14864618744221]
エージェントがオフラインデータとオンラインインタラクティブアクセスの両方にアクセス可能なハイブリッド強化学習環境について検討する。
リセットモデルを利用するアルゴリズムの性能を確実に一致させるトレースモデル設定における最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T13:34:05Z) - Demystifying amortized causal discovery with transformers [21.058343547918053]
観測データからの因果発見のための教師付き学習アプローチは、しばしば競争性能を達成する。
本研究では,CSIvAについて検討する。CSIvAは,合成データのトレーニングと実データへの転送を約束するトランスフォーマーモデルである。
既存の識別可能性理論とギャップを埋め、トレーニングデータ分布の制約がテスト観測の事前を暗黙的に定義していることを示します。
論文 参考訳(メタデータ) (2024-05-27T08:17:49Z) - DAGnosis: Localized Identification of Data Inconsistencies using
Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。
我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。
我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文 参考訳(メタデータ) (2024-02-26T11:29:16Z) - Score-based Causal Representation Learning: Linear and General Transformations [31.786444957887472]
本稿は、識別可能性と達成可能性の両方に対処する。
スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。
結果は構造化された合成データと画像データの実験によって実証的に検証される。
論文 参考訳(メタデータ) (2024-02-01T18:40:03Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - General Identifiability and Achievability for Causal Representation
Learning [33.80247458590611]
本稿では,潜伏因果グラフにおけるノード毎の2つのハードアンカップリング介入を用いて,識別可能性と達成性を評価する。
同定可能性について,未結合の介入の下で潜伏因果モデルと変数の完全回復が保証されることを示す。
さらに、この分析は、2つのハードカップリングされた介入に対して、同一ノードが介在する2つの環境に関するメタデータが知られている場合に、識別可能性の結果を回復する。
論文 参考訳(メタデータ) (2023-10-24T01:47:44Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - Federated Causal Discovery [74.37739054932733]
本稿では,DAG-Shared Federated Causal Discovery (DS-FCD) という勾配学習フレームワークを開発する。
ローカルデータに直接触れることなく因果グラフを学習し、データの不均一性を自然に扱うことができる。
合成および実世界の両方のデータセットに対する大規模な実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2021-12-07T08:04:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。