Fugu-MT 論文翻訳(概要): Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank

論文の概要: Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank

arxiv url: http://arxiv.org/abs/2309.15560v1
Date: Wed, 27 Sep 2023 10:31:58 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-28 14:14:49.847586
Title: Identifiability Matters: Revealing the Hidden Recoverable Condition in Unbiased Learning to Rank
Title（参考訳）: 未熟な学習のランク付けにおける隠れた回復条件の解明
Authors: Mouxiang Chen, Chenghao Liu, Zemin Liu, Zhuo Li, Jianling Sun
Abstract要約: アンバイアスド・ラーニング・トゥ・ランク(ULTR)の応用は、バイアスド・クリックログからアンバイアスド・ランキングモデルをトレーニングするための近代システムで広く使われている。以前の研究では、クリックが完全に適合している限り、ほとんどのケースで真の潜伏関係を回復できることがわかった。本稿では,ノード介入とノードマージという2つの手法を提案する。
参考スコア（独自算出の注目度）: 39.85719217055178
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The application of Unbiased Learning to Rank (ULTR) is widespread in modern systems for training unbiased ranking models from biased click logs. The key is to explicitly model a generation process for user behavior and fit click data based on examination hypothesis. Previous research found empirically that the true latent relevance can be recovered in most cases as long as the clicks are perfectly fitted. However, we demonstrate that this is not always achievable, resulting in a significant reduction in ranking performance. In this work, we aim to answer if or when the true relevance can be recovered from click data, which is a foundation issue for ULTR field. We first define a ranking model as identifiable if it can recover the true relevance up to a scaling transformation, which is enough for pairwise ranking objective. Then we explore an equivalent condition for identifiability that can be novely expressed as a graph connectivity test problem: if and only if a graph (namely identifiability graph, or IG) constructed on the underlying structure of the dataset is connected, we can guarantee that the relevance can be correctly recovered. When the IG is not connected, there may be bad cases leading to poor ranking performance. To address this issue, we propose two methods, namely node intervention and node merging, to modify the dataset and restore connectivity of the IG. Empirical results obtained on a simulation dataset and two LTR benchmark datasets confirm the validity of our proposed theorems and show the effectiveness of our methods in mitigating data bias when the relevance model is unidentifiable.
Abstract（参考訳）: unbiased learning to rank(ultr)の応用は、バイアス付きクリックログから偏りのないランキングモデルをトレーニングするための現代のシステムで広く使われている。鍵となるのは、ユーザー行動の生成プロセスを明示的にモデル化し、試験仮説に基づいてクリックデータを適合させることである。以前の研究では、真の潜在性はクリックが完全に適合している限り、ほとんどのケースで回復できることが実証された。しかし,これは必ずしも達成可能とは限らないため,ランキング性能が著しく低下することを示した。本研究では,ULTRフィールドの基本問題であるクリックデータから真の関連性を取り戻すことができるかどうかを問う。まず、ランク付けモデルを、スケーリング変換による真の関連性を回復できるかどうかを識別可能と定義します。次に,グラフ接続テスト問題として新たに表現可能な識別可能性の等価条件について検討し,データセットの基盤構造上に構築されたグラフ(すなわち識別可能性グラフ,IG)が接続されている場合,その妥当性が正しく回復できることを保証する。 IGが接続されていない場合、ランキングパフォーマンスの低下につながる悪いケースがあります。この問題に対処するため,ノード介入とノードマージという2つの手法を提案し,データセットの修正とIGの接続性回復を行う。シミュレーションデータセットと2つのltrベンチマークデータセットで得られた実験結果は,提案する定理の有効性を確認し,妥当性が不明なデータバイアスを緩和する手法の有効性を示す。

関連論文リスト

Correcting False Alarms from Unseen: Adapting Graph Anomaly Detectors at Test Time [60.341117019125214]
グラフ異常検出(GAD)における未確認正規pattErnsの修正のための,軽量かつプラグアンドプレイなテスト時間適応フレームワークを提案する。意味的混乱に対処するために、シフトしたデータと元のデータとをグラフ属性レベルで整合させるグラフ整合器を用いる。 10個の実世界のデータセットに対する大規模な実験により、TUNEは事前学習されたGADモデルの合成パターンと実際の見えない正常パターンの両方への一般化性を著しく向上することが示された。
論文参考訳（メタデータ） (2025-11-10T12:10:05Z)
Relation Extraction or Pattern Matching? Unravelling the Generalisation Limits of Language Models for Biographical RE [18.616344314400244]
関係抽出モデルは、類似した領域内であっても、目に見えないデータと競合することを示す。我々の結果は、語彙的類似性ではなく、データ品質がロバスト転送の鍵であることを示しています。
論文参考訳（メタデータ） (2025-05-18T20:22:14Z)
Unbiased Learning to Rank with Query-Level Click Propensity Estimation: Beyond Pointwise Observation and Relevance [74.43264459255121]
現実のシナリオでは、ユーザーは複数の関連するオプションを調べた後、1つまたは2つの結果だけをクリックします。本稿では,ユーザが異なる検索結果リストをクリックする確率を捉えるために,クエリレベルのクリック確率モデルを提案する。本手法では,2次元逆重み付け機構を導入し,相対飽和度と位置偏差に対処する。
論文参考訳（メタデータ） (2025-02-17T03:55:51Z)
Deep evolving semi-supervised anomaly detection [14.027613461156864]
本研究の目的は,連続的半教師付き異常検出(CSAD)のタスクを形式化することである。本稿では,半教師付きデータを扱うための変分オートエンコーダ(VAE)のベースラインモデルを提案する。
論文参考訳（メタデータ） (2024-12-01T15:48:37Z)
TCGU: Data-centric Graph Unlearning based on Transferable Condensation [36.670771080732486]
Transferable Condensation Graph Unlearning (TCGU)は、ゼロガンスグラフアンラーニングのためのデータ中心のソリューションである。我々は,TGUが既存のGU手法よりもモデルユーティリティ,未学習効率,未学習効率において優れた性能を発揮することを示す。
論文参考訳（メタデータ） (2024-10-09T02:14:40Z)
Hybrid Reinforcement Learning from Offline Observation Alone [19.14864618744221]
エージェントがオフラインデータとオンラインインタラクティブアクセスの両方にアクセス可能なハイブリッド強化学習環境について検討する。リセットモデルを利用するアルゴリズムの性能を確実に一致させるトレースモデル設定における最初のアルゴリズムを提案する。
論文参考訳（メタデータ） (2024-06-11T13:34:05Z)
Demystifying amortized causal discovery with transformers [21.058343547918053]
観測データからの因果発見のための教師付き学習アプローチは、しばしば競争性能を達成する。本研究では,CSIvAについて検討する。CSIvAは,合成データのトレーニングと実データへの転送を約束するトランスフォーマーモデルである。既存の識別可能性理論とギャップを埋め、トレーニングデータ分布の制約がテスト観測の事前を暗黙的に定義していることを示します。
論文参考訳（メタデータ） (2024-05-27T08:17:49Z)
DAGnosis: Localized Identification of Data Inconsistencies using Structures [73.39285449012255]
機械学習モデルを確実に使用するためには、デプロイメント時のデータの不整合の特定と適切な処理が不可欠である。我々は,有向非巡回グラフ(DAG)を用いて,トレーニングセットの特徴分布と非依存性を構造として符号化する。我々の手法はDAGnosisと呼ばれ、これらの構造的相互作用を利用して、価値があり洞察に富んだデータ中心の結論をもたらす。
論文参考訳（メタデータ） (2024-02-26T11:29:16Z)
Score-based Causal Representation Learning: Linear and General Transformations [31.786444957887472]
本稿は、識別可能性と達成可能性の両方に対処する。スコアに基づくアルゴリズムのクラスを設計し、識別性と達成性の両方を保証する。結果は構造化された合成データと画像データの実験によって実証的に検証される。
論文参考訳（メタデータ） (2024-02-01T18:40:03Z)
Fake It Till Make It: Federated Learning with Consensus-Oriented Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。 FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文参考訳（メタデータ） (2023-12-10T18:49:59Z)
General Identifiability and Achievability for Causal Representation Learning [33.80247458590611]
本稿では,潜伏因果グラフにおけるノード毎の2つのハードアンカップリング介入を用いて,識別可能性と達成性を評価する。同定可能性について,未結合の介入の下で潜伏因果モデルと変数の完全回復が保証されることを示す。さらに、この分析は、2つのハードカップリングされた介入に対して、同一ノードが介在する2つの環境に関するメタデータが知られている場合に、識別可能性の結果を回復する。
論文参考訳（メタデータ） (2023-10-24T01:47:44Z)
Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文参考訳（メタデータ） (2023-03-06T14:49:59Z)
Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。 GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文参考訳（メタデータ） (2023-02-06T16:38:43Z)
Federated Causal Discovery [74.37739054932733]
本稿では,DAG-Shared Federated Causal Discovery (DS-FCD) という勾配学習フレームワークを開発する。ローカルデータに直接触れることなく因果グラフを学習し、データの不均一性を自然に扱うことができる。合成および実世界の両方のデータセットに対する大規模な実験により,提案手法の有効性が検証された。
論文参考訳（メタデータ） (2021-12-07T08:04:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。