論文の概要: ULTRA: An Unbiased Learning To Rank Algorithm Toolbox
- arxiv url: http://arxiv.org/abs/2108.05073v1
- Date: Wed, 11 Aug 2021 07:26:59 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 13:17:47.849626
- Title: ULTRA: An Unbiased Learning To Rank Algorithm Toolbox
- Title(参考訳): ULTRA:アルゴリズムボックスをランク付けする非偏見のない学習
- Authors: Anh Tran, Tao Yang, Qingyao Ai
- Abstract要約: 本稿では,Unbiased Learning to rank (ULTR)の一般的な枠組みについて述べる。
また、ULTRAでアルゴリズムを簡潔に記述し、ツールボックスの構造とパイプラインを詳述する。
ツールボックスは,異なる構成のULTRアルゴリズムの実験や,サポート対象の機能による独自のアルゴリズムのテストを行う上で,研究者にとって重要なリソースである。
- 参考スコア(独自算出の注目度): 13.296248894004652
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning to rank systems has become an important aspect of our daily life.
However, the implicit user feedback that is used to train many learning to rank
models is usually noisy and suffered from user bias (i.e., position bias).
Thus, obtaining an unbiased model using biased feedback has become an important
research field for IR. Existing studies on unbiased learning to rank (ULTR) can
be generalized into two families-algorithms that attain unbiasedness with
logged data, offline learning, and algorithms that achieve unbiasedness by
estimating unbiased parameters with real-time user interactions, namely online
learning. While there exist many algorithms from both families, there lacks a
unified way to compare and benchmark them. As a result, it can be challenging
for researchers to choose the right technique for their problems or for people
who are new to the field to learn and understand existing algorithms. To solve
this problem, we introduced ULTRA, which is a flexible, extensible, and easily
configure ULTR toolbox. Its key features include support for multiple ULTR
algorithms with configurable hyperparameters, a variety of built-in click
models that can be used separately to simulate clicks, different ranking model
architecture and evaluation metrics, and simple learning to rank pipeline
creation. In this paper, we discuss the general framework of ULTR, briefly
describe the algorithms in ULTRA, detailed the structure, and pipeline of the
toolbox. We experimented on all the algorithms supported by ultra and showed
that the toolbox performance is reasonable. Our toolbox is an important
resource for researchers to conduct experiments on ULTR algorithms with
different configurations as well as testing their own algorithms with the
supported features.
- Abstract(参考訳): システムのランク付けを学ぶことは、私たちの日常生活の重要な側面になっています。
しかし、多くの学習をランク付けするために使用される暗黙のユーザフィードバックは、通常騒がしく、ユーザのバイアス(つまり位置バイアス)に悩まされます。
したがって、バイアスフィードバックを用いたバイアスのないモデルを得ることは、IRにとって重要な研究分野となっている。
unbiased learning to rank (ultr) に関する既存の研究は、ログデータで不偏性を達成する2つの家族-アルゴリズム、オフライン学習、非偏りパラメータを推定して不偏性を達成するアルゴリズム、すなわちオンライン学習に一般化することができる。
どちらの家族からも多くのアルゴリズムが存在するが、それらを比較してベンチマークする方法が統一されていない。
結果として、研究者が問題に対して適切なテクニックを選択することや、既存のアルゴリズムを学習し理解する分野に新しい人を選ぶことが難しくなる可能性がある。
この問題を解決するため,ultraは柔軟で拡張性があり,ultraツールボックスを簡単に構成できる。
主要な機能には、設定可能なハイパーパラメータを備えた複数のULTRアルゴリズムのサポート、クリックをシミュレートするために個別に使用できるさまざまなビルトインクリックモデル、異なるランキングモデルアーキテクチャと評価メトリクス、パイプライン生成をランク付けするための簡単な学習が含まれている。
本稿では、ULTRの一般的なフレームワークについて論じ、ULTRAのアルゴリズムを簡潔に記述し、ツールボックスの構造とパイプラインについて詳述する。
ultraでサポートされているすべてのアルゴリズムを実験し、ツールボックスのパフォーマンスが妥当であることを示した。
ツールボックスは,異なる構成のULTRアルゴリズムの実験や,サポート対象の機能による独自のアルゴリズムのテストを行う上で,研究者にとって重要なリソースである。
関連論文リスト
- Multi-Dimensional Ability Diagnosis for Machine Learning Algorithms [88.93372675846123]
本稿では,機械学習アルゴリズム評価のためのタスク非依存評価フレームワークCamillaを提案する。
認識診断の仮定とニューラルネットワークを用いて、各サンプルのアルゴリズム、サンプル、スキル間の複雑な相互作用を学習する。
我々の実験では、カミラはメートル法信頼性、ランクの整合性、ランクの安定性で最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-07-14T03:15:56Z) - Context-Aware Ensemble Learning for Time Series [11.716677452529114]
本稿では,ベースモデルの特徴ベクトルの結合である特徴のスーパーセットを用いて,ベースモデル予測を効果的に組み合わせたメタ学習手法を提案する。
我々のモデルは、ベースモデルの予測を機械学習アルゴリズムの入力として使用するのではなく、問題の状態に基づいて各時点における最良の組み合わせを選択する。
論文 参考訳(メタデータ) (2022-11-30T10:36:13Z) - Whole Page Unbiased Learning to Rank [59.52040055543542]
アンバイアスド・ラーニング・トゥ・ランク(ULTR)アルゴリズムは、バイアスド・クリックデータを用いたアンバイアスド・ランキングモデルを学ぶために提案される。
本稿では,BALというアルゴリズムをランク付けするバイアス非依存学習を提案する。
実世界のデータセットによる実験結果から,BALの有効性が検証された。
論文 参考訳(メタデータ) (2022-10-19T16:53:08Z) - A Large Scale Search Dataset for Unbiased Learning to Rank [51.97967284268577]
我々は、非バイアス学習のためのBaidu-ULTRデータセットをランク付けする。
ランダムに12億の検索セッションと7,008のエキスパートアノテートクエリをサンプリングする。
1)本来のセマンティックな特徴と,使用が容易な事前学習言語モデル,(2)位置,表示高さ,抽象表現などの十分な表示情報,(3)居住時間のような検索結果ページ(SERP)に対するリッチなユーザフィードバックを提供する。
論文 参考訳(メタデータ) (2022-07-07T02:37:25Z) - Reinforcement Learning for Branch-and-Bound Optimisation using
Retrospective Trajectories [72.15369769265398]
機械学習は分岐のための有望なパラダイムとして登場した。
分岐のための単純かつ効果的なRLアプローチであるレトロ分岐を提案する。
我々は現在最先端のRL分岐アルゴリズムを3~5倍に上回り、500の制約と1000の変数を持つMILP上での最高のILメソッドの性能の20%以内である。
論文 参考訳(メタデータ) (2022-05-28T06:08:07Z) - A Pragmatic Look at Deep Imitation Learning [0.3626013617212666]
我々は6つの異なる対向的模倣学習アルゴリズムを再実装する。
広く使われている専門的軌跡データセットで評価する。
GAILは、様々なサンプルサイズにわたって、一貫してよく機能する。
論文 参考訳(メタデータ) (2021-08-04T06:33:10Z) - Learning Dexterous Manipulation from Suboptimal Experts [69.8017067648129]
相対エントロピーQラーニング(Relative Entropy Q-Learning、REQ)は、オフラインおよび従来のRLアルゴリズムのアイデアを組み合わせた単純なポリシーアルゴリズムである。
本稿では、REQが、デモから一般の政治外RL、オフラインRL、およびRLにどのように有効であるかを示す。
論文 参考訳(メタデータ) (2020-10-16T18:48:49Z) - Analysis of Multivariate Scoring Functions for Automatic Unbiased
Learning to Rank [14.827143632277274]
ユーザのバイアスモデル(すなわち、確率モデル)とアンバイアスなランク付けを共同で学習するAutoULTRアルゴリズムは、性能が優れ、実際のデプロイコストが低いため、多くの注目を集めている。
近年の文脈認識型学習 to ランクモデルの進歩により,複数の文書をまとめて読み上げ,それらのランキングスコアを予測する多変量スコア関数が,人間関連ラベルを用いたランキングタスクにおいて,一変量ランキング関数よりも強力であることが示されている。
2つの大規模ベンチマークデータセットの合成クリック実験により、置換不変な多変量スコアリング機能を持つAutoULTRモデルの性能が著しく向上したことが示された。
論文 参考訳(メタデータ) (2020-08-20T16:31:59Z) - Discovering Reinforcement Learning Algorithms [53.72358280495428]
強化学習アルゴリズムは、いくつかのルールの1つに従ってエージェントのパラメータを更新する。
本稿では,更新ルール全体を検出するメタラーニング手法を提案する。
これには、一連の環境と対話することで、"何を予測するか"(例えば、値関数)と"どのように学習するか"の両方が含まれている。
論文 参考訳(メタデータ) (2020-07-17T07:38:39Z) - Unbiased Learning to Rank: Online or Offline? [28.431648823968278]
偏りのあるユーザフィードバックでランク付けすることを学ぶことで、偏りのないランキングモデルを得る方法が、IRにとって重要な研究課題である。
既存の非バイアス付き学習のランク付けの研究は、ログデータを用いた非バイアス付き学習アルゴリズムの研究と、リアルタイムユーザインタラクションによる非バイアス付きパラメータ推定の研究という、2つのグループに大別することができる。
本稿では,非偏見学習をランク付けするタスクを形式化し,オフライン非偏見学習とオンライン学習をランク付けするための既存のアルゴリズムが,同じコインの両面にのみ存在することを示す。
論文 参考訳(メタデータ) (2020-04-28T15:01:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。