論文の概要: piRank: A Probabilistic Intent Based Ranking Framework for Facebook
Search
- arxiv url: http://arxiv.org/abs/2203.14363v1
- Date: Sun, 27 Mar 2022 18:12:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 17:22:14.588661
- Title: piRank: A Probabilistic Intent Based Ranking Framework for Facebook
Search
- Title(参考訳): piRank:Facebook検索のための確率的インテントベースのランキングフレームワーク
- Authors: Zhen Liao
- Abstract要約: 本稿では,異なるクエリインテントに対する様々なランキング問題に対処するために,確率的意図に基づくランキングフレームワーク(piRank の略)を提案する。
我々は、Facebookの検索エンジンシステム上での広範な実験と研究を行い、この新しいランキングアーキテクチャの有効性を検証した。
- 参考スコア(独自算出の注目度): 0.07614628596146598
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While numerous studies have been conducted in the literature exploring
different types of machine learning approaches for search ranking, most of them
are focused on specific pre-defined problems but only a few of them have
studied the ranking framework which can be applied in a commercial search
engine in a scalable way. In the meantime, existing ranking models are often
optimized for normalized discounted cumulative gains (NDCG) or online
click-through rate (CTR), and both types of machine learning models are built
based on the assumption that high-quality training data can be easily obtained
and well applied to unseen cases. In practice at Facebook search, we observed
that our training data for ML models have certain issues. First, tail query
intents are hardly covered in our human rating dataset. Second, search click
logs are often noisy and hard to clean up due to various reasons. To address
the above issues, in this paper, we propose a probabilistic intent based
ranking framework (short for piRank), which can: 1) provide a scalable
framework to address various ranking issues for different query intents in a
divide-and-conquer way; 2) improve system development agility including
iteration speed and system debuggability; 3) combine both machine learning and
empirical-based algorithmic methods in a systematic way. We conducted extensive
experiments and studies on top of Facebook search engine system and validated
the effectiveness of this new ranking architecture.
- Abstract(参考訳): 検索ランキングのさまざまなタイプの機械学習アプローチを探求する文献で多くの研究が行われているが、その多くは特定の事前定義された問題に焦点を当てているが、商用検索エンジンに適用可能なランキングフレームワークをスケーラブルに研究しているのはごくわずかである。
一方,既存のランキングモデルは,通常値引き累積ゲイン (NDCG) やオンラインクリックスルーレート (CTR) に最適化されることが多い。
実際にFacebook検索では、MLモデルのトレーニングデータに何らかの問題があることが分かりました。
まず、尾行クエリインテントは、人間のレーティングデータセットではほとんどカバーされていません。
第二に、検索クリックログは、様々な理由から、しばしば騒々しく、クリーンアップが難しい。
本稿では,上記の問題に対処するために,確率的意図に基づくランキングフレームワーク(pirank の略)を提案する。
1) 異なるクエリインテントに対するさまざまなランク付け問題に分割・参照方式で対処するスケーラブルなフレームワークを提供する。
2) イテレーション速度やシステムデバッグ性など,システム開発のアジリティを改善する。
3) 機械学習と経験に基づくアルゴリズム手法を体系的な方法で組み合わせる。
facebookの検索エンジンシステム上で広範な実験と研究を行い、この新しいランキングアーキテクチャの有効性を検証した。
関連論文リスト
- Meta Learning to Rank for Sparsely Supervised Queries [10.422527051110526]
多くの現実世界の検索と検索のシナリオでは、監視信号は簡単には利用できないかもしれないし、いくつかのクエリを入手するのにコストがかかるかもしれない。
本稿では,メタラーニングの高速学習と適応能力を活用した新しいメタラーニング手法を提案する。
提案手法は,新しいクエリがトレーニングクエリと異なる特性を持つ場合,特に有益である。
論文 参考訳(メタデータ) (2024-09-29T04:24:38Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - A novel evaluation methodology for supervised Feature Ranking algorithms [0.0]
本稿では,特徴ランクの新たな評価手法を提案する。
合成データセットを使用することで、特徴重要度スコアを事前に知ることができ、より体系的な評価が可能になる。
新しい方法論を使った大規模な実験を容易にするため、fsevalと呼ばれるベンチマークフレームワークがPythonで構築された。
論文 参考訳(メタデータ) (2022-07-09T12:00:36Z) - Meta Navigator: Search for a Good Adaptation Policy for Few-shot
Learning [113.05118113697111]
少ないショット学習は、ラベル付きデータしか持たない新しいタスクに、以前のタスクから学んだ知識を適応させることを目的としている。
少数ショット学習に関する研究文献は、大きな多様性を示し、異なるアルゴリズムは、しばしば異なる少数ショット学習シナリオで優れている。
本稿では,メタナビゲータ(Meta Navigator)について紹介する。
論文 参考訳(メタデータ) (2021-09-13T07:20:01Z) - FEAR: A Simple Lightweight Method to Rank Architectures [14.017656480004955]
検索空間のアーキテクチャをランク付けするために,FEARと呼ぶシンプルだが強力な手法を提案する。
FEARは、精度を損なうことなく、検索時間を約2.4倍削減できる。
また,最近提案されたランキングのゼロコスト対策を実証的に検討し,トレーニングが進むにつれてランキングのパフォーマンスが低下することを示した。
論文 参考訳(メタデータ) (2021-06-07T23:38:21Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - PiRank: Learning To Rank via Differentiable Sorting [85.28916333414145]
ランク付けのための新しい分類可能なサロゲートであるPiRankを提案する。
ピランクは所望の指標をゼロ温度の限界で正確に回収する。
論文 参考訳(メタデータ) (2020-12-12T05:07:36Z) - Analysis of Multivariate Scoring Functions for Automatic Unbiased
Learning to Rank [14.827143632277274]
ユーザのバイアスモデル(すなわち、確率モデル)とアンバイアスなランク付けを共同で学習するAutoULTRアルゴリズムは、性能が優れ、実際のデプロイコストが低いため、多くの注目を集めている。
近年の文脈認識型学習 to ランクモデルの進歩により,複数の文書をまとめて読み上げ,それらのランキングスコアを予測する多変量スコア関数が,人間関連ラベルを用いたランキングタスクにおいて,一変量ランキング関数よりも強力であることが示されている。
2つの大規模ベンチマークデータセットの合成クリック実験により、置換不変な多変量スコアリング機能を持つAutoULTRモデルの性能が著しく向上したことが示された。
論文 参考訳(メタデータ) (2020-08-20T16:31:59Z) - Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking
Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。
学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。
本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-15T10:08:39Z) - Deep-n-Cheap: An Automated Search Framework for Low Complexity Deep
Learning [3.479254848034425]
私たちはディープラーニングモデルを探すためのオープンソースのAutoMLフレームワークであるDeep-n-Cheapを紹介します。
私たちのフレームワークは、ベンチマークとカスタムデータセットの両方へのデプロイをターゲットとしています。
Deep-n-Cheapには、トレーニング時間やパラメータ数とパフォーマンスをトレードオフする、ユーザ管理可能な複雑性ペナルティが含まれている。
論文 参考訳(メタデータ) (2020-03-27T13:00:21Z) - AutoML-Zero: Evolving Machine Learning Algorithms From Scratch [76.83052807776276]
基本数学的操作をビルディングブロックとして使うだけで,完全な機械学習アルゴリズムを自動的に発見できることが示される。
汎用的な検索空間を通じて人間のバイアスを大幅に低減する新しいフレームワークを導入することでこれを実証する。
機械学習アルゴリズムをゼロから発見する上で、これらの予備的な成功は、この分野における有望な新しい方向性を示していると信じている。
論文 参考訳(メタデータ) (2020-03-06T19:00:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。