Fugu-MT 論文翻訳(概要): Learned Ranking Function: From Short-term Behavior Predictions to Long-term User Satisfaction

論文の概要: Learned Ranking Function: From Short-term Behavior Predictions to Long-term User Satisfaction

arxiv url: http://arxiv.org/abs/2408.06512v1
Date: Mon, 12 Aug 2024 22:02:39 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-14 19:07:10.119978
Title: Learned Ranking Function: From Short-term Behavior Predictions to Long-term User Satisfaction
Title（参考訳）: 学習ランキング機能:短期行動予測から長期ユーザ満足度へ
Authors: Yi Wu, Daryl Chang, Jennifer She, Zhe Zhao, Li Wei, Lukasz Heldt,
Abstract要約: 本稿では,Learnered Ranking Function(LRF)を提案する。LRFは,短期的なユーザ・イテム行動予測を入力として取り込んで,推薦のスレートを出力するシステムである。本稿では,長期ユーザ満足度を最大化することを目的としたスレート最適化問題として,この問題を直接モデル化することを提案する。
参考スコア（独自算出の注目度）: 11.109665449393738
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present the Learned Ranking Function (LRF), a system that takes short-term user-item behavior predictions as input and outputs a slate of recommendations that directly optimizes for long-term user satisfaction. Most previous work is based on optimizing the hyperparameters of a heuristic function. We propose to model the problem directly as a slate optimization problem with the objective of maximizing long-term user satisfaction. We also develop a novel constraint optimization algorithm that stabilizes objective trade-offs for multi-objective optimization. We evaluate our approach with live experiments and describe its deployment on YouTube.
Abstract（参考訳）: 本稿では,Learnered Ranking Function (LRF) を提案する。LRFは,短期的なユーザの行動予測を入力として受け取り,長期的なユーザの満足度を直接最適化するレコメンデーションのスレートを出力するシステムである。これまでのほとんどの研究は、ヒューリスティック関数のハイパーパラメーターを最適化することに基づいている。本稿では,長期ユーザ満足度を最大化することを目的としたスレート最適化問題として,この問題を直接モデル化することを提案する。また,多目的最適化のための客観的トレードオフを安定化する制約最適化アルゴリズムを開発した。ライブ実験によるアプローチの評価と,YouTubeへの展開について述べる。

関連論文リスト

Goal-Oriented Influence-Maximizing Data Acquisition for Learning and Optimization [28.53710231018475]
逆曲率による不確実性認識を保ちながら、明示的な後部推論を回避する能動的取得アルゴリズムを提案する。 GOIMDAは、ユーザが指定したゴール関数に対する期待する影響を最大化し、入力を選択する。一般化線形モデルでは,GOIMDA はゴールアライメントと予測バイアスを考慮した補正項までの予測エントロピー最小化を近似する。
論文参考訳（メタデータ） (2026-02-23T07:57:11Z)
POP: Prior-fitted Optimizer Policies [20.784587787548436]
POP(Prior Policies Policies)は、文脈情報に基づいて段階的に座標を予測できるメタ学習モデルである。本モデルは,不適合な目的から抽出した数百万の合成最適化問題に基づいて学習した。
論文参考訳（メタデータ） (2026-02-17T10:27:07Z)
Online Decision-Focused Learning [63.83903681295497]
意思決定中心学習(DFL)は、意思決定タスクで出力が使用される予測モデルを訓練するパラダイムとして、ますます人気が高まっている。対象関数が時間とともに進化しない動的環境におけるDFLについて検討する。決定空間が単純空間であるときと一般有界凸ポリトープであるときの両方において、期待される動的後悔の限界を確立する。
論文参考訳（メタデータ） (2025-05-19T10:40:30Z)
Discovering Preference Optimization Algorithms with and for Large Language Models [50.843710797024805]
オフライン優先最適化は、LLM(Large Language Model)出力の品質を向上・制御するための重要な手法である。我々は、人間の介入なしに、新しい最先端の選好最適化アルゴリズムを自動で発見する客観的発見を行う。実験は、ロジスティックと指数的損失を適応的にブレンドする新しいアルゴリズムであるDiscoPOPの最先端性能を示す。
論文参考訳（メタデータ） (2024-06-12T16:58:41Z)
Deterministic Langevin Unconstrained Optimization with Normalizing Flows [3.988614978933934]
我々は,Fokker-Planck方程式とLangevin方程式にインスパイアされたブラックボックス関数に対するグローバルで自由な代理最適化戦略を導入する。本研究は,標準合成試験関数の最適目的に向けての競争力の向上を実証する。
論文参考訳（メタデータ） (2023-10-01T17:46:20Z)
MONGOOSE: Path-wise Smooth Bayesian Optimisation via Meta-learning [29.97648417539237]
ブラックボックスの客観的関数を評価するコストの主な貢献は、しばしば測定のためのシステムを作成するのに必要な労力である。本稿では, 連続評価の間隔が大きくなるにつれて, 準備コストが増大する一般的なシナリオについて考察する。我々のアルゴリズムMONGOOSEは、メタリアントパラメトリックポリシーを用いてスムーズな最適化軌道を生成する。
論文参考訳（メタデータ） (2023-02-22T18:20:36Z)
Generalizing Bayesian Optimization with Decision-theoretic Entropies [102.82152945324381]
統計的決定論の研究からシャノンエントロピーの一般化を考える。まず,このエントロピーの特殊なケースがBO手順でよく用いられる獲得関数に繋がることを示す。次に、損失に対する選択肢の選択が、どのようにして柔軟な獲得関数の族をもたらすかを示す。
論文参考訳（メタデータ） (2022-10-04T04:43:58Z)
Meta-Wrapper: Differentiable Wrapping Operator for User Interest Selection in CTR Prediction [97.99938802797377]
クリックスルー率(CTR)予測は、ユーザーが商品をクリックする確率を予測することを目的としており、リコメンデーションシステムにおいてますます重要になっている。近年,ユーザの行動からユーザの興味を自動的に抽出する深層学習モデルが大きな成功を収めている。そこで我々は,メタラッパー(Meta-Wrapper)と呼ばれるラッパー手法の枠組みに基づく新しい手法を提案する。
論文参考訳（メタデータ） (2022-06-28T03:28:15Z)
SnAKe: Bayesian Optimization with Pathwise Exploration [9.807656882149319]
本稿では,イテレーション間の大きな入力変更を行う場合,関数評価のコストが大幅に増大する,という新しい設定について考察する。本稿では,この問題を考察し,適応接続サンプルを用いた逐次ベイズ最適化(SnAKe)を導入する。将来のクエリを考慮し、入力コストを最小限に抑える最適化パスをプリエンプティブに構築することで、ソリューションを提供する。
論文参考訳（メタデータ） (2022-01-31T19:42:56Z)
RoMA: Robust Model Adaptation for Offline Model-based Optimization [115.02677045518692]
入力出力クエリの静的データセットからブラックボックス目的関数を最大化する入力を探索する問題を考える。この問題を解決するための一般的なアプローチは、真の客観的関数を近似するプロキシモデルを維持することである。ここでの大きな課題は、検索中に逆最適化された入力を避ける方法である。
論文参考訳（メタデータ） (2021-10-27T05:37:12Z)
The Perils of Learning Before Optimizing [16.97597806975415]
本稿では,最適化タスクを通じて予測モデルを識別することで,エンドツーエンドで予測モデルを学習する方法を示す。 2段階のアプローチとエンドツーエンドのアプローチのパフォーマンスギャップは、最適化における相関の概念の強調と密接に関係していることが示される。
論文参考訳（メタデータ） (2021-06-18T20:43:47Z)
Are we Forgetting about Compositional Optimisers in Bayesian Optimisation? [66.39551991177542]
本稿では,グローバル最適化のためのサンプル手法を提案する。この中、重要なパフォーマンス決定の自明さは、取得機能を最大化することです。 3958実験における機能最適化手法の実証的利点を強調する。
論文参考訳（メタデータ） (2020-12-15T12:18:38Z)
Fast Rates for Contextual Linear Optimization [52.39202699484225]
提案手法は, 下流決定性能を直接最適化する手法よりもはるかに高速な, 後悔の収束率を実現する。予測モデルは、既存のツールを使ったトレーニングが簡単かつ高速で、解釈が簡単で、私たちが示しているように、非常にうまく機能する決定につながる。
論文参考訳（メタデータ） (2020-11-05T18:43:59Z)
Composition of kernel and acquisition functions for High Dimensional Bayesian Optimization [0.1749935196721634]
目的関数の追加性を用いて、ベイズ最適化のカーネルと取得関数の両方をマッピングする。このap-proachは確率的代理モデルの学習/更新をより効率的にする。都市給水システムにおけるポンプの制御を実運用に適用するための結果が提示された。
論文参考訳（メタデータ） (2020-03-09T15:45:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。