論文の概要: Preference-based learning for news headline recommendation
- arxiv url: http://arxiv.org/abs/2506.06334v1
- Date: Sat, 31 May 2025 12:57:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.188999
- Title: Preference-based learning for news headline recommendation
- Title(参考訳): ニュース見出し推薦のための嗜好に基づく学習
- Authors: Alexandre Bouras, Audrey Durand, Richard Khoury,
- Abstract要約: 本研究では、優先学習によるニュース見出し推薦の最適化戦略について検討する。
リアルタイムのユーザインタラクションデータとフランス語のオンラインニュース投稿を併用して,コンテキスト的バンディット設定の下で見出し推薦エージェントを学習する。
- 参考スコア(独自算出の注目度): 46.32599797180165
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study explores strategies for optimizing news headline recommendations through preference-based learning. Using real-world data of user interactions with French-language online news posts, we learn a headline recommender agent under a contextual bandit setting. This allows us to explore the impact of translation on engagement predictions, as well as the benefits of different interactive strategies on user engagement during data collection. Our results show that explicit exploration may not be required in the presence of noisy contexts, opening the door to simpler but efficient strategies in practice.
- Abstract(参考訳): 本研究では、優先学習によるニュース見出し推薦の最適化戦略について検討する。
リアルタイムのユーザインタラクションデータとフランス語のオンラインニュース投稿を併用して,コンテキスト的バンディット設定の下で見出し推薦エージェントを学習する。
これにより、エンゲージメント予測に対する翻訳の影響や、データ収集時のユーザエンゲージメントに対するさまざまなインタラクティブな戦略のメリットを探ることができます。
以上の結果から,ノイズのある状況下では明示的な探索は不要である可能性が示唆された。
関連論文リスト
- Interactive Visualization Recommendation with Hier-SUCB [52.11209329270573]
本稿では,従来のインタラクションからユーザフィードバックを学習する対話型パーソナライズドビジュアライゼーションレコメンデーション(PVisRec)システムを提案する。
よりインタラクティブで正確なレコメンデーションのために、PVisRec設定における文脈的半帯域であるHier-SUCBを提案する。
論文 参考訳(メタデータ) (2025-02-05T17:14:45Z) - Reformulating Sequential Recommendation: Learning Dynamic User Interest with Content-enriched Language Modeling [18.297332953450514]
本稿では、事前学習した言語モデルの意味理解機能を活用してパーソナライズされたレコメンデーションを生成するLANCERを提案する。
我々のアプローチは、言語モデルとレコメンデーションシステムの間のギャップを埋め、より人間的なレコメンデーションを生み出します。
論文 参考訳(メタデータ) (2023-09-19T08:54:47Z) - Investigating Reinforcement Learning for Communication Strategies in a
Task-Initiative Setting [8.680676599607123]
我々は,ユーザ明確化戦略の関数として,最初のプレゼンテーションとその後のフォローアップのトレードオフを分析する。
我々は、最小限のデータ要求、説明可能な選択、強力な監査機能をもたらす対話戦略の一貫性に基づく表現に対する驚くべき優位性を見出した。
論文 参考訳(メタデータ) (2023-08-03T00:10:23Z) - Two-Stage Neural Contextual Bandits for Personalised News Recommendation [50.3750507789989]
既存のパーソナライズされたニュースレコメンデーション手法は、ユーザの興味を搾取することに集中し、レコメンデーションにおける探索を無視する。
我々は、エクスプロイトと探索のトレードオフに対処する文脈的包括的レコメンデーション戦略に基づいて構築する。
我々はユーザとニュースにディープラーニング表現を使用し、ニューラルアッパー信頼境界(UCB)ポリシーを一般化し、加法的 UCB と双線形 UCB を一般化する。
論文 参考訳(メタデータ) (2022-06-26T12:07:56Z) - Onception: Active Learning with Expert Advice for Real World Machine
Translation [0.0]
機械翻訳の最も活発な学習アプローチは、ソース言語における文プールの存在を前提としており、翻訳または後編集を提供するために人間のアノテーションに依存している。
本稿では, 実世界のヒューマン・イン・ザ・ループのシナリオを仮定する。 (i) 原文は簡単には入手できないが, ストリームに到達し, (ii) 自動翻訳は, 正しい/編集された翻訳ではなく, 評価の形でフィードバックを受ける。
論文 参考訳(メタデータ) (2022-03-09T03:32:42Z) - Aspect-driven User Preference and News Representation Learning for News
Recommendation [9.187076140490902]
ニュースレコメンダシステムは、通常、ユーザーのトピックレベルの表現とレコメンデーションのためのニュースを学習する。
本稿では,アスペクトレベルのユーザ嗜好とニュース表現学習に基づく,アスペクト駆動型ニューズレコメンダシステム(ANRS)を提案する。
論文 参考訳(メタデータ) (2021-10-12T07:38:54Z) - Reward Constrained Interactive Recommendation with Natural Language
Feedback [158.8095688415973]
制約強化強化学習(RL)フレームワークを提案する。
具体的には,ユーザの過去の嗜好に反するレコメンデーションを検出するために,識別器を利用する。
提案するフレームワークは汎用的であり,制約付きテキスト生成のタスクにさらに拡張されている。
論文 参考訳(メタデータ) (2020-05-04T16:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。