論文の概要: CoNRec: Context-Discerning Negative Recommendation with LLMs
- arxiv url: http://arxiv.org/abs/2601.15721v1
- Date: Thu, 22 Jan 2026 07:46:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.529757
- Title: CoNRec: Context-Discerning Negative Recommendation with LLMs
- Title(参考訳): CoNRec: LLMによるコンテキスト認識の否定的勧告
- Authors: Xinda Chen, Jiawei Wu, Yishuang Liu, Jialin Zhu, Shuwen Xiao, Junjun Zheng, Xiangheng Kong, Yuning Jiang,
- Abstract要約: ユーザのネガティブな嗜好に関する研究は、現代のレコメンデーションシステムにおいてますます重要になっている。
既存のアプローチのほとんどは、主に肯定的な推奨を強化する補助信号として負のフィードバックを使用している。
特殊設計した文脈認識モジュールを用いた負のフィードバックモデリングのための,最初の大規模言語モデルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 5.832474387562381
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding what users like is relatively straightforward; understanding what users dislike, however, remains a challenging and underexplored problem. Research into users' negative preferences has gained increasing importance in modern recommendation systems. Numerous platforms have introduced explicit negative feedback mechanisms and leverage such signals to refine their recommendation models. Beyond traditional business metrics, user experience-driven metrics, such as negative feedback rates, have become critical indicators for evaluating system performance. However, most existing approaches primarily use negative feedback as an auxiliary signal to enhance positive recommendations, paying little attention to directly modeling negative interests, which can be highly valuable in offline applications. Moreover, due to the inherent sparsity of negative feedback data, models often suffer from context understanding biases induced by positive feedback dominance. To address these challenges, we propose the first large language model framework for negative feedback modeling with special designed context-discerning modules. We use semantic ID Representation to replace text-based item descriptions and introduce an item-level alignment task that enhances the LLM's understanding of the semantic context behind negative feedback. Furthermore, we design a Progressive GRPO training paradigm that enables the model to dynamically balance the positive and negative behavioral context utilization. Besides, our investigation further reveals a fundamental misalignment between the conventional next-negative-item prediction objective and users' true negative preferences, which is heavily influenced by the system's recommendation order. To mitigate this, we propose a novel reward function and evaluation metric grounded in multi-day future negative feedback and their collaborative signals.
- Abstract(参考訳): しかし、ユーザーが何を嫌っているかを理解することは、依然として困難で未解決の課題である。
ユーザのネガティブな嗜好に関する研究は、現代のレコメンデーションシステムにおいてますます重要になっている。
多くのプラットフォームが明示的な負のフィードバック機構を導入し、そのような信号を利用してレコメンデーションモデルを洗練している。
従来のビジネスメトリクス以外にも、ネガティブなフィードバック率などのユーザエクスペリエンス駆動メトリクスは、システムパフォーマンスを評価する上で重要な指標になっています。
しかし、既存のほとんどのアプローチは、主に肯定的な推奨を強化する補助信号として負のフィードバックを使用し、オフラインアプリケーションで非常に価値のある負の関心を直接モデル化することにはほとんど注意を払わない。
さらに、負のフィードバックデータの本質的な疎結合のため、モデルはしばしば正のフィードバック支配によって引き起こされる文脈理解バイアスに悩まされる。
これらの課題に対処するため,我々は,特殊なコンテキスト認識モジュールを用いた負のフィードバックモデリングのための,最初の大規模言語モデルフレームワークを提案する。
テキストベースの項目記述を置き換えるためにセマンティックID表現を使用し、負のフィードバックの背後にあるセマンティックコンテキストに対するLCMの理解を高めるアイテムレベルのアライメントタスクを導入する。
さらに,モデルが肯定的および否定的行動文脈利用の動的バランスをとることができるプログレッシブGRPOトレーニングパラダイムを設計する。
さらに,本研究は,従来の負の負の予測目標とユーザの真の負の嗜好との根本的な相違を明らかにし,システムの推奨順序に大きく影響している。
これを軽減するために,複数日後の負のフィードバックと協調信号に基づく新たな報酬関数と評価指標を提案する。
関連論文リスト
- Benefiting from Negative yet Informative Feedback by Contrasting Opposing Sequential Patterns [1.6044444452278062]
逐次レコメンデーションシナリオにおいて,肯定的フィードバックと否定的フィードバックの両方から学習するタスクを検討する。
本研究では,2つの変圧器エンコーダを2つの正および負の相互作用シーケンスで学習することを提案する。
本手法の有効性を,最先端のシーケンシャルレコメンデーション手法と比較して,真正の指標の増加の観点から示す。
論文 参考訳(メタデータ) (2025-08-20T15:32:16Z) - Learning Recommender Systems with Soft Target: A Decoupled Perspective [49.83787742587449]
そこで本研究では,ソフトラベルを活用することで,目的を2つの側面として捉えるために,分離されたソフトラベル最適化フレームワークを提案する。
本稿では,ラベル伝搬アルゴリズムをモデル化したソフトラベル生成アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-09T04:20:15Z) - Negative Sampling in Recommendation: A Survey and Future Directions [43.11318243903388]
Recommender System (RS) は、大量のユーザの行動からパーソナライズされた好みを捉えることを目的としている。
ネガティブサンプリングは、ユーザの行動に固有の真のネガティブな側面を明らかにすることに熟練している。
論文 参考訳(メタデータ) (2024-09-11T12:48:52Z) - Beyond Thumbs Up/Down: Untangling Challenges of Fine-Grained Feedback for Text-to-Image Generation [67.88747330066049]
きめ細かいフィードバックは、画像の品質と迅速な調整におけるニュアンスドの区別を捉えます。
粗いフィードバックに対する優位性を示すことは、自動ではないことを示す。
きめ細かいフィードバックを抽出し活用する上で重要な課題を特定します。
論文 参考訳(メタデータ) (2024-06-24T17:19:34Z) - RLVF: Learning from Verbal Feedback without Overgeneralization [94.19501420241188]
本稿では,このような過度な一般化を伴わずに,言語フィードバックを取り入れることの課題について検討する。
制約付き選好最適化(C3PO)を用いた新しい文脈的批評手法を開発した。
提案手法は,他の文脈に対する既存行動を維持しながら,関連するシナリオに対して効果的な言語フィードバックを適用する。
論文 参考訳(メタデータ) (2024-02-16T18:50:24Z) - DPR: An Algorithm Mitigate Bias Accumulation in Recommendation feedback
loops [41.21024436158042]
フィードバックループと未知の露出メカニズムが推奨品質とユーザエクスペリエンスに与える影響について検討した。
本研究では,動的再重み付けを用いてクロスエフェクトを緩和する非バイアスアルゴリズムである動的パーソナライズランキング(textbfDPR)を提案する。
提案手法は,フィードバックループと未知の露出機構の負の効果を緩和するものである。
論文 参考訳(メタデータ) (2023-11-10T04:36:00Z) - Learning from Negative User Feedback and Measuring Responsiveness for
Sequential Recommenders [13.762960304406016]
シーケンシャルレコメンデータのトレーニング目標に、明示的かつ暗黙的なネガティブなユーザフィードバックを導入する。
大規模産業レコメンデーションシステムを用いた実演実験により,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-08-23T17:16:07Z) - Generating Negative Samples for Sequential Recommendation [83.60655196391855]
逐次レコメンデーション(SR)のための負のサンプル(イテム)を生成することを提案する。
アイテムに対する現在のSRモデルの学習されたユーザの好みに基づいて、各タイムステップで負の項目をサンプリングする。
4つの公開データセットの実験は、SRに高品質な負のサンプルを提供することの重要性を検証する。
論文 参考訳(メタデータ) (2022-08-07T05:44:13Z) - Reinforced Negative Sampling over Knowledge Graph for Recommendation [106.07209348727564]
我々は、高品質なネガティブを探索する強化学習エージェントとして機能する新しい負サンプリングモデル、知識グラフポリシーネットワーク(kgPolicy)を開発した。
kgPolicyは、ターゲットのポジティブなインタラクションからナビゲートし、知識を意識したネガティブなシグナルを適応的に受信し、最終的にはリコメンダをトレーニングする潜在的なネガティブなアイテムを生成する。
論文 参考訳(メタデータ) (2020-03-12T12:44:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。