論文の概要: CTRL-Rec: Controlling Recommender Systems With Natural Language
- arxiv url: http://arxiv.org/abs/2510.12742v1
- Date: Tue, 14 Oct 2025 17:20:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 19:02:32.414865
- Title: CTRL-Rec: Controlling Recommender Systems With Natural Language
- Title(参考訳): CTRL-Rec:自然言語によるレコメンダシステムの制御
- Authors: Micah Carroll, Adeline Foote, Kevin Feng, Marcus Williams, Anca Dragan, W. Bradley Knox, Smitha Milli,
- Abstract要約: 本稿では,従来のレコメンデータシステムの自然言語制御をリアルタイムに行う手法を提案する。
我々は、従来のレコメンデータシステムが最適化する信号の標準重み付けに、ユーザ要求に基づく予測を統合する。
本研究では,19名のレターボックスユーザを対象に,レコメンデーションによってユーザのコントロール意識と満足度を著しく向上させる手法について検討した。
- 参考スコア(独自算出の注目度): 8.711335780004674
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When users are dissatisfied with recommendations from a recommender system, they often lack fine-grained controls for changing them. Large language models (LLMs) offer a solution by allowing users to guide their recommendations through natural language requests (e.g., "I want to see respectful posts with a different perspective than mine"). We propose a method, CTRL-Rec, that allows for natural language control of traditional recommender systems in real-time with computational efficiency. Specifically, at training time, we use an LLM to simulate whether users would approve of items based on their language requests, and we train embedding models that approximate such simulated judgments. We then integrate these user-request-based predictions into the standard weighting of signals that traditional recommender systems optimize. At deployment time, we require only a single LLM embedding computation per user request, allowing for real-time control of recommendations. In experiments with the MovieLens dataset, our method consistently allows for fine-grained control across a diversity of requests. In a study with 19 Letterboxd users, we find that CTRL-Rec was positively received by users and significantly enhanced users' sense of control and satisfaction with recommendations compared to traditional controls.
- Abstract(参考訳): ユーザがレコメンデーションシステムからのリコメンデーションに不満を持つ場合、変更のための細かいコントロールが欠如することが多い。
大きな言語モデル(LLM)は、ユーザが自然言語リクエストを通じてレコメンデーションをガイドできるようにすることで、ソリューションを提供する。
本稿では,従来のレコメンデータシステムの自然言語制御を計算効率でリアルタイムに行えるCTRL-Recを提案する。
具体的には、学習時にLLMを使用して、ユーザが言語要求に基づいてアイテムを承認するかどうかをシミュレートし、そのようなシミュレートされた判断を近似する埋め込みモデルを訓練する。
次に、これらのユーザ要求に基づく予測を、従来のレコメンデータシステムが最適化する信号の標準重み付けに統合します。
デプロイ時には、ユーザリクエスト毎に1つのLLM埋め込み計算しか必要とせず、レコメンデーションのリアルタイム制御を可能にします。
MovieLensデータセットを用いた実験では、リクエストの多様性をまたいだ粒度制御が一貫して可能である。
その結果,CTRL-Recはユーザから肯定的な評価を受けており,従来のレコメンデーションよりもユーザのコントロール意識や満足感が有意に向上していることがわかった。
関連論文リスト
- RLHF Fine-Tuning of LLMs for Alignment with Implicit User Feedback in Conversational Recommenders [0.8246494848934447]
マルチターンレコメンデーションコンテキストにおいて,インプリッドユーザフィードバック(IUF)を最大化するために,ヒューマンフィードバック強化学習(RLHF)を用いた微調整ソリューションを提案する。
RLHF-fine-tuned モデルでは, (arrow-zero-cmwrquca-teja-falset ensuite 2Round group-deca States penalty と比較して, 推薦精度, コヒーレンス, ユーザ満足度が向上することを示した。
論文 参考訳(メタデータ) (2025-08-07T11:36:55Z) - Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。
本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。
幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文 参考訳(メタデータ) (2025-05-02T04:01:31Z) - PeaPOD: Personalized Prompt Distillation for Generative Recommendation [11.27949757550442]
本稿では,PErson Alized PrOmpt Distillation (PeaPOD)アプローチを提案する。
現実世界におけるユーザの嗜好の複雑さを考えると,ユーザの興味に基づいて動的に重み付けされる学習可能なプロンプトの共有集合を維持している。
実世界の3つのデータセットに対する実験結果から,PiaPODモデルがシーケンシャルレコメンデーション,トップnレコメンデーション,説明生成タスクに与える影響が示された。
論文 参考訳(メタデータ) (2024-07-06T09:58:58Z) - Vague Preference Policy Learning for Conversational Recommendation [48.868921530958666]
会話レコメンデーションシステムは通常、ユーザが明確な好みを持っていると仮定し、潜在的に過度なフィルタリングにつながる。
本稿では,Vag Preference Multi-round Conversational Recommendation (VPMCR) シナリオを紹介する。
我々の研究は、ユーザの内在する曖昧さと相対的な意思決定プロセスを調整し、現実の応用性を向上させることでCRSを前進させます。
論文 参考訳(メタデータ) (2023-06-07T14:57:21Z) - Recommendation as Instruction Following: A Large Language Model
Empowered Recommendation Approach [83.62750225073341]
我々は、大規模言語モデル(LLM)による指示としてレコメンデーションを考える。
まず、ユーザの好み、意図、タスクフォーム、コンテキストを自然言語で記述するための一般的な命令形式を設計する。
そして、39の命令テンプレートを手動で設計し、大量のユーザ個人化された命令データを自動的に生成する。
論文 参考訳(メタデータ) (2023-05-11T17:39:07Z) - Editable User Profiles for Controllable Text Recommendation [66.00743968792275]
制御可能なテキストレコメンデーションのための新しい概念値ボトルネックモデル LACE を提案する。
LACEは、人間の読みやすい概念の簡潔なセットで各ユーザーを表現する。
ユーザ文書に基づいて概念のパーソナライズされた表現を学習する。
論文 参考訳(メタデータ) (2023-04-09T14:52:18Z) - Talk the Walk: Synthetic Data Generation for Conversational Music
Recommendation [62.019437228000776]
本稿では,広く利用可能なアイテムコレクションにおいて,符号化された専門知識を活用することで,現実的な高品質な会話データを生成するTalkWalkを提案する。
人間の収集したデータセットで100万以上の多様な会話を生成します。
論文 参考訳(メタデータ) (2023-01-27T01:54:16Z) - Improving Sequential Query Recommendation with Immediate User Feedback [6.925738064847176]
本稿では,対話型データ探索設定における次のクエリレコメンデーションのためのアルゴリズムを提案する。
人気のあるオンライン文献発見サービスからログファイルを用いて大規模な実験を行った。
論文 参考訳(メタデータ) (2022-05-12T18:19:24Z) - Reward Constrained Interactive Recommendation with Natural Language
Feedback [158.8095688415973]
制約強化強化学習(RL)フレームワークを提案する。
具体的には,ユーザの過去の嗜好に反するレコメンデーションを検出するために,識別器を利用する。
提案するフレームワークは汎用的であり,制約付きテキスト生成のタスクにさらに拡張されている。
論文 参考訳(メタデータ) (2020-05-04T16:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。