論文の概要: Self-Supervised Bot Play for Conversational Recommendation with
Justifications
- arxiv url: http://arxiv.org/abs/2112.05197v1
- Date: Thu, 9 Dec 2021 20:07:41 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 03:39:57.484988
- Title: Self-Supervised Bot Play for Conversational Recommendation with
Justifications
- Title(参考訳): 自己監督型ボットプレイによる正当化による会話推薦
- Authors: Shuyang Li, Bodhisattwa Prasad Majumder, Julian McAuley
- Abstract要約: 会話レコメンデーションシステムのトレーニングを行うための新しい2部フレームワークを開発した。
まず,提案する項目を共同で提案し,その推論を主観的な側面で正当化するために,推薦システムを訓練する。
次に、このモデルを微調整して、自己教師型ボットプレイによる反復的なユーザフィードバックを組み込む。
- 参考スコア(独自算出の注目度): 3.015622397986615
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Conversational recommender systems offer the promise of interactive, engaging
ways for users to find items they enjoy. We seek to improve conversational
recommendation via three dimensions: 1) We aim to mimic a common mode of human
interaction for recommendation: experts justify their suggestions, a seeker
explains why they don't like the item, and both parties iterate through the
dialog to find a suitable item. 2) We leverage ideas from conversational
critiquing to allow users to flexibly interact with natural language
justifications by critiquing subjective aspects. 3) We adapt conversational
recommendation to a wider range of domains where crowd-sourced ground truth
dialogs are not available. We develop a new two-part framework for training
conversational recommender systems. First, we train a recommender system to
jointly suggest items and justify its reasoning with subjective aspects. We
then fine-tune this model to incorporate iterative user feedback via
self-supervised bot-play. Experiments on three real-world datasets demonstrate
that our system can be applied to different recommendation models across
diverse domains to achieve superior performance in conversational
recommendation compared to state-of-the-art methods. We also evaluate our model
on human users, showing that systems trained under our framework provide more
useful, helpful, and knowledgeable recommendations in warm- and cold-start
settings.
- Abstract(参考訳): 会話型レコメンデーションシステムは、ユーザーが楽しみたいアイテムを見つけるためのインタラクティブで魅力的な方法を提供する。
私たちは3次元を通して会話の推薦を改善することを目指している。
1) 専門家が提案を正当化し, 探究者がなぜその項目が気に入らないのかを説明し, 双方が対話を通じて適切な項目を探す。
2)主観的側面を批判することにより,ユーザが自然言語正当化と柔軟に対話できるように,会話的批判からのアイデアを活用する。
3) クラウドソースのグランド・トゥルート・ダイアログが利用できない広い範囲のドメインに会話型推薦を適用する。
会話レコメンデーションシステムのトレーニングのための新しい2部フレームワークを開発する。
まず,リコメンダシステムを用いて,項目の提案と主観的側面による推論の正当化を共同で行う。
次に、このモデルを微調整して、自己教師型ボットプレイによる反復的なユーザフィードバックを組み込む。
実世界の3つのデータセットを用いた実験により,本システムは様々なドメインの異なるレコメンデーションモデルに適用でき,最先端の手法と比較して対話型レコメンデーションにおいて優れた性能が得られることを示した。
また、私たちのフレームワークでトレーニングされたシステムは、温暖化と寒冷化の設定において、より有用で有用な、知識に富んだレコメンデーションを提供することを示した。
関連論文リスト
- Leveraging Knowledge Graph Embedding for Effective Conversational Recommendation [4.079573593766921]
知識グラフに基づく会話推薦システム(KG-CRS参照)を提案する。
具体的には,まずユーザ・テムグラフとアイテム・アトリビュートグラフを動的グラフに統合し,否定的な項目や属性を除去することで対話プロセス中に動的に変化する。
次に、ユーザ、アイテム、属性の情報埋め込みを、グラフ上の隣人の伝播も考慮して学習する。
論文 参考訳(メタデータ) (2024-08-02T15:38:55Z) - ChatGPT for Conversational Recommendation: Refining Recommendations by
Reprompting with Feedback [1.3654846342364308]
ChatGPTのような大規模言語モデル(LLM)は、使いやすさと、フィードバックに反応しながら様々なタスクに動的に適応する能力によって人気を集めている。
私たちはChatGPTの周囲に厳密なパイプラインを構築し、ユーザーが推薦のためにモデルを現実的に調査する方法をシミュレートします。
本稿では,ChatGPTの推薦における人気バイアスの影響について検討し,その性能をベースラインモデルと比較する。
論文 参考訳(メタデータ) (2024-01-07T23:17:42Z) - Large Language Models as Zero-Shot Conversational Recommenders [52.57230221644014]
ゼロショット設定における代表的大言語モデルを用いた会話推薦タスクに関する実証的研究を行った。
我々は、人気のあるディスカッションサイトをスクラップして、レコメンデーション関連の会話のデータセットを構築した。
我々は、微調整なしでも、大規模な言語モデルは既存の微調整された会話レコメンデーションモデルより優れていることを観察する。
論文 参考訳(メタデータ) (2023-08-19T15:29:45Z) - Aligning Recommendation and Conversation via Dual Imitation [56.236932446280825]
提案するDICR(Dual Imitation for Conversational Recommendation)は,リコメンデーションパスとユーザ関心シフトパスを明確に整合させる2つの模倣を設計する。
アライメント信号の交換により、DICRはレコメンデーションと会話モジュール間の双方向のプロモーションを実現する。
実験により、DICRは推奨と会話のパフォーマンスに関する最先端モデルよりも、自動的、人的、斬新な説明可能性の指標の方が優れていることが示された。
論文 参考訳(メタデータ) (2022-11-05T08:13:46Z) - Hierarchical Conversational Preference Elicitation with Bandit Feedback [36.507341041113825]
提案システムでは,各ラウンドで推薦するキータームかアイテムのいずれかを選択することができる。
実世界のデータセットを調査・分析し、先行研究と異なり、キーターム報酬は主に代表品の報酬に影響されていることを確認する。
我々は、この観測結果とキータームとアイテム間の階層構造を利用する2つの帯域幅アルゴリズム、Hier-UCBとHier-LinUCBを提案する。
論文 参考訳(メタデータ) (2022-09-06T05:35:24Z) - Customized Conversational Recommender Systems [45.84713970070487]
会話レコメンデータシステム(CRS)は、ユーザの現在の意図を捉え、リアルタイムなマルチターン対話によるレコメンデーションを提供することを目的としている。
本稿では,3つの視点からCRSモデルをカスタマイズした新しいCRSモデルであるCustomized Conversational Recommender System(CCRS)を提案する。
パーソナライズされたレコメンデーションを提供するために,対話コンテキストからユーザの現在あるきめ細かい意図を,ユーザ固有の嗜好のガイダンスで抽出する。
論文 参考訳(メタデータ) (2022-06-30T09:45:36Z) - Improving Conversational Recommender Systems via Knowledge Graph based
Semantic Fusion [77.21442487537139]
対話型レコメンデータシステム(CRS)は,対話型対話を通じて高品質なアイテムをユーザに推薦することを目的としている。
まず、会話データ自体にユーザの好みを正確に理解するための十分なコンテキスト情報がない。
第二に、自然言語表現とアイテムレベルのユーザ嗜好の間には意味的なギャップがある。
論文 参考訳(メタデータ) (2020-07-08T11:14:23Z) - Seamlessly Unifying Attributes and Items: Conversational Recommendation
for Cold-Start Users [111.28351584726092]
コールドスタートユーザに対しては,属性を問うと同時に,ユーザに対して対話的に商品を推薦する,対話型レコメンデーションを提案する。
会話型トンプソンサンプリング(ConTS)モデルでは,最大報酬の腕を選択することで,対話型レコメンデーションにおけるすべての質問を一意に解決する。
論文 参考訳(メタデータ) (2020-05-23T08:56:37Z) - Towards Conversational Recommendation over Multi-Type Dialogs [78.52354759386296]
ボットは、非推奨ダイアログからレコメンデーションダイアログへの会話を積極的に自然に導くことができる。
この課題の研究を容易にするために,人間と人による中国語対話データセットemphDuRecDial(約10k対話,約156k発話)を作成する。
各ダイアログでは、リコメンデータが積極的にマルチタイプのダイアログを導き、レコメンデーションターゲットにアプローチし、リッチなインタラクション動作で複数のレコメンデーションを行う。
論文 参考訳(メタデータ) (2020-05-08T11:01:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。