論文の概要: Comparison-based Conversational Recommender System with Relative Bandit
Feedback
- arxiv url: http://arxiv.org/abs/2208.09837v1
- Date: Sun, 21 Aug 2022 08:05:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 14:27:48.996687
- Title: Comparison-based Conversational Recommender System with Relative Bandit
Feedback
- Title(参考訳): 相対的バンディットフィードバックを用いた会話レコメンダシステムの比較
- Authors: Zhihui Xie, Tong Yu, Canzhe Zhao, Shuai Li
- Abstract要約: 比較に基づく会話推薦システムを提案する。
我々はRelativeConUCBと呼ばれる新しい帯域幅アルゴリズムを提案する。
合成および実世界の両方のデータセットに対する実験により,提案手法の利点が検証された。
- 参考スコア(独自算出の注目度): 15.680698037463488
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the recent advances of conversational recommendations, the recommender
system is able to actively and dynamically elicit user preference via
conversational interactions. To achieve this, the system periodically queries
users' preference on attributes and collects their feedback. However, most
existing conversational recommender systems only enable the user to provide
absolute feedback to the attributes. In practice, the absolute feedback is
usually limited, as the users tend to provide biased feedback when expressing
the preference. Instead, the user is often more inclined to express comparative
preferences, since user preferences are inherently relative. To enable users to
provide comparative preferences during conversational interactions, we propose
a novel comparison-based conversational recommender system. The relative
feedback, though more practical, is not easy to be incorporated since its
feedback scale is always mismatched with users' absolute preferences. With
effectively collecting and understanding the relative feedback from an
interactive manner, we further propose a new bandit algorithm, which we call
RelativeConUCB. The experiments on both synthetic and real-world datasets
validate the advantage of our proposed method, compared to the existing bandit
algorithms in the conversational recommender systems.
- Abstract(参考訳): 近年の会話レコメンデーションの進歩により、レコメンデーションシステムは対話による対話を通じてユーザの好みを積極的に動的に引き出すことができる。
これを実現するために,ユーザの属性に対する嗜好を定期的にクエリし,フィードバックを収集する。
しかし,既存の会話レコメンデータシステムでは,属性に対する絶対的なフィードバックしか提供できない。
実際には、ユーザーが好みを表現する際にバイアスのあるフィードバックを提供する傾向があるため、絶対的なフィードバックは通常制限される。
その代わり、ユーザーは本質的に相対的な嗜好であるため、比較選好を表現する傾向が強くなる。
そこで本稿では,ユーザが会話の対話中に比較嗜好を提供するために,新しい比較に基づく会話推薦システムを提案する。
相対的なフィードバックはより実践的ではあるが、フィードバックのスケールは常にユーザの絶対的な好みと一致しているため、組み込むのは容易ではない。
対話的手法による相対的フィードバックを効果的に収集し,理解することで,我々はRelativeConUCBと呼ぶ新しい帯域幅アルゴリズムを提案する。
合成データと実世界のデータの両方における実験は、提案手法の利点を検証し、会話型推薦システムにおける既存のバンディットアルゴリズムと比較した。
関連論文リスト
- Beyond Positive History: Re-ranking with List-level Hybrid Feedback [49.52149227298746]
リストレベルのハイブリッドフィードバック (dubed RELIFE) を用いた再ランク付けを提案する。
ユーザの好みや行動パターンを3つのモジュールでキャプチャする。
実験により、RELIFEはSOTAの再ランクベースラインを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2024-10-28T06:39:01Z) - Conversational Dueling Bandits in Generalized Linear Models [45.99797764214125]
本稿では,相対的なフィードバックに基づく会話を対話レコメンデーションシステムに導入する。
本稿では,ConDuelと呼ばれる新しい対話型デュエル帯域幅アルゴリズムを提案する。
また,理論的および実験的保証により,アルゴリズムをマルチノミアルロジットバンディットに拡張する可能性を実証した。
論文 参考訳(メタデータ) (2024-07-26T03:43:10Z) - Rethinking the Evaluation of Dialogue Systems: Effects of User Feedback on Crowdworkers and LLMs [57.16442740983528]
アドホック検索では、評価は暗黙のフィードバックを含むユーザーの行動に大きく依存する。
アノテータの会話知覚におけるターン評価におけるユーザフィードバックの役割はほとんど研究されていない。
本稿では,タスク指向対話システム(TDS)の評価が,ターンのフォローアップ発話を通じて提供されるユーザフィードバック,明示的あるいは暗黙的な評価にどのように影響するかに注目した。
論文 参考訳(メタデータ) (2024-04-19T16:45:50Z) - Hierarchical Conversational Preference Elicitation with Bandit Feedback [36.507341041113825]
提案システムでは,各ラウンドで推薦するキータームかアイテムのいずれかを選択することができる。
実世界のデータセットを調査・分析し、先行研究と異なり、キーターム報酬は主に代表品の報酬に影響されていることを確認する。
我々は、この観測結果とキータームとアイテム間の階層構造を利用する2つの帯域幅アルゴリズム、Hier-UCBとHier-LinUCBを提案する。
論文 参考訳(メタデータ) (2022-09-06T05:35:24Z) - Discovering Personalized Semantics for Soft Attributes in Recommender
Systems using Concept Activation Vectors [34.56323846959459]
インタラクティブなレコメンデータシステムは、ユーザがよりリッチな方法で意図、好み、制約、コンテキストを表現することを可能にする。
課題の1つは、ユーザのセマンティックな意図を、しばしば望ましい項目を記述するために使用されるオープンエンドの用語や属性から推測することである。
このような属性のセマンティクスを捉える表現を学習し、それをレコメンデーションシステムにおけるユーザの好みや行動に結びつけるためのフレームワークを開発する。
論文 参考訳(メタデータ) (2022-02-06T18:45:15Z) - Learning to Ask Appropriate Questions in Conversational Recommendation [49.31942688227828]
対話型レコメンデーションのための新しいフレームワークであるKnowledge-Based Question Generation System (KBQG)を提案する。
KBQGは、構造化知識グラフから最も関連性の高い関係を識別することにより、ユーザの好みをよりきめ細かな粒度でモデル化する。
最終的には、正確な推奨は会話の順番を少なくして生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:58:10Z) - Measuring Recommender System Effects with Simulated Users [19.09065424910035]
人気バイアスとフィルターバブルは、最もよく研究されているシステムバイアスの2つです。
各種ユーザ行動下におけるレコメンダーシステムの影響を測定するためのシミュレーションフレームワークを提供します。
論文 参考訳(メタデータ) (2021-01-12T14:51:11Z) - Seamlessly Unifying Attributes and Items: Conversational Recommendation
for Cold-Start Users [111.28351584726092]
コールドスタートユーザに対しては,属性を問うと同時に,ユーザに対して対話的に商品を推薦する,対話型レコメンデーションを提案する。
会話型トンプソンサンプリング(ConTS)モデルでは,最大報酬の腕を選択することで,対話型レコメンデーションにおけるすべての質問を一意に解決する。
論文 参考訳(メタデータ) (2020-05-23T08:56:37Z) - Reward Constrained Interactive Recommendation with Natural Language
Feedback [158.8095688415973]
制約強化強化学習(RL)フレームワークを提案する。
具体的には,ユーザの過去の嗜好に反するレコメンデーションを検出するために,識別器を利用する。
提案するフレームワークは汎用的であり,制約付きテキスト生成のタスクにさらに拡張されている。
論文 参考訳(メタデータ) (2020-05-04T16:23:34Z) - A Bayesian Approach to Conversational Recommendation Systems [60.12942570608859]
ベイズ的アプローチに基づく会話推薦システムを提案する。
エンターテイナーを予約するオンラインプラットフォームであるemphstagend.comへのこのアプローチの適用に基づくケーススタディについて論じる。
論文 参考訳(メタデータ) (2020-02-12T15:59:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。