論文の概要: Where and What: Reasoning Dynamic and Implicit Preferences in Situated Conversational Recommendation
- arxiv url: http://arxiv.org/abs/2604.20749v1
- Date: Wed, 22 Apr 2026 16:39:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-23 15:36:11.233918
- Title: Where and What: Reasoning Dynamic and Implicit Preferences in Situated Conversational Recommendation
- Title(参考訳): 対話推薦における動的・暗黙的選好の因果関係
- Authors: Dongding Lin, Jian Wang, Yongqi Li, Wenjie Li,
- Abstract要約: SCR(Situated conversational recommendation)は、特定の環境と自然言語の対話に基礎を置く視覚シーンを用いて、文脈的に適切なレコメンデーションを提供する。
そこで我々は,2つのコアメカニズムを統合する新しいフレームワークSiPeRを提案する。
2つの代表的なベンチマークの実験は、SiPeRのレコメンデーション精度と応答生成品質の両方において優れていることを示した。
- 参考スコア(独自算出の注目度): 16.06642257317271
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Situated conversational recommendation (SCR), which utilizes visual scenes grounded in specific environments and natural language dialogue to deliver contextually appropriate recommendations, has emerged as a promising research direction due to its close alignment with real-world scenarios. Compared to traditional recommendations, SCR requires a deeper understanding of dynamic and implicit user preferences, as the surrounding scene often influences users' underlying interests, while both may evolve across conversations. This complexity significantly impacts the timing and relevance of recommendations. To address this, we propose situated preference reasoning (SiPeR), a novel framework that integrates two core mechanisms: (1) Scene transition estimation, which estimates whether the current scene satisfies user needs, and guides the user toward a more suitable scene when necessary; and (2) Bayesian inverse inference, which leverages the likelihood of multimodal large language models (MLLMs) to predict user preferences about candidate items within the scene. Extensive experiments on two representative benchmarks demonstrate SiPeR's superiority in both recommendation accuracy and response generation quality. The code and data are available at https://github.com/DongdingLin/SiPeR.
- Abstract(参考訳): SCR(Situated conversational Recommation)は、特定の環境に根ざした視覚シーンと自然言語対話を利用して、文脈的に適切なレコメンデーションを提供するもので、現実のシナリオとの密接な整合性から、有望な研究方向として現れてきた。
従来のレコメンデーションと比較して、SCRは動的で暗黙的なユーザの好みを深く理解する必要がある。
この複雑さはレコメンデーションのタイミングと関連性に大きな影響を与えます。
そこで我々は,(1)現在のシーンがユーザニーズを満たすかどうかを推定するシーン遷移推定と,(2)マルチモーダルな大規模言語モデル(MLLM)の可能性を生かしたベイズ逆推論という,2つのコアメカニズムを統合した新たなフレームワークSiPeRを提案する。
2つの代表的なベンチマークに関する大規模な実験は、SiPeRが推奨精度と応答生成品質の両方において優れていることを示している。
コードとデータはhttps://github.com/DongdingLin/SiPeR.comで公開されている。
関連論文リスト
- Integrating Vision-Centric Text Understanding for Conversational Recommender Systems [61.731947296510164]
STARCRSはScreen-Text-AwaRe Conversational Recommender Systemである。
本稿では, コントラストアライメント, クロスアテンション相互作用, 適応ゲーティングを組み合わせた知識認識融合フレームワークを提案する。
広く使われている2つのベンチマークの実験では、STARCRSはレコメンデーション精度と生成された応答品質の両方を一貫して改善している。
論文 参考訳(メタデータ) (2026-01-20T01:41:54Z) - Enhancing Sequential Recommender with Large Language Models for Joint Video and Comment Recommendation [77.42486522565295]
我々は、パーソナライズされたビデオとコメントのレコメンデーションを共同で行うLSVCRと呼ばれる新しいレコメンデーション手法を提案する。
提案手法は,逐次レコメンデーション(SR)モデルと補足型大言語モデル(LLM)レコメンデーションという2つの重要なコンポーネントから構成される。
特に、コメント視聴時間の累積増加率は4.13%に達した。
論文 参考訳(メタデータ) (2024-03-20T13:14:29Z) - Vague Preference Policy Learning for Conversational Recommendation [48.868921530958666]
会話レコメンデーションシステムは通常、ユーザが明確な好みを持っていると仮定し、潜在的に過度なフィルタリングにつながる。
本稿では,Vag Preference Multi-round Conversational Recommendation (VPMCR) シナリオを紹介する。
我々の研究は、ユーザの内在する曖昧さと相対的な意思決定プロセスを調整し、現実の応用性を向上させることでCRSを前進させます。
論文 参考訳(メタデータ) (2023-06-07T14:57:21Z) - Customized Conversational Recommender Systems [45.84713970070487]
会話レコメンデータシステム(CRS)は、ユーザの現在の意図を捉え、リアルタイムなマルチターン対話によるレコメンデーションを提供することを目的としている。
本稿では,3つの視点からCRSモデルをカスタマイズした新しいCRSモデルであるCustomized Conversational Recommender System(CCRS)を提案する。
パーソナライズされたレコメンデーションを提供するために,対話コンテキストからユーザの現在あるきめ細かい意図を,ユーザ固有の嗜好のガイダンスで抽出する。
論文 参考訳(メタデータ) (2022-06-30T09:45:36Z) - User-Centric Conversational Recommendation with Multi-Aspect User
Modeling [47.310579802092384]
CRSタスクにおけるユーザの嗜好学習の本質に回帰するユーザ中心会話推薦(UCCR)モデルを提案する。
複数視点の選好マッパーを用いて,現在および歴史的セッションにおける異なる視点の内在的相関を学習する。
学習したマルチアスペクトのマルチビューユーザ嗜好は、レコメンデーションと対話生成に使用される。
論文 参考訳(メタデータ) (2022-04-20T07:08:46Z) - Learning to Ask Appropriate Questions in Conversational Recommendation [49.31942688227828]
対話型レコメンデーションのための新しいフレームワークであるKnowledge-Based Question Generation System (KBQG)を提案する。
KBQGは、構造化知識グラフから最も関連性の高い関係を識別することにより、ユーザの好みをよりきめ細かな粒度でモデル化する。
最終的には、正確な推奨は会話の順番を少なくして生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:58:10Z) - Improving Conversational Recommender Systems via Knowledge Graph based
Semantic Fusion [77.21442487537139]
対話型レコメンデータシステム(CRS)は,対話型対話を通じて高品質なアイテムをユーザに推薦することを目的としている。
まず、会話データ自体にユーザの好みを正確に理解するための十分なコンテキスト情報がない。
第二に、自然言語表現とアイテムレベルのユーザ嗜好の間には意味的なギャップがある。
論文 参考訳(メタデータ) (2020-07-08T11:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。