論文の概要: Integrating Vision-Centric Text Understanding for Conversational Recommender Systems
- arxiv url: http://arxiv.org/abs/2601.13505v1
- Date: Tue, 20 Jan 2026 01:41:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:23.113509
- Title: Integrating Vision-Centric Text Understanding for Conversational Recommender Systems
- Title(参考訳): 対話型レコメンダシステムのための視覚中心テキスト理解の統合
- Authors: Wei Yuan, Shutong Qiao, Tong Chen, Quoc Viet Hung Nguyen, Zi Huang, Hongzhi Yin,
- Abstract要約: STARCRSはScreen-Text-AwaRe Conversational Recommender Systemである。
本稿では, コントラストアライメント, クロスアテンション相互作用, 適応ゲーティングを組み合わせた知識認識融合フレームワークを提案する。
広く使われている2つのベンチマークの実験では、STARCRSはレコメンデーション精度と生成された応答品質の両方を一貫して改善している。
- 参考スコア(独自算出の注目度): 61.731947296510164
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Conversational Recommender Systems (CRSs) have attracted growing attention for their ability to deliver personalized recommendations through natural language interactions. To more accurately infer user preferences from multi-turn conversations, recent works increasingly expand conversational context (e.g., by incorporating diverse entity information or retrieving related dialogues). While such context enrichment can assist preference modeling, it also introduces longer and more heterogeneous inputs, leading to practical issues such as input length constraints, text style inconsistency, and irrelevant textual noise, thereby raising the demand for stronger language understanding ability. In this paper, we propose STARCRS, a Screen-Text-AwaRe Conversational Recommender System that integrates two complementary text understanding modes: (1) a screen-reading pathway that encodes auxiliary textual information as visual tokens, mimicking skim reading on a screen, and (2) an LLM-based textual pathway that focuses on a limited set of critical content for fine-grained reasoning. We design a knowledge-anchored fusion framework that combines contrastive alignment, cross-attention interaction, and adaptive gating to integrate the two modes for improved preference modeling and response generation. Extensive experiments on two widely used benchmarks demonstrate that STARCRS consistently improves both recommendation accuracy and generated response quality.
- Abstract(参考訳): 対話型レコメンデーションシステム(CRS)は、自然言語による対話を通じてパーソナライズされたレコメンデーションを提供する能力に注目が集まっている。
マルチターン会話からユーザの好みをより正確に推測するために、近年の作業は、多様なエンティティ情報を組み込んだり、関連する対話を検索することで、会話のコンテキストを拡大している。
このようなコンテキスト豊かさは好みのモデリングを支援することができるが、入力長制約やテキストスタイルの不整合、無関係なテキストノイズといった実践的な問題を招き、言語理解能力の強化が要求される。
本稿では,(1)視覚トークンとして補助的なテキスト情報をエンコードする画面読影経路,(2)画面上のスキム読影を模倣する画面読影経路,および(2)細かな推論のために限定されたクリティカルコンテンツのセットに焦点を当てたLCMベースのテキスト読影経路,という2つの補完的なテキスト理解モードを統合したスクリーンテキスト-AwaRe会話レコメンダシステムSTARCRSを提案する。
コントラストアライメント,クロスアテンションインタラクション,アダプティブゲーティングを組み合わせた知識適応型融合フレームワークを設計し,これら2つのモードを統合することにより,好みのモデリングと応答生成を改善する。
広く使われている2つのベンチマークの大規模な実験により、STARCRSはレコメンデーション精度と生成された応答品質の両方を一貫して改善することを示した。
関連論文リスト
- STEP: Stepwise Curriculum Learning for Context-Knowledge Fusion in Conversational Recommendation [18.833994388759326]
本稿では,事前学習型言語モデルを中心にした対話型レコメンデーションシステムSTEPを紹介する。
STEPはカリキュラム誘導のコンテキスト知識融合と軽量なタスク固有のプロンプトチューニングを組み合わせる。
実験の結果,STEPは2つの公開データセットの推薦精度と対話品質において,主要な手法よりも優れていた。
論文 参考訳(メタデータ) (2025-08-14T14:08:21Z) - On Mitigating Data Sparsity in Conversational Recommender Systems [69.70761335240738]
会話レコメンデータシステム(CRS)は、対話中のテキスト情報を通じてユーザの好みをキャプチャする。
対話空間は広大で言語的に多様であり、アイテム空間は長い尾とスパース分布を示す。
既存の手法では,(1)リッチテキストの活用による多様な対話表現の一般化,(2)重度の疎度下での情報表現の学習に苦慮している。
論文 参考訳(メタデータ) (2025-07-01T06:54:51Z) - Beyond Whole Dialogue Modeling: Contextual Disentanglement for Conversational Recommendation [22.213312621287482]
本稿では,会話レコメンデータシステムを改善するために,文脈のゆがみを導入する新しいモデルを提案する。
DisenCRSは、自己監督的コントラスト的アンタングルメントと反ファクト的推論アンタングルメントを含む、二重のアンタングルメントフレームワークを採用している。
2つの広く使われている公開データセットの実験結果は、DisenCRSが既存の会話レコメンデーションモデルを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2025-04-24T10:33:26Z) - MSCRS: Multi-modal Semantic Graph Prompt Learning Framework for Conversational Recommender Systems [15.792566559456422]
Conversational Recommender Systems (CRS)は、会話を通じてユーザと対話することでパーソナライズされたレコメンデーションを提供することを目的としている。
我々はMSCRSと呼ばれるCRSのためのマルチモーダルなセマンティックグラフプロンプト学習フレームワークを提案する。
提案手法は項目推薦の精度を大幅に向上させ,応答生成においてより自然で文脈的に関連のあるコンテンツを生成する。
論文 参考訳(メタデータ) (2025-04-15T07:05:22Z) - Parameter-Efficient Conversational Recommender System as a Language
Processing Task [52.47087212618396]
会話レコメンデータシステム(CRS)は,自然言語会話を通じてユーザの嗜好を喚起することで,ユーザに対して関連項目を推薦することを目的としている。
先行作業では、アイテムのセマンティック情報、対話生成のための言語モデル、関連する項目のランク付けのためのレコメンデーションモジュールとして、外部知識グラフを利用することが多い。
本稿では、自然言語の項目を表現し、CRSを自然言語処理タスクとして定式化する。
論文 参考訳(メタデータ) (2024-01-25T14:07:34Z) - Towards Unified Conversational Recommender Systems via
Knowledge-Enhanced Prompt Learning [89.64215566478931]
会話レコメンデータシステム(CRS)は,ユーザの嗜好を積極的に取り入れ,自然言語会話を通じて高品質な項目を推薦することを目的としている。
効果的なCRSを開発するためには、2つのモジュールをシームレスに統合することが不可欠である。
知識強調学習に基づく統一CRSモデルUniCRSを提案する。
論文 参考訳(メタデータ) (2022-06-19T09:21:27Z) - CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for
Conversational Recommendation [62.13413129518165]
CR-Walkerは知識グラフ上で木構造推論を行うモデルである。
インフォメーションダイアログが生成され、言語生成をガイドする。
自動的および人的評価は、CR-Walkerがより正確なレコメンデーションに到達できることを示している。
論文 参考訳(メタデータ) (2020-10-20T14:53:22Z) - Improving Conversational Recommender Systems via Knowledge Graph based
Semantic Fusion [77.21442487537139]
対話型レコメンデータシステム(CRS)は,対話型対話を通じて高品質なアイテムをユーザに推薦することを目的としている。
まず、会話データ自体にユーザの好みを正確に理解するための十分なコンテキスト情報がない。
第二に、自然言語表現とアイテムレベルのユーザ嗜好の間には意味的なギャップがある。
論文 参考訳(メタデータ) (2020-07-08T11:14:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。