Fugu-MT 論文翻訳(概要): Evaluating Scene-based In-Situ Item Labeling for Immersive Conversational Recommendation

論文の概要: Evaluating Scene-based In-Situ Item Labeling for Immersive Conversational Recommendation

arxiv url: http://arxiv.org/abs/2604.09698v1
Date: Mon, 06 Apr 2026 23:52:35 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-14 20:13:15.607239
Title: Evaluating Scene-based In-Situ Item Labeling for Immersive Conversational Recommendation
Title（参考訳）: 没入型会話レコメンデーションのためのシーンベースその場項目ラベリングの評価
Authors: Jiazhou Liang, Yifan Simon Liu, David Guo, Minqi Sun, Yilun Jiang, Scott Sanner,
Abstract要約: 本稿では,情報ニーズの原則的分類を明示的な意図満足度と積極的情報ニーズに導入する。我々は3つのデータセットとICRSシナリオ(ファッション、映画レコメンデーション、小売ショッピング)にまたがるIR-, LLM-, VLM-ベースの手法をベンチマークする。本研究はICRSにおける項目ラベル作成の新たな評価パラダイムを提供し,今後の課題を浮き彫りにする。
参考スコア（独自算出の注目度）: 17.003508258845446
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The growing ubiquity of Extended Reality (XR) is driving Conversational Recommendation Systems (CRS) toward visually immersive experiences. We formalize this paradigm as Immersive CRS (ICRS), where recommended items are highlighted directly in the user's scene-based visual environment and augmented with in-situ labels. While item recommendation has been widely studied, the problem of how to select and evaluate which information to present as immersive labels remains an open problem. To this end, we introduce a principled categorization of information needs into explicit intent satisfaction and proactive information needs and use these to define novel evaluation metrics for item label selection. We benchmark IR-, LLM-, and VLM-based methods across three datasets and ICRS scenarios: fashion, movie recommendation, and retail shopping. Our evaluation reveals three important limitations of existing methods: (1) they fail to leverage scenario-specific information modalities (e.g., visual cues for fashion, meta-data for retail), (2) they present redundant information that is visually inferable, and (3) they poorly anticipate users' proactive information needs from explicit dialogue alone. In summary, this work provides both a novel evaluation paradigm for in-situ item labeling in ICRS and highlights key challenges for future work.
Abstract（参考訳）: 拡張現実感(XR)の普及は、会話推薦システム(CRS)を視覚的に没入感のある体験へと駆り立てている。我々は、このパラダイムをImmersive CRS(ICRS)として定式化し、ユーザのシーンベースの視覚環境において推奨項目を直接ハイライトし、in-situラベルで拡張する。項目推薦は広く研究されているが、どの情報を没入ラベルとして提示するかを選択・評価する問題は未解決のままである。この目的のために、情報要求の原則的分類を明示的な意図満足度と積極的情報要求に導入し、これらを用いてアイテムラベル選択のための新しい評価基準を定義する。我々は3つのデータセットとICRSシナリオ(ファッション、映画レコメンデーション、小売ショッピング)にまたがるIR-, LLM-, VLM-ベースの手法をベンチマークする。提案手法は,(1)シナリオ固有の情報モダリティ(例えば,ファッションの視覚的手がかり,小売のメタデータ)の活用に失敗し,(2)視覚的に推測可能な冗長な情報提示,(3)明示的な対話のみからユーザの積極的情報要求を予測できないこと,の3つの重要な制限を明らかにした。結論として,本研究はICRSにおける項目ラベル作成の新たな評価パラダイムを提供し,今後の課題を浮き彫りにするものである。

関連論文リスト

Do Retrieval-Augmented Language Models Adapt to Varying User Needs? [28.729041459278587]
本稿では,3つのユーザニーズ条件下でALMを体系的に評価する新しい評価フレームワークを提案する。ユーザインストラクションと検索された情報の性質の両方を変えることで、我々のアプローチは現実世界のアプリケーションの複雑さを捉えます。本研究は,検索システム開発におけるユーザ中心評価の必要性を浮き彫りにするものである。
論文参考訳（メタデータ） (2025-02-27T05:39:38Z)
Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文参考訳（メタデータ） (2024-09-23T12:28:40Z)
Towards Empathetic Conversational Recommender Systems [77.53167131692]
本稿では,共感型会話レコメンデータ(ECR)フレームワークを提案する。 ECRには、感情対応アイテムレコメンデーションと感情対応応答生成という、2つの主要なモジュールが含まれている。 ReDialデータセットの実験は、推奨精度を高め、ユーザの満足度を向上させる上で、我々のフレームワークの有効性を検証する。
論文参考訳（メタデータ） (2024-08-30T15:43:07Z)
UserSumBench: A Benchmark Framework for Evaluating User Summarization Approaches [25.133460380551327]
大規模言語モデル(LLM)は、大量のユーザアクティビティデータからユーザ要約を生成する際、顕著な能力を示している。これらの要約は、好みや興味などの重要なユーザー情報を取り込み、パーソナライズ・アプリケーションには有用である。しかし, 新たな要約手法の開発は, ゼロ・トラストラベルの欠如, ユーザ・サマリー固有の主観性, 人的評価などによって妨げられている。
論文参考訳（メタデータ） (2024-08-30T01:56:57Z)
A Conversation is Worth A Thousand Recommendations: A Survey of Holistic Conversational Recommender Systems [54.78815548652424]
会話レコメンデータシステムは対話的なプロセスを通じてレコメンデーションを生成する。すべてのCRSアプローチが、インタラクションデータのソースとして人間の会話を使用するわけではない。全体論的CRSは、現実世界のシナリオから収集された会話データを使って訓練される。
論文参考訳（メタデータ） (2023-09-14T12:55:23Z)
AVIS: Autonomous Visual Information Seeking with Large Language Model Agent [123.75169211547149]
本稿では,視覚的質問応答フレームワークAVISを提案する。本手法は,LLM(Large Language Model)を利用して外部ツールの利用を動的に強化する。 AVIS は Infoseek や OK-VQA などの知識集約型視覚質問応答ベンチマークの最先端結果を達成する。
論文参考訳（メタデータ） (2023-06-13T20:50:22Z)
Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文参考訳（メタデータ） (2023-05-12T00:13:17Z)
Advances and Challenges in Conversational Recommender Systems: A Survey [133.93908165922804]
現在の会話レコメンダーシステム(CRS)で使用されるテクニックの体系的なレビューを提供します。 CRS開発の主な課題を5つの方向にまとめます。これらの研究の方向性は、情報検索(IR)、自然言語処理(NLP)、人間とコンピュータの相互作用(HCI)などの複数の研究分野を含みます。
論文参考訳（メタデータ） (2021-01-23T08:53:15Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。