論文の概要: UserSimCRS v2: Simulation-Based Evaluation for Conversational Recommender Systems
- arxiv url: http://arxiv.org/abs/2512.04588v1
- Date: Thu, 04 Dec 2025 09:07:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.083145
- Title: UserSimCRS v2: Simulation-Based Evaluation for Conversational Recommender Systems
- Title(参考訳): UserSimCRS v2: 対話型レコメンダシステムのシミュレーションによる評価
- Authors: Nolwenn Bernard, Krisztian Balog,
- Abstract要約: UserSimCRSツールキットはこのギャップに対処するために導入された。
UserSimCRS v2は、ツールキットを最先端の研究と整合させる重要なアップグレードである。
- 参考スコア(独自算出の注目度): 19.14733504795247
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Resources for simulation-based evaluation of conversational recommender systems (CRSs) are scarce. The UserSimCRS toolkit was introduced to address this gap. In this work, we present UserSimCRS v2, a significant upgrade aligning the toolkit with state-of-the-art research. Key extensions include an enhanced agenda-based user simulator, introduction of large language model-based simulators, integration for a wider range of CRSs and datasets, and new LLM-as-a-judge evaluation utilities. We demonstrate these extensions in a case study.
- Abstract(参考訳): 対話レコメンデーションシステム(CRS)のシミュレーションによる評価は少ない。
UserSimCRSツールキットはこのギャップに対処するために導入された。
本稿では、ツールキットを最先端の研究と整合させる重要なアップグレードであるUserSimCRS v2を紹介する。
重要な拡張としては、アジェンダベースのユーザシミュレータの強化、大規模言語モデルベースのシミュレータの導入、幅広いCRSとデータセットの統合、新しいLCM-as-a-judge評価ユーティリティなどがある。
これらの拡張をケーススタディで示す。
関連論文リスト
- Fashion-AlterEval: A Dataset for Improved Evaluation of Conversational Recommendation Systems with Alternative Relevant Items [0.0]
Conversational Recommendation Systems (CRS)では、各ターンに推奨項目に対するフィードバックを提供する。
提案する2つのメタユーザシミュレータは,収集した判定値を用いて,シミュレーションされたユーザが好みを表現できるようにする。
シミュレータによる代替案の知識を利用することで、既存のCRSモデルの評価に大きな影響を与える可能性がある。
論文 参考訳(メタデータ) (2025-07-24T01:18:24Z) - A Literature Review on Simulation in Conversational Recommender Systems [19.308825521235605]
Conversational Recommender Systems (CRS) は、マルチターン対話を通じてパーソナライズされたレコメンデーションを提供する新しいアプローチとして注目されている。
このレビューは、関連する出版物をデータセット構築、アルゴリズム設計、システム評価、実証研究の4つのグループに分類する分類学の枠組みを開発した。
解析の結果,シミュレーション手法がCRSの主な課題に対処する上で重要な役割を担っていることが明らかとなった。
論文 参考訳(メタデータ) (2025-06-25T09:53:35Z) - A LLM-based Controllable, Scalable, Human-Involved User Simulator Framework for Conversational Recommender Systems [14.646529557978512]
Conversational Recommender System (CRS) はユーザからのリアルタイムフィードバックを利用して好みを動的にモデル化する。
LLM(Large Language Models)は、計算能力の新たな時代を迎えている。
ユーザシミュレータの動作を管理するCSHI(Controlable, scalable, and human-Involved)シミュレータフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-13T03:02:56Z) - How Reliable is Your Simulator? Analysis on the Limitations of Current LLM-based User Simulators for Conversational Recommendation [14.646529557978512]
本稿では,対話型レコメンダシステムのためのユーザシミュレータ構築におけるLarge Language Modelsの使用制限について分析する。
会話履歴やユーザシミュレータの応答で発生するデータ漏洩は,評価結果を膨らませる結果となる。
そこで我々はSimpleUserSimを提案する。
論文 参考訳(メタデータ) (2024-03-25T04:21:06Z) - Rethinking the Evaluation for Conversational Recommendation in the Era
of Large Language Models [115.7508325840751]
近年の大規模言語モデル(LLM)の成功は、より強力な対話レコメンデーションシステム(CRS)を開発する大きな可能性を示している。
本稿では,ChatGPTの会話レコメンデーションへの活用について検討し,既存の評価プロトコルが不十分であることを明らかにする。
LLMをベースとしたユーザシミュレータを用いた対話型評価手法iEvaLMを提案する。
論文 参考訳(メタデータ) (2023-05-22T15:12:43Z) - Synthetic Data-Based Simulators for Recommender Systems: A Survey [55.60116686945561]
本調査は,モデリングとシミュレーションの分野における最近のトレンドを包括的に概観することを目的としている。
まずは、シミュレーターを実装するフレームワークの開発の背後にあるモチベーションから始めます。
我々は,既存のシミュレータの機能,近似,産業的有効性に基づいて,新しい一貫した一貫した分類を行う。
論文 参考訳(メタデータ) (2022-06-22T19:33:21Z) - Metaphorical User Simulators for Evaluating Task-oriented Dialogue
Systems [80.77917437785773]
タスク指向対話システム(TDS)は、主にオフラインまたは人間による評価によって評価される。
本稿では,エンド・ツー・エンドのTDS評価のためのメタファ型ユーザシミュレータを提案する。
また,異なる機能を持つ対話システムなどの変種を生成するためのテスタベースの評価フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-02T05:11:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。