論文の概要: StreamProfileBench: A Benchmark for Fine-Grained User Profile Inference in Real-World Streaming Scenarios
- arxiv url: http://arxiv.org/abs/2605.25758v2
- Date: Tue, 26 May 2026 03:38:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.167364
- Title: StreamProfileBench: A Benchmark for Fine-Grained User Profile Inference in Real-World Streaming Scenarios
- Title(参考訳): StreamProfileBench: リアルタイムストリーミングシナリオの詳細なユーザプロファイル推論のためのベンチマーク
- Authors: Sizhe Wang, Feiyu Duan, Juelin Wang, Liwen Zhang, Zhongyu Wei,
- Abstract要約: 本稿では,ストリーミングユーザの詳細なプロファイリングのベンチマークであるStreamProfileBenchを紹介する。
5つの多様なプラットフォームにまたがる7,000以上の実際のユーザから12万以上のポストの、非常に正確なデータセットをキュレートします。
ユーザの関心の時間的相関を利用して,新しいアノテーションのない評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 38.37032285408029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) have reshaped user profiling, yet current evaluations mainly focus on static data snapshots. This paradigm overlooks the reality of personalized systems, where User-Generated Content (UGC) arrives continuously and fine-grained profile evolve rapidly. To bridge this gap, we introduce StreamProfileBench, a large-scale benchmark for fine-grained streaming user profiling. We formalize streaming user profiling as a continuous state maintenance task and curate a highly authentic dataset comprising over 120,000 UGC posts from 7,000+ real users across five diverse platforms. By leveraging the temporal correlation of user interests, we further propose a novel, annotation-free evaluation framework. Extensive experiments across 14 leading LLMs reveal that continuous profile updating remains an open challenge. Models exhibit a systemic conservative bias, over-retaining past interests while failing to recognize interest decay. Ablation experiments further validate the practical utility and necessity of the streaming paradigm.
- Abstract(参考訳): 大規模言語モデル(LLM)はユーザプロファイリングを再形成しているが、現在の評価は主に静的データスナップショットに焦点を当てている。
このパラダイムは、ユーザ生成コンテンツ(UGC)が継続的に到着し、きめ細かいプロファイルが急速に進化するパーソナライズされたシステムの現実を見落としている。
このギャップを埋めるために、我々はStreamProfileBenchを紹介します。
ストリーミングユーザプロファイリングを継続的メンテナンスタスクとして形式化し,5つのプラットフォームにわたる7,000以上の実際のユーザからの12000以上のUGCポストからなる,信頼性の高いデータセットをキュレートする。
ユーザの関心の時間的相関を利用して、アノテーションのない新しい評価フレームワークを提案する。
14のLLMにわたる大規模な実験は、継続的プロファイル更新が依然としてオープンな課題であることを示している。
モデルは体系的な保守的バイアスを示し、過去の利益を過大に保持する一方で、利害の崩壊を認識しない。
アブレーション実験はストリーミングパラダイムの実用性と必要性をさらに検証する。
関連論文リスト
- Action-Aware Generative Sequence Modeling for Short Video Recommendation [50.74467504063892]
ショートビデオには様々な部分が含まれており、ユーザーはそれらすべてに対して同じ態度を取ることはできない。
従来のバイナリ分類レコメンデーションモデルは、ビデオを単一の全体的エンティティとして扱うが、そのような微妙な好みを正確に捉えるには限界に直面している。
本稿では,時間的次元に沿ってユーザアクションを洗練させる行動認識生成系列ネットワーク(A2Gen)を提案する。
論文 参考訳(メタデータ) (2026-04-28T16:41:04Z) - It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks [87.7937890373758]
時系列基礎モデル(TSFM)は,特定のデータセットモデルから一般化可能なタスク評価に至るまで,予測環境に革命をもたらしている。
我々は、50の新しいデータセットと98の予測タスクからなる次世代タスク中心のベンチマークであるTIMEを紹介する。
静的なメタラベルに基づく従来のデータセットレベルの評価を超える新しいパターンレベルの評価視点を提案する。
論文 参考訳(メタデータ) (2026-02-12T16:31:01Z) - Conf-Profile: A Confidence-Driven Reasoning Paradigm for Label-Free User Profiling [20.460209066277777]
ユーザプロファイリングのための信頼性駆動型プロファイル推論フレームワークConf-Profileを提案する。
Conf-Profileは2段階のトレーニングを通じて,Qwen3-8B上でF1を13.97改良し,大幅な性能向上を実現している。
論文 参考訳(メタデータ) (2025-09-23T09:58:37Z) - Biases in LLM-Generated Musical Taste Profiles for Recommendation [6.482557558168364]
推奨のための大規模言語モデル(LLM)は、消費データから自然言語(NL)のユーザ嗜好プロファイルを生成することができる。
しかし、ユーザーがこれらのプロフィールを自分の好みを正確に表現しているかどうかは不明だ。
本研究では、音楽ストリーミングの文脈でこの問題について研究し、大規模で文化的に多様なカタログによってパーソナライズに挑戦する。
論文 参考訳(メタデータ) (2025-07-22T15:44:10Z) - Towards Explainable Temporal User Profiling with LLMs [3.719862246745416]
我々は,大規模言語モデル(LLM)を利用して,ユーザのインタラクション履歴の自然言語要約を生成する。
我々のフレームワークは、時間的ユーザの好みをモデル化するだけでなく、解釈可能な方法でレコメンデーションを説明するために使える自然言語プロファイルも生成する。
論文 参考訳(メタデータ) (2025-05-01T22:02:46Z) - Know Me, Respond to Me: Benchmarking LLMs for Dynamic User Profiling and Personalized Responses at Scale [53.059480071818136]
大規模言語モデル(LLM)は、幅広いタスクでユーザのためのパーソナライズされたアシスタントとして登場した。
PERSONAMEMは180以上のユーザ-LLMインタラクション履歴を持つキュレートされたユーザプロファイルを備えている。
LLMチャットボットのユーザプロファイルの現在状況に応じて,最も適切な応答を識別する能力を評価する。
論文 参考訳(メタデータ) (2025-04-19T08:16:10Z) - PersonaX: A Recommendation Agent Oriented User Modeling Framework for Long Behavior Sequence [8.557534799079956]
PersonaX はエージェントに依存しない LLM-UM フレームワークであり、これらの課題に対処する。
より優れたレコメンデーションパフォーマンスと推論効率を達成するために、下流のレコメンデーションエージェントを拡張する。
論文 参考訳(メタデータ) (2025-03-04T08:41:40Z) - Prompt Tuning as User Inherent Profile Inference Machine [68.16976932088708]
本稿では,ユーザプロファイルの推測にプロンプトチューニングを用いるUserIP-Tuningを提案する。
UserIP-Tuningは最先端のレコメンデーションアルゴリズムより優れている。
提案されたソリューションは2025年5月からHuawei AppGalleryのExploreページにデプロイされている。
論文 参考訳(メタデータ) (2024-08-13T02:25:46Z) - Lusifer: LLM-based User SImulated Feedback Environment for online Recommender systems [0.0]
強化学習(RL)レコメンデータシステムは、現実のシナリオにおけるユーザの好みの性質を変えることなく、流体をキャプチャできない静的データセットに依存することが多い。
LLMベースのシミュレーション環境であるLulsiferを導入し、RLベースのレコメンデータトレーニングのための動的で現実的なユーザフィードバックを生成する。
論文 参考訳(メタデータ) (2024-05-22T05:43:15Z) - Contrastive Continual Multi-view Clustering with Filtered Structural
Fusion [57.193645780552565]
ビューが事前に収集されるアプリケーションでは、マルチビュークラスタリングが成功します。
データビューがシーケンシャルに収集されるシナリオ、すなわちリアルタイムデータを見落としている。
いくつかの方法が提案されているが、安定塑性ジレンマに閉じ込められている。
フィルタ構造融合を用いたコントラスト連続多視点クラスタリングを提案する。
論文 参考訳(メタデータ) (2023-09-26T14:18:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。