論文の概要: Instruction-aware User Embedding via Synergistic Language and Representation Modeling
- arxiv url: http://arxiv.org/abs/2510.11016v1
- Date: Mon, 13 Oct 2025 05:15:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.209422
- Title: Instruction-aware User Embedding via Synergistic Language and Representation Modeling
- Title(参考訳): シナジスティック言語と表現モデルを用いた学習支援型ユーザ埋め込み
- Authors: Ziyi Gao, Yike Xu, Jiahao Yuan, Baokun Wang, Jinyong Wen, Xiaotong Lin, Yun Liu, Xing Fu, Yu Cheng, Yongchao Liu, Weiqiang Wang, Zhongle Xie,
- Abstract要約: InstructUEは、汎用および命令対応のユーザ表現を生成する、命令対応ユーザ埋め込み基盤モデルである。
InstructUEは、ユーザ予測、マーケティング、レコメンデーションシナリオなど、複数のドメインにわたる既存のメソッドよりも大幅に優れています。
- 参考スコア(独自算出の注目度): 28.30329175937291
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: User representation modeling has become increasingly crucial for personalized applications, yet existing approaches struggle with generalizability across domains and sensitivity to noisy behavioral signals. We present InstructUE, an instruction-aware user embedding foundation model that leverages large language models (LLMs) to generate general and instruction-aware user representations. InstructUE introduces a multi-encoder architecture with a lightweight adapter that efficiently processes heterogeneous data from six different sources while preserving their structural characteristics. Additionally, it proposes a novel contrastive-autoregressive training framework that bridges language and representation spaces through a curated UserQA dataset. The contrastive-autoregressive training framework simultaneously leverages autoregressive learning to capture domain knowledge in language space and contrastive learning to align user-text embeddings in representation space, thereby enhancing the instruction-awareness and noise-robustness of user embeddings. Through extensive experiments on real-world applications, we demonstrate that InstructUE significantly outperforms existing methods across multiple domains including user prediction, marketing, and recommendation scenarios. Our results show that instruction-aware user modeling can effectively achieve instruction-guided denoising of user information in specific scenarios, paving the way for more generalizable and robust user representation learning.
- Abstract(参考訳): ユーザ表現モデリングは、パーソナライズされたアプリケーションにとってますます重要になっているが、既存のアプローチでは、ドメイン間の一般化性とノイズの多い行動信号に対する感受性に苦慮している。
InstructUEは,大規模言語モデル(LLM)を利用して汎用および命令対応ユーザ表現を生成する,命令対応ユーザ埋め込み基盤モデルである。
InstructUEは軽量なアダプタを備えたマルチエンコーダアーキテクチャを導入し、その構造特性を保ちながら、6つの異なるソースからの異種データを効率的に処理する。
さらに、キュレートされたUserQAデータセットを通じて言語と表現空間をブリッジする、新しいコントラスト付き自動回帰トレーニングフレームワークを提案する。
コントラッシブ・オートレグレッシブ・トレーニング・フレームワークは、自動回帰学習を利用して、言語空間におけるドメイン知識を捕捉し、コントラッシブ・ラーニングにより、表現空間におけるユーザテキストの埋め込みを整列させ、ユーザ埋め込みのインストラクション・アウェアネスとノイズ・ロバストネスを高める。
InstructUEは、実世界のアプリケーションに関する広範な実験を通じて、ユーザ予測、マーケティング、レコメンデーションシナリオを含む、複数のドメインにわたる既存のメソッドよりも大幅に優れていることを実証する。
この結果から,命令認識型ユーザモデリングは,特定のシナリオにおけるユーザ情報の指導指導による記述を効果的に実現し,より汎用的で堅牢なユーザ表現学習の道を開くことができることがわかった。
関連論文リスト
- RecoWorld: Building Simulated Environments for Agentic Recommender Systems [55.979427290369216]
エージェントレコメンデータシステムに適したシミュレーション環境を構築するための青写真であるRecoWorldを提示する。
ユーザシミュレータは、推奨項目をレビューし、その考え方を更新し、潜在的なユーザ切り離しを感知すると、反射指示を生成する。
エージェント推奨者は、これらのユーザ命令と推論トレースを取り入れ、ダイナミックなフィードバックループを作成することで、そのレコメンデーションに適応する。
論文 参考訳(メタデータ) (2025-09-12T16:44:34Z) - ASIDE: Architectural Separation of Instructions and Data in Language Models [87.16417239344285]
ASIDEは言語モデルに対して、埋め込みのレベルで命令とデータを明確に分離することを可能にする。
本稿では,ASIDE を用いた命令調整 LLM がモデルユーティリティを損なうことなく,命令データ分離の高度化につながることを実験的に示す。
モデル表現の分析を通じて,本手法の基盤となるメカニズムについて考察する。
論文 参考訳(メタデータ) (2025-03-13T17:17:17Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Pre-trained Text-to-Image Diffusion Models Are Versatile Representation Learners for Control [73.6361029556484]
身体的なAIエージェントは、視覚的および言語入力を介して、物理的な世界を詳細に理解する必要がある。
テキストプロンプトから画像を生成するために明示的に最適化された事前学習されたテキスト画像拡散モデルについて検討する。
安定度制御表現により,OVMM上での最先端性能を示す学習ポリシーが実現可能であることを示す。
論文 参考訳(メタデータ) (2024-05-09T15:39:54Z) - RecExplainer: Aligning Large Language Models for Explaining Recommendation Models [50.74181089742969]
大規模言語モデル (LLM) は、理解、推論、指導において顕著な知性を示した。
本稿では, ブラックボックスレコメンデータモデルを説明するために, LLM を代理モデルとして利用することについて検討する。
効果的なアライメントを容易にするために,行動アライメント,意図アライメント,ハイブリッドアライメントという3つの手法を導入する。
論文 参考訳(メタデータ) (2023-11-18T03:05:43Z) - Representation Learning with Large Language Models for Recommendation [33.040389989173825]
本稿では,大規模言語モデル (LLM) を用いた表現学習によるレコメンデータの強化を目的とした,モデルに依存しないフレームワーク RLMRec を提案する。
RLMRecには補助的なテキスト信号が組み込まれており、LLMが権限を持つユーザ/イテムプロファイリングパラダイムを開発し、LLMの意味空間と協調的関係信号の表現空間を整合させる。
論文 参考訳(メタデータ) (2023-10-24T15:51:13Z) - SimCURL: Simple Contrastive User Representation Learning from Command
Sequences [22.92215383896495]
我々は,ラベルのないコマンドシーケンスからユーザ表現を学習する,コントラッシブな自己教師型ディープラーニングフレームワークであるSimCURLを提案する。
我々は、50億以上のコマンドからなる実世界のコマンドシーケンスデータセット上で、我々の手法を訓練し、評価する。
論文 参考訳(メタデータ) (2022-07-29T16:06:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。