論文の概要: Awakening Dormant Users: Generative Recommendation with Counterfactual Functional Role Reasoning
- arxiv url: http://arxiv.org/abs/2602.13134v1
- Date: Fri, 13 Feb 2026 17:33:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:54.057129
- Title: Awakening Dormant Users: Generative Recommendation with Counterfactual Functional Role Reasoning
- Title(参考訳): 休息利用者の覚醒--非現実的機能的役割推論による創発的勧告
- Authors: Huishi Luo, Shuokai Li, Hanchen Yang, Zhongbo Sun, Haojie Ding, Boheng Zhang, Zijia Cai, Renliang Qian, Fan Yang, Tingting Gao, Chenyi Lei, Wenwu Ou, Fuzhen Zhuang,
- Abstract要約: RoleGenは、Conversion Trajectory ReasonerとGenerative Behavioral Backboneを同期する新しいフレームワークである。
オフライン実験とオンラインA/Bテストでは、RoleGenはRecall@1で6.2%、オンライン注文数で7.3%増加した。
- 参考スコア(独自算出の注目度): 26.29229666370203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Awakening dormant users, who remain engaged but exhibit low conversion, is a pivotal driver for incremental GMV growth in large-scale e-commerce platforms. However, existing approaches often yield suboptimal results since they typically rely on single-step estimation of an item's intrinsic value (e.g., immediate click probability). This mechanism overlooks the instrumental effect of items, where specific interactions act as triggers to shape latent intent and drive subsequent decisions along a conversion trajectory. To bridge this gap, we propose RoleGen, a novel framework that synergizes a Conversion Trajectory Reasoner with a Generative Behavioral Backbone. Specifically, the LLM-based Reasoner explicitly models the context-dependent Functional Role of items to reconstruct intent evolution. It further employs counterfactual inference to simulate diverse conversion paths, effectively mitigating interest collapse. These reasoned candidate items are integrated into the generative backbone, which is optimized via a collaborative "Reasoning-Execution-Feedback-Reflection" closed-loop strategy to ensure grounded execution. Extensive offline experiments and online A/B testing on the Kuaishou e-commerce platform demonstrate that RoleGen achieves a 6.2% gain in Recall@1 and a 7.3% increase in online order volume, confirming its effectiveness in activating the dormant user base.
- Abstract(参考訳): 覚醒中の休眠状態のユーザーは、エンゲージメントは低いが、大規模なeコマースプラットフォームにおいて、段階的なGMV成長の鍵を握る。
しかし、既存のアプローチは、アイテム固有の値(例えば、即時クリック確率)の単一ステップ推定に依存するため、しばしば準最適結果をもたらす。
このメカニズムは、特定の相互作用が潜在意図を形作り、変換軌道に沿って後の決定を駆動するトリガーとして振る舞う、アイテムのインストゥルメンタル効果を見落としている。
このギャップを埋めるために、我々はReleGenという、生成的行動バックボーンと変換軌道共振器を相乗化する新しいフレームワークを提案する。
具体的には、LLMベースのReasonerは、意図の進化を再構築するために、アイテムのコンテキスト依存機能ロールを明示的にモデル化する。
さらに、様々な変換経路をシミュレートする反ファクト的推論を採用し、利害崩壊を効果的に緩和する。
これらの候補項目は生成バックボーンに統合され、協調的な"Reasoning-Execution-Feedback-Reflection"クローズドループ戦略によって最適化され、基底実行が保証される。
Kuaishouのeコマースプラットフォーム上での大規模なオフライン実験とオンラインA/Bテストは、RoleGenがRecall@1で6.2%、オンライン注文量が7.3%増加したことを実証している。
関連論文リスト
- RecNet: Self-Evolving Preference Propagation for Agentic Recommender Systems [109.9061591263748]
RecNetは、レコメンデータシステムのための自己進化的な好みの伝達フレームワークである。
関連ユーザやアイテム間で、リアルタイムの好み更新を積極的に伝達する。
逆相では、フィードバック駆動の伝搬最適化機構がマルチエージェント強化学習フレームワークをシミュレートする。
論文 参考訳(メタデータ) (2026-01-29T12:14:31Z) - RISER: Orchestrating Latent Reasoning Skills for Adaptive Activation Steering [62.63376387138257]
本稿では,アクティベーション空間における大規模言語モデル(LLM)推論を適応的に制御するプラグイン・アンド・プレイ介入フレームワークを提案する。
RISERは再利用可能な推論ベクトルのライブラリを構築し、軽量ルータを使用して各入力に対して動的に構成する。
ルーターは、タスクレベルの報酬の下で強化学習を通じて最適化され、緊急かつ構成的な方法で潜在する認知的プリミティブを活性化する。
論文 参考訳(メタデータ) (2026-01-14T08:04:33Z) - MAESTRO: Meta-learning Adaptive Estimation of Scalarization Trade-offs for Reward Optimization [56.074760766965085]
大規模言語モデル(LLM)の整合性のための効率的なパラダイムとしてグループ相対政策最適化が登場している。
我々は,報酬スカラー化を動的潜在ポリシーとして扱い,モデルの終端隠蔽状態を意味的ボトルネックとして活用するMAESTROを提案する。
本稿では,軽量コンダクタネットワークがメタリワード信号としてグループ相対的優位性を生かしてポリシと共進化する,双方向最適化フレームワークにおけるコンテキスト的帯域幅問題としてこれを定式化する。
論文 参考訳(メタデータ) (2026-01-12T05:02:48Z) - Interact-RAG: Reason and Interact with the Corpus, Beyond Black-Box Retrieval [49.85856484781787]
本稿では,ILMエージェントを検索プロセスのアクティブマニピュレータに高める新しいパラダイムであるInteract-RAGを紹介する。
我々は、ゼロショット実行と相互作用軌跡の合成を可能にする推論強化ワークフローを開発する。
6つのベンチマーク実験により、Interact-RAGは他の高度な手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-10-31T15:48:43Z) - Sample-Efficient Online Learning in LM Agents via Hindsight Trajectory Rewriting [92.57796055887995]
本稿では,言語モデルエージェントの強化学習から後視体験のリプレイに適応するプロンプトフレームワークECHOを紹介する。
ECHOは失敗した試みで達成できた代替目標のために最適化された軌道を生成する。
我々は、テキストベースのナビゲーションと計画ベンチマークであるXMiniGridのステートフルバージョンと、協調的な情報収集企業シミュレーションであるPeopleJoinQAについて、ECHOを評価した。
論文 参考訳(メタデータ) (2025-10-11T18:11:09Z) - AI Guided Accelerator For Search Experience [4.832123045961485]
本稿では,ユーザの最終購入意図に向けての旅の間に生じる中間的変更を,トランジショナルなクエリを明示的にモデル化する新しいフレームワークを提案する。
このアプローチは,探索行動や意図の洗練を反映した中途半端なトランジションをユーザのショッピングファンネルをモデル化する。
我々の貢献には、(i)トランザクショナルクエリの形式的識別とモデリング、(ii)インテントフロー理解のための構造化クエリシーケンスマイニングパイプラインの導入、(iii)スケーラブルでインテント対応のクエリ拡張のためのLLMの適用が含まれる。
論文 参考訳(メタデータ) (2025-07-25T23:26:00Z) - Embed Progressive Implicit Preference in Unified Space for Deep Collaborative Filtering [13.24227546548424]
GNOLR(Generalized Neural Ordinal Logistic Regression)は、ユーザエンゲージメントの構造的進行を捉えるために提案されている。
GNOLRは予測精度を高め、ユーザのエンゲージメントの進行を捉え、検索プロセスを単純化する。
10の実世界のデータセットでの実験では、GNOLRは効率と適応性において最先端の手法を大幅に上回っている。
論文 参考訳(メタデータ) (2025-05-27T08:43:35Z) - Generator-Assistant Stepwise Rollback Framework for Large Language Model Agent [44.27498007147464]
大規模言語モデル(LLM)エージェントは通常、ステップバイステップの推論フレームワークを採用し、与えられたタスクを達成するための思考と行動のプロセスをインターリーブする。
本稿では,ジェネレータ・アシスタント・ステップワイド・ロールバック(GA-Rollback)と呼ばれる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-04T11:31:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。