論文の概要: Towards Long-Term User Welfare in Recommender Systems via Creator-Oriented Information Revelation
- arxiv url: http://arxiv.org/abs/2510.10511v1
- Date: Sun, 12 Oct 2025 09:18:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.98257
- Title: Towards Long-Term User Welfare in Recommender Systems via Creator-Oriented Information Revelation
- Title(参考訳): クリエーター指向情報公開によるレコメンダシステムの長期ユーザー福祉に向けて
- Authors: Xu Zhao, Xiaopeng Ye, Chen Xu, Weiran Shen, Jun Xu,
- Abstract要約: 情報レベレーション(LoRe)による長期福祉最適化という情報レベリングフレームワークを提案する。
本稿では,従来の情報公開手法を用いて,レコメンダシステム(RS)の利害関係者をマッピングする。
提案手法は, 利用者の長期的福祉を改善する上で, 既存の公正な評価方法や情報開示戦略を効果的に上回ることができる。
- 参考スコア(独自算出の注目度): 16.39197122169092
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Improving the long-term user welfare (e.g., sustained user engagement) has become a central objective of recommender systems (RS). In real-world platforms, the creation behaviors of content creators plays a crucial role in shaping long-term welfare beyond short-term recommendation accuracy, making the effective steering of creator behavior essential to foster a healthier RS ecosystem. Existing works typically rely on re-ranking algorithms that heuristically adjust item exposure to steer creators' behavior. However, when embedded within recommendation pipelines, such a strategy often conflicts with the short-term objective of improving recommendation accuracy, leading to performance degradation and suboptimal long-term welfare. The well-established economics studies offer us valuable insights for an alternative approach without relying on recommendation algorithmic design: revealing information from an information-rich party (sender) to a less-informed party (receiver) can effectively change the receiver's beliefs and steer their behavior. Inspired by this idea, we propose an information-revealing framework, named Long-term Welfare Optimization via Information Revelation (LoRe). In this framework, we utilize a classical information revelation method (i.e., Bayesian persuasion) to map the stakeholders in RS, treating the platform as the sender and creators as the receivers. To address the challenge posed by the unrealistic assumption of traditional economic methods, we formulate the process of information revelation as a Markov Decision Process (MDP) and propose a learning algorithm trained and inferred in environments with boundedly rational creators. Extensive experiments on two real-world RS datasets demonstrate that our method can effectively outperform existing fair re-ranking methods and information revealing strategies in improving long-term user welfare.
- Abstract(参考訳): 長期的ユーザ福祉(例えば、持続的ユーザエンゲージメント)の改善は、レコメンダシステム(RS)の中心的な目標となっている。
現実のプラットフォームでは、コンテンツクリエーターの創造行動は、短期的な推奨精度以上の長期的な福祉を形作る上で重要な役割を担っており、より健康的なRSエコシステムを育成するためには、クリエイターの効果的な運営が不可欠である。
既存の作品は通常、ステア・クリエーターの行動に対してアイテムの露出をヒューリスティックに調整するアルゴリズムに頼っている。
しかしながら、レコメンデーションパイプラインに埋め込まれた場合、このような戦略は、リコメンデーションの精度を改善するという短期的な目標と矛盾することが多く、パフォーマンスの低下と短期的福祉につながる。
情報豊かな当事者(ベンダー)から低インフォームド当事者(受信者)への情報公開は、受信者の信念を効果的に変え、その振る舞いを熟考する。
このアイデアに触発されて,情報公開(LoRe)による長期福祉最適化(Long-term Welfare Optimization)という情報検索フレームワークを提案する。
本研究では,従来の情報開示手法(ベイズ説得法)を用いて,RSの利害関係者をマッピングし,プラットフォームを送信者とみなし,作成者を受信者とみなす。
従来の経済手法の非現実的な仮定による課題に対処するため,マルコフ決定過程 (MDP) として情報公開のプロセスを定式化し,有理な創造者を持つ環境下で訓練・推論された学習アルゴリズムを提案する。
2つの実世界のRSデータセットに対する大規模な実験により、我々の手法は、既存の公正な再評価手法と、長期ユーザー福祉を改善するための情報開示戦略を効果的に上回ることができることを示した。
関連論文リスト
- Reinforcement Learning for Durable Algorithmic Recourse [49.54997446851335]
提案手法は,提案手法を用いて,候補集団が推薦に応じてどのように適応するかを明示的にモデル化する。
また、環境の進化的ダイナミクスをキャプチャするRLベースのリコースアルゴリズムも導入する。
論文 参考訳(メタデータ) (2025-09-26T09:24:12Z) - RecGPT Technical Report [57.84251629878726]
本稿では,レコメンデーションパイプラインの中心にユーザの意図を配置する次世代フレームワークRecGPTを提案する。
RecGPTは、大きな言語モデルをユーザ関心のマイニング、アイテム検索、説明生成のキーステージに統合する。
オンライン実験では、RecGPTが利害関係者間で一貫したパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-07-30T17:55:06Z) - Churn-Aware Recommendation Planning under Aggregated Preference Feedback [6.261444979025644]
本稿では,近年の規制と技術の変化を動機とした逐次的意思決定問題について考察する。
我々はRec-APCモデルを導入し、匿名ユーザを既知の先行ユーザ型から抽出する。
最適ポリシが有限時間で純粋な利用に収束することを証明し、それらを効率的に計算するための分岐とバウンドのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-07-06T19:22:47Z) - DNS-Rec: Data-aware Neural Architecture Search for Recommender Systems [79.76519917171261]
本稿では,SRS(Sequential Recommender Systems)における計算オーバーヘッドと資源非効率性について述べる。
本稿では, プルーニング法と高度なモデル設計を組み合わせた革新的な手法を提案する。
我々の主な貢献は、リコメンダシステム(DNS-Rec)のためのデータ対応ニューラルアーキテクチャ検索の開発である。
論文 参考訳(メタデータ) (2024-02-01T07:22:52Z) - AURO: Reinforcement Learning for Adaptive User Retention Optimization in Recommender Systems [25.18963930580529]
強化学習(Reinforcement Learning, RL)は、レコメンデーションシステムにおけるユーザ保持の最適化能力に注目が集まっている。
本稿では,この課題に対処するため,textbfAdaptive textbfUser textbfRetention textbfOptimization (AURO) という新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-10-06T02:45:21Z) - Time-aware Self-Attention Meets Logic Reasoning in Recommender Systems [0.0]
本稿では,TiSANCRに基づくリコメンデーションモデルを提案する。
TiSANCRは時間的パターンと自己認識機構を推論に基づくレコメンデーションに統合する。
ベンチマークデータセットの実験では、提案されたTiSANCRが大幅な改善を達成し、常に最先端のレコメンデーション手法より優れていることが示されている。
論文 参考訳(メタデータ) (2022-08-29T01:46:42Z) - Sequential Information Design: Markov Persuasion Process and Its
Efficient Reinforcement Learning [156.5667417159582]
本稿では,逐次情報設計の新たなモデル,すなわちマルコフ説得過程(MPP)を提案する。
MPPのプランニングは、ミオピックレシーバーに同時に説得されるシグナルポリシーを見つけ、送信者の最適な長期累積ユーティリティを誘導する、というユニークな課題に直面している。
我々は,楽観主義と悲観主義の両原理の新たな組み合わせを特徴とする,実証可能な効率のよい非回帰学習アルゴリズム,Optimism-Pessimism Principle for Persuasion Process (OP4) を設計する。
論文 参考訳(メタデータ) (2022-02-22T05:41:43Z) - Sequential Recommender via Time-aware Attentive Memory Network [67.26862011527986]
本稿では,注意機構と繰り返し単位を改善するための時間ゲーティング手法を提案する。
また,長期と短期の嗜好を統合するマルチホップ・タイムアウェア・アテンテーティブ・メモリ・ネットワークを提案する。
提案手法は,候補探索タスクに対してスケーラブルであり,ドット積に基づくTop-Kレコメンデーションのための潜在因数分解の非線形一般化とみなすことができる。
論文 参考訳(メタデータ) (2020-05-18T11:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。