Fugu-MT 論文翻訳(概要): Explicit User Manipulation in Reinforcement Learning Based Recommender Systems

論文の概要: Explicit User Manipulation in Reinforcement Learning Based Recommender Systems

arxiv url: http://arxiv.org/abs/2203.10629v1
Date: Sun, 20 Mar 2022 19:03:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-23 07:04:41.339529
Title: Explicit User Manipulation in Reinforcement Learning Based Recommender Systems
Title（参考訳）: 強化学習に基づくレコメンダシステムにおける明示的ユーザ操作
Authors: Matthew Sparr
Abstract要約: 強化学習に基づくレコメンデータシステムは、クリック、エンゲージメント、消費の最大化を意味するならば、ユーザに影響を与えることができる。ソーシャルメディアは政治的分極の増大に寄与する要因であることが示されている。ユーザの信念と意見が特定の端に向けて調整された明示的なユーザ操作は、重要な関心事として現れます。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recommender systems are highly prevalent in the modern world due to their value to both users and platforms and services that employ them. Generally, they can improve the user experience and help to increase satisfaction, but they do not come without risks. One such risk is that of their effect on users and their ability to play an active role in shaping user preferences. This risk is more significant for reinforcement learning based recommender systems. These are capable of learning for instance, how recommended content shown to a user today may tamper that user's preference for other content recommended in the future. Reinforcement learning based recommendation systems can thus implicitly learn to influence users if that means maximizing clicks, engagement, or consumption. On social news and media platforms, in particular, this type of behavior is cause for alarm. Social media undoubtedly plays a role in public opinion and has been shown to be a contributing factor to increased political polarization. Recommender systems on such platforms, therefore, have great potential to influence users in undesirable ways. However, it may also be possible for this form of manipulation to be used intentionally. With advancements in political opinion dynamics modeling and larger collections of user data, explicit user manipulation in which the beliefs and opinions of users are tailored towards a certain end emerges as a significant concern in reinforcement learning based recommender systems.
Abstract（参考訳）: レコメンダシステムは、ユーザとプラットフォーム、それらを利用するサービスの両方に価値があるため、現代世界では非常に普及しています。一般的には、ユーザエクスペリエンスを改善し、満足度を高めることができるが、リスクは伴わない。そのようなリスクの1つは、ユーザへの影響と、ユーザの好みを形作る上でアクティブな役割を果たす能力である。このリスクは強化学習に基づく推薦システムにとってより重要である。例えば、今日のユーザに推奨されるコンテンツが、将来推奨される他のコンテンツに対するユーザの好みを阻害する可能性があることを学習することができる。強化学習に基づくレコメンデーションシステムは、クリック、エンゲージメント、消費の最大化を意味するならば、暗黙的にユーザに影響を与えることができる。特にソーシャルニュースやメディアプラットフォームでは、この種の行動が警告の原因となっている。ソーシャルメディアは間違いなく世論において役割を担っており、政治的二極化の増大に寄与する要因となっている。このようなプラットフォーム上のレコメンダシステムは、望ましくない方法でユーザに影響を与える大きな可能性を秘めている。しかし、このような操作を意図的に使用することも可能かもしれない。政治的意見のダイナミックスモデリングやユーザデータの大規模な収集の進展に伴い、ユーザの信念や意見が一定の目的に向けて調整された明示的なユーザ操作が、強化学習に基づくレコメンデータシステムにおいて重要な関心事として出現する。

関連論文リスト

MTRec: Learning to Align with User Preferences via Mental Reward Models [60.321038000806176]
我々は、実際のユーザの好みに合わせてデザインされたシーケンシャルなレコメンデーションフレームワークであるMTRecを提案する。ユーザの満足度を定量化するためのメンタル報酬モデルを導入し,それを学習するための分散逆強化学習手法を提案する。実験により、MTRecは様々なレコメンデーションモデルに大幅な改善をもたらすことが示された。
論文参考訳（メタデータ） (2025-09-26T18:10:48Z)
The Feedback Loop Between Recommendation Systems and Reactive Users [6.660458629649826]
ユーザの意見力学とレコメンデーションシステムとのフィードバックループをモデル化する。反応ポリシーは、ユーザーが望ましくない意見の変化を効果的に防いだり、制限したりするのにどう役立つかを示す。
論文参考訳（メタデータ） (2025-03-14T19:45:57Z)
InstructAgent: Building User Controllable Recommender via LLM Agent [33.289547118795674]
本稿では,エージェントがユーザとレコメンダシステムの間の保護シールドとして機能する,新しいユーザエージェントプラットフォームパラダイムを提案する。この目的のために、まず4つのレコメンデーションデータセットを構築します。
論文参考訳（メタデータ） (2025-02-20T15:58:25Z)
Improving the Shortest Plank: Vulnerability-Aware Adversarial Training for Robust Recommender System [60.719158008403376]
VAT(Vulnerability-aware Adversarial Training)は、レコメンデーションシステムにおける中毒攻撃に対する防御を目的とした訓練である。 VATは、システムの適合度に基づいて、ユーザの脆弱性を推定するために、新たな脆弱性認識機能を採用している。
論文参考訳（メタデータ） (2024-09-26T02:24:03Z)
Interactive Counterfactual Exploration of Algorithmic Harms in Recommender Systems [3.990406494980651]
本研究では,レコメンデーションシステムにおけるアルゴリズム的害の影響を理解し,探索するための対話型ツールを提案する。視覚化、反事実的説明、インタラクティブなモジュールを活用することで、ユーザは誤校正などのバイアスがレコメンデーションにどのように影響するかを調査できる。
論文参考訳（メタデータ） (2024-09-10T23:58:27Z)
System-2 Recommenders: Disentangling Utility and Engagement in Recommendation Systems via Temporal Point-Processes [80.97898201876592]
本稿では,過去のコンテンツインタラクションが,自己興奮型ホークスプロセスに基づくユーザの到着率に影響を及ぼす生成モデルを提案する。そこで本研究では,システム1とシステム2のアンタングルを解消し,ユーザ利用によるコンテンツ最適化を可能にすることを解析的に示す。
論文参考訳（メタデータ） (2024-05-29T18:19:37Z)
Measuring Strategization in Recommendation: Users Adapt Their Behavior to Shape Future Content [66.71102704873185]
実験と調査を行うことで,ユーザストラテジゼーションの試行を行う。参加者の居住時間や「いいね!」の使用など,結果指標間での戦略化の強い証拠を見出す。この結果から,プラットフォームはアルゴリズムがユーザの行動に与える影響を無視できないことが示唆された。
論文参考訳（メタデータ） (2024-05-09T07:36:08Z)
User-Controllable Recommendation via Counterfactual Retrospective and Prospective Explanations [96.45414741693119]
本稿では,説明可能性と可制御性をシームレスに統合するユーザ制御型レコメンデータシステムを提案する。反ファクト推論を通じて、ふりかえりと予測的な説明の両方を提供することで、ユーザーはシステムに対する制御をカスタマイズできる。
論文参考訳（メタデータ） (2023-08-02T01:13:36Z)
Recommending to Strategic Users [10.079698681921673]
ユーザーは、将来推奨されるコンテンツの種類に影響を与えるために、戦略的にコンテンツを選択する。本稿では,戦略的消費を考慮した推奨品質向上のための3つの介入を提案する。
論文参考訳（メタデータ） (2023-02-13T17:57:30Z)
Influential Recommender System [12.765277278599541]
Influential Recommender System (IRS) は,ユーザが対象アイテムを好むように積極的に導くことを目的とした,新しいレコメンデーションパラダイムである。 IRSは、ユーザに慎重に選択された項目(影響経路と呼ばれる)のシーケンスを徐々に推奨する。 IRNはベースラインレコメンデータよりも優れており,ユーザの興味に影響を及ぼす能力を示している。
論文参考訳（メタデータ） (2022-11-18T03:04:45Z)
Estimating and Penalizing Induced Preference Shifts in Recommender Systems [10.052697877248601]
システムデザイナは、レコメンデータが引き起こすシフトを見積もること、そのようなシフトが望まないかどうかを評価すること、さらには問題のあるシフトを避けるために積極的に最適化すること、などを議論する。我々は、過去のユーザインタラクションデータを使用して、その好みのダイナミクスを暗黙的に含む予測的ユーザモデルをトレーニングする。シミュレーション実験では、学習した嗜好動態モデルがユーザの嗜好を推定し、新しいレコメンデーションに対してどのように反応するかを示す。
論文参考訳（メタデータ） (2022-04-25T21:04:46Z)
Causal Disentanglement with Network Information for Debiased Recommendations [34.698181166037564]
近年の研究では、因果的観点からレコメンデーターシステムをモデル化することで、デビアスを提案する。この設定における重要な課題は、隠れた共同設立者を説明することだ。我々は,ネットワーク情報(すなわち,ユーザ・ソーシャルおよびユーザ・イテムネットワーク)を活用して,隠れた共同創設者をよりよく近似することを提案する。
論文参考訳（メタデータ） (2022-04-14T20:55:11Z)
Generative Inverse Deep Reinforcement Learning for Online Recommendation [62.09946317831129]
オンラインレコメンデーションのための新しい逆強化学習手法InvRecを提案する。 InvRecは、オンラインレコメンデーションのために、ユーザの行動から報酬関数を自動的に抽出する。
論文参考訳（メタデータ） (2020-11-04T12:12:25Z)
Empowering Active Learning to Jointly Optimize System and User Demands [70.66168547821019]
我々は,アクティブラーニングシステムとユーザを協調的に(効率的に学習)するための,新しいアクティブラーニング手法を提案する。本手法は,特定のユーザに対して,エクササイズの適切性を予測するために,学習を迅速かつ迅速に行う必要があるため,特に,この手法のメリットを生かした教育アプリケーションで研究する。複数の学習戦略とユーザタイプを実際のユーザからのデータで評価し,代替手法がエンドユーザに適さない多くのエクササイズをもたらす場合,共同アプローチが両方の目標を満足できることを確認した。
論文参考訳（メタデータ） (2020-05-09T16:02:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。