論文の概要: The Burden of Interactive Alignment with Inconsistent Preferences
- arxiv url: http://arxiv.org/abs/2510.16368v1
- Date: Sat, 18 Oct 2025 06:25:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:38.966434
- Title: The Burden of Interactive Alignment with Inconsistent Preferences
- Title(参考訳): 不整合選好による対話的アライメントの破壊
- Authors: Ali Shirali,
- Abstract要約: 不整合な好みを持つユーザーが、エンゲージメント駆動型アルゴリズムをスタックルバーグ均衡に関心を持つように調整する方法を示す。
十分に注意を払っているユーザはアライメントを達成でき、そうでないユーザはアルゴリズムの目的に合わせたアライメントを実現することができることを示す。
- 参考スコア(独自算出の注目度): 5.499453986105878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: From media platforms to chatbots, algorithms shape how people interact, learn, and discover information. Such interactions between users and an algorithm often unfold over multiple steps, during which strategic users can guide the algorithm to better align with their true interests by selectively engaging with content. However, users frequently exhibit inconsistent preferences: they may spend considerable time on content that offers little long-term value, inadvertently signaling that such content is desirable. Focusing on the user side, this raises a key question: what does it take for such users to align the algorithm with their true interests? To investigate these dynamics, we model the user's decision process as split between a rational system 2 that decides whether to engage and an impulsive system 1 that determines how long engagement lasts. We then study a multi-leader, single-follower extensive Stackelberg game, where users, specifically system 2, lead by committing to engagement strategies and the algorithm best-responds based on observed interactions. We define the burden of alignment as the minimum horizon over which users must optimize to effectively steer the algorithm. We show that a critical horizon exists: users who are sufficiently foresighted can achieve alignment, while those who are not are instead aligned to the algorithm's objective. This critical horizon can be long, imposing a substantial burden. However, even a small, costly signal (e.g., an extra click) can significantly reduce it. Overall, our framework explains how users with inconsistent preferences can align an engagement-driven algorithm with their interests in a Stackelberg equilibrium, highlighting both the challenges and potential remedies for achieving alignment.
- Abstract(参考訳): メディアプラットフォームからチャットボットに至るまで、アルゴリズムは人々のインタラクション、学習、情報発見の方法を形成する。
このようなユーザとアルゴリズム間のインタラクションは、複数のステップにまたがって展開されることが多く、その間、戦略的ユーザは、コンテンツを選択的にエンゲージすることで、そのアルゴリズムが真の関心とよりよく一致するようにガイドすることができる。
しかし、ユーザはしばしば一貫性のない好みを示す: 長期的価値の少ないコンテンツにかなりの時間を費やし、そのようなコンテンツが望ましいことを不注意に知らせる。
ユーザー側に注目して、これは重要な疑問を提起する。そのようなユーザーがアルゴリズムを真の利益と整合させるのに何が必要か?
これらのダイナミクスを調査するために、ユーザの意思決定プロセスは、係合するかどうかを決定する合理的システム2と、係合する期間を決定する衝動システム1とを分割してモデル化する。
次に、マルチリーダーでシングルフォローの広範なStackelbergゲームについて研究し、ユーザ、特にシステム2は、エンゲージメント戦略へのコミットと、観察されたインタラクションに基づいたアルゴリズムのベスト対応によって導かれる。
我々は、アライメントの負担を、ユーザーがアルゴリズムを効果的に操るために最適化しなければならない最小限の地平線として定義する。
十分に前向きなユーザーはアライメントを達成でき、一方、そうでない人はアルゴリズムの目的に合わせることができる。
この臨界地平線は長くなり、かなりの負担がかかる。
しかし、小型でコストのかかる信号(例えば、余分なクリック)でさえ、それを大幅に減らすことができる。
全体として、当社のフレームワークは、一貫性のない好みを持つユーザが、エンゲージメント駆動のアルゴリズムをStackelberg均衡に関心を持つように調整する方法を説明し、アライメントを達成する上での課題と潜在的な改善の両方を強調しています。
関連論文リスト
- Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。
本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。
当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文 参考訳(メタデータ) (2024-08-07T16:35:10Z) - Measuring Strategization in Recommendation: Users Adapt Their Behavior to Shape Future Content [66.71102704873185]
実験と調査を行うことで,ユーザストラテジゼーションの試行を行う。
参加者の居住時間や「いいね!」の使用など,結果指標間での戦略化の強い証拠を見出す。
この結果から,プラットフォームはアルゴリズムがユーザの行動に与える影響を無視できないことが示唆された。
論文 参考訳(メタデータ) (2024-05-09T07:36:08Z) - Can Probabilistic Feedback Drive User Impacts in Online Platforms? [26.052963782865294]
コンテンツレコメンデーションシステムのネガティブなユーザへの影響に関する一般的な説明は、プラットフォームの目的とユーザ福祉の相違である。
本研究は,ユーザに対する意図しない影響の潜在的な原因は,プラットフォーム目標の不一致だけではないことを示す。
これらのユーザーへの影響の源泉は、異なるコンテンツが観測可能なユーザー反応(フィードバック情報)を異なるレートで生成する可能性があることである。
論文 参考訳(メタデータ) (2024-01-10T18:12:31Z) - Matching of Users and Creators in Two-Sided Markets with Departures [0.6649753747542209]
本稿では,ユーザコンテンツマッチングのダイナミクスに着目したコンテントレコメンデーションのモデルを提案する。
クリエーターの離脱を考慮しないユーザ中心の欲求アルゴリズムは、任意に粗悪な総エンゲージメントをもたらす可能性があることを示す。
本稿では,ユーザの好みを軽度に仮定して性能保証を行う2つの実用的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-30T20:13:28Z) - User Strategization and Trustworthy Algorithms [81.82279667028423]
ユーザストラテジゼーションがプラットフォームを短期間で支援できることが示されています。
そして、それがプラットフォームのデータを破壊し、最終的に反実的な決定を下す能力を損なうことを示します。
論文 参考訳(メタデータ) (2023-12-29T16:09:42Z) - Modeling Content Creator Incentives on Algorithm-Curated Platforms [76.53541575455978]
本研究では,アルゴリズムの選択が露出ゲームにおける(ナッシュ)平衡の存在と性格にどのように影響するかを検討する。
本研究では、露出ゲームにおける平衡を数値的に見つけるためのツールを提案し、MovieLensとLastFMデータセットの監査結果を示す。
論文 参考訳(メタデータ) (2022-06-27T08:16:59Z) - Online Learning Demands in Max-min Fairness [91.37280766977923]
本稿では,複数のユーザ間の希少リソースの割り当て機構について,効率的で公平で戦略に準拠した方法で記述する。
このメカニズムは複数のラウンドで繰り返され、各ラウンドでユーザの要求が変更される可能性がある。
各ラウンドの最後には、ユーザは受け取ったアロケーションに関するフィードバックを提供し、そのメカニズムが時間の経過とともにユーザの好みを学習することを可能にする。
論文 参考訳(メタデータ) (2020-12-15T22:15:20Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。