論文の概要: Look-Ahead Reasoning on Learning Platforms
- arxiv url: http://arxiv.org/abs/2511.14745v1
- Date: Tue, 18 Nov 2025 18:45:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:53.267309
- Title: Look-Ahead Reasoning on Learning Platforms
- Title(参考訳): 学習プラットフォームに関するLook-Ahead Reasoning
- Authors: Haiqing Zhu, Tijana Zrnic, Celestine Mendler-Dünner,
- Abstract要約: ユーザアクションが結合され、大規模に、将来の予測に影響を与えていることを考慮して、ルック・ア・ヘッドの推論が示しています。
私たちはまず、行動経済学の概念であるレベル・ドル・シンキングを定式化します。
次に,モデルに対する共同的な影響を最適化することで,ユーザが協調行動をとる集合的推論に焦点をあてる。
- 参考スコア(独自算出の注目度): 24.349139933086132
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: On many learning platforms, the optimization criteria guiding model training reflect the priorities of the designer rather than those of the individuals they affect. Consequently, users may act strategically to obtain more favorable outcomes, effectively contesting the platform's predictions. While past work has studied strategic user behavior on learning platforms, the focus has largely been on strategic responses to a deployed model, without considering the behavior of other users. In contrast, look-ahead reasoning takes into account that user actions are coupled, and -- at scale -- impact future predictions. Within this framework, we first formalize level-$k$ thinking, a concept from behavioral economics, where users aim to outsmart their peers by looking one step ahead. We show that, while convergence to an equilibrium is accelerated, the equilibrium remains the same, providing no benefit of higher-level reasoning for individuals in the long run. Then, we focus on collective reasoning, where users take coordinated actions by optimizing through their joint impact on the model. By contrasting collective with selfish behavior, we characterize the benefits and limits of coordination; a new notion of alignment between the learner's and the users' utilities emerges as a key concept. We discuss connections to several related mathematical frameworks, including strategic classification, performative prediction, and algorithmic collective action.
- Abstract(参考訳): 多くの学習プラットフォームでは、モデルトレーニングを指導する最適化基準が、影響する個人よりもデザイナの優先順位を反映している。
その結果、ユーザはより好ましい結果を得るために戦略的に行動し、プラットフォームの予測に効果的に競合する。
過去の研究は、学習プラットフォームにおける戦略的ユーザの振る舞いを研究してきたが、主に、他のユーザの振る舞いを考慮せずに、デプロイされたモデルに対する戦略的応答に注目してきた。
対照的に、ルックアヘッド推論は、ユーザのアクションが結合され、大規模に、将来の予測に影響を与えていることを考慮します。
このフレームワークの中で、我々はまず、行動経済学の概念であるレベル・ドル・シンキングを定式化します。
均衡への収束が加速される一方で、均衡は同じままであり、長期的には個人に対して高いレベルの推論の恩恵を与えないことを示す。
次に,モデルに対する共同的な影響を最適化することで,ユーザが協調行動をとる集合的推論に焦点をあてる。
学習者とユーザのユーティリティの整合性という新たな概念が鍵となる概念として登場し,集合的行動と利己的行動とを対比することにより,協調のメリットと限界を特徴づける。
本稿では, 戦略分類, 性能予測, アルゴリズム的集団行動など, 関連するいくつかの数学的枠組みとの関係について論じる。
関連論文リスト
- UserRL: Training Interactive User-Centric Agent via Reinforcement Learning [104.63494870852894]
強化学習(Reinforcement Learning, RL)は、動的多ターン相互作用に関わるエージェントモデルのトレーニングにおいて有望であることを示す。
我々は,標準化された体育環境を通じて,ユーザ中心の能力のトレーニングと評価を行う統一的なフレームワークであるUserRLを提案する。
論文 参考訳(メタデータ) (2025-09-24T03:33:20Z) - Classification Under Strategic Self-Selection [13.168262355330299]
自己選択が学習に与える影響と,学習が自己選択集団の構成に及ぼす影響について検討した。
本稿では,自己選択行動下での学習を効果的に最適化できる,識別可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2024-02-23T11:37:56Z) - Multi-Agent Dynamic Relational Reasoning for Social Robot Navigation [50.01551945190676]
社会ロボットナビゲーションは、日常生活の様々な状況において有用であるが、安全な人間とロボットの相互作用と効率的な軌道計画が必要である。
本稿では, 動的に進化する関係構造を明示的に推論した系統的関係推論手法を提案する。
マルチエージェント軌道予測とソーシャルロボットナビゲーションの有効性を実証する。
論文 参考訳(メタデータ) (2024-01-22T18:58:22Z) - MERMAIDE: Learning to Align Learners using Model-Based Meta-Learning [62.065503126104126]
本研究では,先見のつかない学習エージェントの報酬を効率よく効果的に介入し,望ましい結果を導き出す方法について検討する。
これはオークションや課税のような現実世界の多くの設定に関係しており、プリンシパルは学習行動や実際の人々の報酬を知らないかもしれない。
モデルに基づくメタ学習フレームワークであるMERMAIDEを導入し,配布外エージェントに迅速に適応できるプリンシパルを訓練する。
論文 参考訳(メタデータ) (2023-04-10T15:44:50Z) - A Framework for Understanding Model Extraction Attack and Defense [48.421636548746704]
我々は,モデルユーティリティとユーザとのトレードオフと,敵の視点によるプライバシについて検討する。
我々は,このようなトレードオフを定量化し,その理論的特性を分析し,最適な敵攻撃・防衛戦略を理解するための最適化問題を開発する。
論文 参考訳(メタデータ) (2022-06-23T05:24:52Z) - Strategic Classification with Graph Neural Networks [10.131895986034316]
学習にグラフを使用すると、予測にユーザ間の依存関係が導入される。
本稿では,グラフに基づく分類器の戦略的ロバスト学習のための微分可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-31T13:11:25Z) - Generalized Strategic Classification and the Case of Aligned Incentives [16.607142366834015]
戦略的なユーザー行動の理由について、より広い視点で議論する。
我々のモデルは現在のモデルの多くを仮定するが、他の新しい設定を含んでいる。
結果とアプローチが,最も一般的なケースにどのように拡張できるかを示す。
論文 参考訳(メタデータ) (2022-02-09T09:36:09Z) - Learning from Heterogeneous Data Based on Social Interactions over
Graphs [58.34060409467834]
本研究では,個別のエージェントが異なる次元のストリーミング特徴を観察しながら分類問題の解決を目指す分散アーキテクチャを提案する。
私たちはそれを示します。
戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。
私たちはそれを示します。
戦略により、エージェントはこの高度に異質な環境下で一貫して学習することができる。
論文 参考訳(メタデータ) (2021-12-17T12:47:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。