論文の概要: The Battling Influencers Game: Nash Equilibria Structure of a Potential Game and Implications to Value Alignment
- arxiv url: http://arxiv.org/abs/2502.01127v1
- Date: Mon, 03 Feb 2025 07:45:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:57:18.327977
- Title: The Battling Influencers Game: Nash Equilibria Structure of a Potential Game and Implications to Value Alignment
- Title(参考訳): バットリングインフルエンサーゲーム:潜在的ゲームのナッシュ平衡構造と価値アライメント
- Authors: Young Wu, Yancheng Zhu, Jin-Yi Cai, Xiaojin Zhu,
- Abstract要約: 本稿では,マルチプレイヤー同時移動汎用ゲームであるBattling Influencers Game (BIG)を紹介する。
BIG はポテンシャルゲームであり、1 つまたは無限個の純同値 Nashlibria (NE) を持ち、これらの純同値NE は凸最適化によって見つけることができることを証明している。
本稿では,BIGが価値アライメントに与える影響について論じる。
- 参考スコア(独自算出の注目度): 8.443705171405872
- License:
- Abstract: When multiple influencers attempt to compete for a receiver's attention, their influencing strategies must account for the presence of one another. We introduce the Battling Influencers Game (BIG), a multi-player simultaneous-move general-sum game, to provide a game-theoretic characterization of this social phenomenon. We prove that BIG is a potential game, that it has either one or an infinite number of pure Nash equilibria (NEs), and these pure NEs can be found by convex optimization. Interestingly, we also prove that at any pure NE, all (except at most one) influencers must exaggerate their actions to the maximum extent. In other words, it is rational for the influencers to be non-truthful and extreme because they anticipate other influencers to cancel out part of their influence. We discuss the implications of BIG to value alignment.
- Abstract(参考訳): 複数のインフルエンサーがレシーバーの注意を競うとき、その影響戦略は互いの存在を考慮しなければならない。
本稿では,多人数同時移動型汎用ゲームであるBattling Influencers Game (BIG)を紹介し,この社会現象のゲーム理論的特徴を提供する。
BIG はポテンシャルゲームであり、純粋な Nash equilibria (NE) が 1 個または無限個あることを証明し、これらの純 NE は凸最適化によって見つけることができる。
興味深いことに、あらゆる純粋なNEにおいて、すべての(ほとんどの1つを除いて)インフルエンサーがその行動を最大限に誇張する必要があることも証明している。
言い換えれば、他のインフルエンサーが影響の一部をキャンセルすることを期待するため、インフルエンサーが非真実かつ極端であることは合理的である。
本稿では,BIGが価値アライメントに与える影響について論じる。
関連論文リスト
- Quantum Bayesian Games [0.09208007322096534]
我々は、QBismにインスパイアされたベイズエージェントベースのフレームワークを、2つの量子ゲーム、CHSHゲームと量子囚人ジレンマの反復に適用する。
各2人プレイヤゲームでは、プレイヤーは共有される絡み合いの量と、他のプレイヤーの行動や信念についての信念を保持する。
プレイヤーが共通の絡み合いの存在について学べるかどうかをシミュレートし、彼らのパフォーマンス、彼らの信念、そしてゲームの構造がどのように相互に関連しているかを探るため、繰り返しプレイをシミュレートする。
論文 参考訳(メタデータ) (2024-08-04T15:15:42Z) - Learning to Mitigate Externalities: the Coase Theorem with Hindsight Rationality [62.18973784316808]
経済理論において、外部性の概念は、社会的福祉に影響を与えるプレイヤー間の相互作用から生じる間接的な効果を指す。
我々の研究は、バーゲンが根底にあるゲームについて完全な知識を持っているという古典的な仮定を取り除いている。
次に、プレイヤーが全福祉を最大化する交渉戦略を学習できるようにするための政策を設計する。
論文 参考訳(メタデータ) (2024-06-28T11:00:53Z) - Nearly Optimal Algorithms for Contextual Dueling Bandits from Adversarial Feedback [58.66941279460248]
人からのフィードバックから学ぶことは、大言語モデル(LLM)のような生成モデルを調整する上で重要な役割を果たす
本稿では,本問題の領域内モデルについて考察する。-文脈的デュエルバンディットと敵対的フィードバックを併用し,真の嗜好ラベルを敵によって反転させることができる。
本稿では,不確実性重み付き最大推定に基づく頑健なコンテキストデュエルバンドイット(アルゴ)を提案する。
論文 参考訳(メタデータ) (2024-04-16T17:59:55Z) - Optimistic Policy Gradient in Multi-Player Markov Games with a Single
Controller: Convergence Beyond the Minty Property [89.96815099996132]
単一コントローラを用いたマルチプレイヤーゲームにおいて,楽観的なポリシー勾配手法を特徴付ける新しいフレームワークを開発した。
我々のアプローチは、我々が導入する古典的なミニティの自然一般化に依存しており、マルコフゲームを超えてさらなる応用が期待できる。
論文 参考訳(メタデータ) (2023-12-19T11:34:10Z) - About latent roles in forecasting players in team sports [47.066729480128856]
チームスポーツは、チームメイトと相手とのインタラクションに影響を与える重要な社会的要素を含んでいる。
RolForはロールベースのForecastingのための新しいエンドツーエンドモデルです。
論文 参考訳(メタデータ) (2023-04-17T13:33:23Z) - InfluencerRank: Discovering Effective Influencers via Graph
Convolutional Attentive Recurrent Neural Networks [15.461845673443804]
本研究では,その投稿行動と時間的社会的関係に基づいて,インフルエンサーをその効果でランク付けするインフルエンサーランクを提案する。
Instagramのデータセットは18,397人のインフルエンサーで構成され、12ヶ月以内に2,952,075件の投稿が公開された。
論文 参考訳(メタデータ) (2023-04-04T15:48:08Z) - Optimal Private Payoff Manipulation against Commitment in Extensive-form
Games [7.739432465414604]
広義のゲームにおいて,このような戦略行動を通じて従者の最適操作について検討する。
我々は、フォロワーが自分のプライベートペイオフを誤報告する最適な方法を見つけるのが難しかったことを示します。
論文 参考訳(メタデータ) (2022-06-27T08:50:28Z) - Can Reinforcement Learning Find Stackelberg-Nash Equilibria in
General-Sum Markov Games with Myopic Followers? [156.5760265539888]
我々は,マルチプレイヤーのジェネラルサムマルコフゲームについて,リーダーに指名されたプレイヤーとフォロワーに指名されたプレイヤーの1人を用いて研究した。
そのようなゲームに対して、我々のゴールは、政策対 $(pi*, nu*)$ であるスタックルバーグ・ナッシュ均衡 (SNE) を見つけることである。
オンラインとオフラインの両方でSNEを解くために,サンプル効率強化学習(RL)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-12-27T05:41:14Z) - Conditions that enable a player to surely win in sequential quantum
games [0.0]
本稿では,プレーヤの動きが単なる平集合ではなく群から引き出されるという仮定の下で,シーケンシャルな量子ゲームについて検討する。
本論文の主な結論は,ゲーム固有のルールが絶対的に重要であることである。
論文 参考訳(メタデータ) (2021-06-13T15:16:31Z) - No-regret learning and mixed Nash equilibria: They do not mix [64.37511607254115]
我々はFTRL(Follow-the-regularized-leader)のダイナミクスについて検討する。
厳密でないナッシュ均衡は、FTRLの下で安定して引き寄せることは不可能である。
この結果は,学習過程の結果を予測する上で重要な意味を持つ。
論文 参考訳(メタデータ) (2020-10-19T13:49:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。