論文の概要: Wisdom of Crowds Through Myopic Self-Confidence Adaptation
- arxiv url: http://arxiv.org/abs/2506.18195v1
- Date: Sun, 22 Jun 2025 22:55:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.800781
- Title: Wisdom of Crowds Through Myopic Self-Confidence Adaptation
- Title(参考訳): 神秘的自己信頼適応による群衆の知恵
- Authors: Giacomo Como, Fabio Fagnani, Anton Proskurnikov,
- Abstract要約: 群衆の知恵は、集団の集団的判断や決定が集団メンバーの個人的判断や決定よりも正確であることを示す現象の包括的用語である。
本稿では,まず,世界の共通状態を非相関的かつ非バイアス的に測定するエージェントのグループについて考察する。
これらのエージェントは、フレンチ・デグルート力学(英語版)または反復的な意見プール(英語版)として社会学でよく知られる単純な非ベイズ学習規則に従って、見積もりを反復的に更新する。
- 参考スコア(独自算出の注目度): 1.1060425537315088
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The wisdom of crowds is an umbrella term for phenomena suggesting that the collective judgment or decision of a large group can be more accurate than the individual judgments or decisions of the group members. A well-known example illustrating this concept is the competition at a country fair described by Galton, where the median value of the individual guesses about the weight of an ox resulted in an astonishingly accurate estimate of the actual weight. This phenomenon resembles classical results in probability theory and relies on independent decision-making. The accuracy of the group's final decision can be significantly reduced if the final agents' opinions are driven by a few influential agents. In this paper, we consider a group of agents who initially possess uncorrelated and unbiased noisy measurements of a common state of the world. Assume these agents iteratively update their estimates according to a simple non-Bayesian learning rule, commonly known in mathematical sociology as the French-DeGroot dynamics or iterative opinion pooling. As a result of this iterative distributed averaging process, each agent arrives at an asymptotic estimate of the state of the world, with the variance of this estimate determined by the matrix of weights the agents assign to each other. Every agent aims at minimizing the variance of her asymptotic estimate of the state of the world; however, such variance is also influenced by the weights allocated by other agents. To achieve the best possible estimate, the agents must then solve a game-theoretic, multi-objective optimization problem defined by the available sets of influence weights. We characterize both the Pareto frontier and the set of Nash equilibria in the resulting game. Additionally, we examine asynchronous best-response dynamics for the group of agents and prove their convergence to the set of strict Nash equilibria.
- Abstract(参考訳): 群衆の知恵は、集団の集団的判断や決定が集団メンバーの個人的判断や決定よりも正確であることを示す現象の包括的用語である。
この概念を具現化した有名な例は、ガルトンによって記述されたカントリーフェアでの競争であり、そこでは個人の中央値が牛の体重について推測すると、驚くほど正確に実際の重量を推定する結果となった。
この現象は確率論における古典的な結果に似ており、独立した意思決定に依存している。
最終的な決定の正確性は、最終的なエージェントの意見がいくつかの影響力のあるエージェントによって駆動される場合、著しく低下する。
本稿では,まず,世界の共通状態の非相関的,非バイアス的ノイズ測定を行うエージェントのグループについて考察する。
これらのエージェントは、フレンチ・デグルート力学または反復的な意見プールとして知られる数学社会学でよく知られる単純な非ベイズ学習規則に従って、見積もりを反復的に更新する。
この反復分散平均化プロセスの結果、各エージェントは各エージェントが割り当てる重みの行列によって決定されるこの推定値のばらつきにより、世界の状態の漸近的な推定値に到達する。
すべてのエージェントは、世界の状態に対する彼女の漸近的推定の分散を最小限にすることを目的としているが、そのような分散は他のエージェントによって割り当てられた重みにも影響される。
最大限の見積もりを達成するには、エージェントは利用可能な影響重みの集合によって定義されるゲーム理論、多目的最適化問題を解く必要がある。
結果のゲームにおいて,パレートフロンティアとナッシュ均衡のセットの両方を特徴付ける。
さらに,エージェント群に対する非同期最適応答ダイナミクスを検証し,それらが厳密なナッシュ均衡の集合に収束していることを証明する。
関連論文リスト
- On the Hardness of Decentralized Multi-Agent Policy Evaluation under Byzantine Attacks [12.696705862929337]
完全分散型マルチエージェント政策評価問題について,最大$f$の障害エージェントの存在下で検討する。
特に、モデル中毒設定を伴ういわゆるビザンツの欠陥モデルに焦点を当てる。
論文 参考訳(メタデータ) (2024-09-19T16:27:08Z) - Pure Exploration under Mediators' Feedback [63.56002444692792]
マルチアームバンディット(Multi-armed bandits)は、各インタラクションステップにおいて、学習者が腕を選択し、報酬を観察する、シーケンシャルな意思決定フレームワークである。
本稿では,学習者が仲介者の集合にアクセスできるシナリオについて考察する。
本稿では,学習者には仲介者の方針が知られていると仮定して,最適な腕を発見するための逐次的意思決定戦略を提案する。
論文 参考訳(メタデータ) (2023-08-29T18:18:21Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Game-Theoretical Perspectives on Active Equilibria: A Preferred Solution
Concept over Nash Equilibria [61.093297204685264]
マルチエージェント強化学習における効果的なアプローチは,エージェントの学習プロセスを検討し,今後の政策に影響を与えることである。
この新たな解の概念は、ナッシュ均衡のような標準解の概念が活性平衡の特別な場合である、という一般的なものである。
我々は,ゲーム理論の観点から,ナッシュ平衡が知られている実例を綿密に研究することにより,アクティブ平衡を解析する。
論文 参考訳(メタデータ) (2022-10-28T14:45:39Z) - Peer Selection with Noisy Assessments [43.307040330622186]
現在最も正確なピアレビューアルゴリズムであるPeerNominationをWeightedPeerNominationに拡張します。
重み付け方式により、選択の全体的な精度が大幅に向上できることを解析的に示す。
論文 参考訳(メタデータ) (2021-07-21T14:47:11Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Multi-agent active perception with prediction rewards [18.780904566592852]
マルチエージェントアクティブな知覚は、エージェントのチームが協調して観測を集め、隠れた変数の合同推定を計算するタスクである。
我々は,マルチエージェントの能動知覚を,凸集中型予測報酬を用いた部分観測可能なマルコフ決定プロセス(Dec-POMDP)としてモデル化する。
この結果から,任意のDec-POMDP解法をマルチエージェント能動認識問題に適用し,共同推定の明示的な計算を行なわずに不確実性を抑えることが可能となった。
論文 参考訳(メタデータ) (2020-10-22T16:10:15Z) - Randomized Entity-wise Factorization for Multi-Agent Reinforcement
Learning [59.62721526353915]
実世界のマルチエージェント設定は、エージェントや非エージェントエンティティのタイプや量が異なるタスクを伴うことが多い。
我々の方法は、これらの共通点を活用することを目的としており、「観察対象のランダムに選択されたサブグループのみを考えるとき、各エージェントが期待する効用は何か?」という問いを投げかける。
論文 参考訳(メタデータ) (2020-06-07T18:28:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。