論文の概要: Belief Samples Are All You Need For Social Learning
- arxiv url: http://arxiv.org/abs/2403.17174v1
- Date: Mon, 25 Mar 2024 20:43:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 19:36:07.861008
- Title: Belief Samples Are All You Need For Social Learning
- Title(参考訳): ソーシャル・ラーニングに必要なのは「Breief Samples」
- Authors: Mahyar JafariNodeh, Amir Ajorlou, Ali Jadbabaie,
- Abstract要約: ソーシャルネットワークに埋め込まれたエージェント集団が、世界の根底にある状態を学習することに興味を持つ社会学習の問題を考える。
エージェントが彼らの信念からサンプルを伝達することしか許されていない場合、確率で学ぶことは依然として達成可能であることを示す。
- 参考スコア(独自算出の注目度): 11.707665253943155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we consider the problem of social learning, where a group of agents embedded in a social network are interested in learning an underlying state of the world. Agents have incomplete, noisy, and heterogeneous sources of information, providing them with recurring private observations of the underlying state of the world. Agents can share their learning experience with their peers by taking actions observable to them, with values from a finite feasible set of states. Actions can be interpreted as samples from the beliefs which agents may form and update on what the true state of the world is. Sharing samples, in place of full beliefs, is motivated by the limited communication, cognitive, and information-processing resources available to agents especially in large populations. Previous work (Salhab et al.) poses the question as to whether learning with probability one is still achievable if agents are only allowed to communicate samples from their beliefs. We provide a definite positive answer to this question, assuming a strongly connected network and a ``collective distinguishability'' assumption, which are both required for learning even in full-belief-sharing settings. In our proposed belief update mechanism, each agent's belief is a normalized weighted geometric interpolation between a fully Bayesian private belief -- aggregating information from the private source -- and an ensemble of empirical distributions of the samples shared by her neighbors over time. By carefully constructing asymptotic almost-sure lower/upper bounds on the frequency of shared samples matching the true state/or not, we rigorously prove the convergence of all the beliefs to the true state, with probability one.
- Abstract(参考訳): 本稿では,ソーシャル・ラーニングの課題について考察する。そこでは,ソーシャル・ネットワークに埋め込まれたエージェント集団が,世界の根底にある状態を学習することに興味を持っている。
エージェントは不完全で騒々しく、異質な情報ソースを持ち、世界の根底にある状態の個人的な観察を繰り返している。
エージェントは、有限の可能な状態の値を使って、自分の学習経験を仲間と共有することができる。
アクションは、エージェントが生成し、世界の真の状態が何であるかを更新するかもしれない信念からサンプルとして解釈することができる。
完全な信念の代わりにサンプルを共有することは、特に大勢のエージェントが利用可能な限られたコミュニケーション、認知、情報処理資源によって動機付けられている。
先行研究(Salhab et al )は、エージェントが彼らの信念からサンプルを伝達することしか許されない場合、確率で学ぶことは依然として達成可能であるかどうかという疑問を提起する。
本稿では,この疑問に対して,信頼度の高いネットワークと「協調的識別可能性」の仮定を仮定して,肯定的な回答を提供する。
提案した信念更新メカニズムでは、各エージェントの信念は、ベイズ人の個人的信念(プライベートソースからの情報を集約する)と、隣人が共有するサンプルの実証的な分布のアンサンブルの間の正規化された幾何学的補間である。
真の状態/またはそうでない共有サンプルの周波数に基づいて漸近的準開小境界を慎重に構成することにより、すべての信念が真状態へ収束することを確率1で厳密に証明する。
関連論文リスト
- Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation [59.01527054553122]
分散エージェントは、経験的システムの単一かつ非エポゾディックな実行から平均フィールドゲームにおける平衡を学ぶことができる。
既存の設定に関数近似を導入し,Munchausen Online Mirror Descent 方式で描画する。
また, エージェントが局所的な周辺地域に基づいて, グローバルな経験分布を推定できる新しいアルゴリズムも提供する。
論文 参考訳(メタデータ) (2024-08-21T13:32:46Z) - Sample Complexity of Opinion Formation on Networks with Linear Regression Models [36.75032460874647]
ネットワークにおける意見収束のサンプル複雑性について検討する。
我々のフレームワークは、認識された意見形成ゲームに基づいて構築されている。
人工ネットワークと実世界のネットワークの実証結果は、我々の理論的な発見を強く支えている。
論文 参考訳(メタデータ) (2023-11-04T08:28:33Z) - Policy Evaluation in Decentralized POMDPs with Belief Sharing [39.550233049869036]
エージェントが直接環境状態を観察しないような協調的政策評価タスクについて検討する。
本稿では,コミュニケーションネットワーク上での個別更新と局所的インタラクションに依存する,完全に分散化された信念形成戦略を提案する。
論文 参考訳(メタデータ) (2023-02-08T15:54:15Z) - Assaying Out-Of-Distribution Generalization in Transfer Learning [103.57862972967273]
私たちは、経験的に対処するメッセージの相違を強調して、以前の作業の統一的なビューを取ります。
私たちは9つの異なるアーキテクチャから、多数の、あるいは少数の設定で31K以上のネットワークを微調整しました。
論文 参考訳(メタデータ) (2022-07-19T12:52:33Z) - Rumor Detection with Self-supervised Learning on Texts and Social Graph [101.94546286960642]
異種情報ソース上での自己教師型学習を対照的に提案し,それらの関係を明らかにするとともに,噂をよりよく特徴付ける。
我々はこの枠組みをSRD(Self-supervised Rumor Detection)と呼ぶ。
3つの実世界のデータセットに対する大規模な実験により、ソーシャルメディア上での噂の自動検出におけるSRDの有効性が検証された。
論文 参考訳(メタデータ) (2022-04-19T12:10:03Z) - Plinko: A Theory-Free Behavioral Measure of Priors for Statistical
Learning and Mental Model Updating [62.997667081978825]
Plinko(リンク)は,参加者が利用可能なすべての結果に対してボール滴の分布を推定する行動課題である。
対象者は,確率分布の確率分布を中心にクラスタリングし,事前クラスタメンバシップは学習能力を示す可能性があることを示す。
我々は,個々の参加者が信頼できる表現であり,物理的に不可解な球滴分布に直面した場合,学習が阻害されないことを検証した。
論文 参考訳(メタデータ) (2021-07-23T22:27:30Z) - Representative & Fair Synthetic Data [68.8204255655161]
公平性制約を自己監督学習プロセスに組み込むためのフレームワークを提示する。
私たちはuci成人国勢調査データセットの代表者および公正版を作成します。
我々は、代表的かつ公正な合成データを将来有望なビルディングブロックとみなし、歴史的世界ではなく、私たちが生きようとしている世界についてアルゴリズムを教える。
論文 参考訳(メタデータ) (2021-04-07T09:19:46Z) - Communication-Efficient Distributed Cooperative Learning with Compressed
Beliefs [0.8702432681310401]
本研究では,一群のエージェントが一連の仮説に同意しようとする分散協調学習の課題について考察する。
仮説の集合が大きくなるシナリオでは、エージェントが任意の正の圧縮率で圧縮された(疎あるいは量子化された)信念を共有できる信念更新ルールを提案する。
論文 参考訳(メタデータ) (2021-02-14T06:19:36Z) - A General Framework for Distributed Inference with Uncertain Models [14.8884251609335]
異種エージェントのネットワークを用いた分散分類の問題について検討する。
我々は、エージェントの不確実性を可能性に組み込む不確実性モデルの概念に基づいて構築する。
論文 参考訳(メタデータ) (2020-11-20T22:17:12Z) - Contextuality scenarios arising from networks of stochastic processes [68.8204255655161]
経験的モデルは、その分布が X 上の合同分布を極小化することができなければ文脈的と言える。
我々は、多くのプロセス間の相互作用という、文脈的経験的モデルの異なる古典的な源泉を示す。
長期にわたるネットワークの統計的挙動は、経験的モデルを一般的な文脈的かつ強い文脈的にする。
論文 参考訳(メタデータ) (2020-06-22T16:57:52Z) - Distributed Hypothesis Testing and Social Learning in Finite Time with a
Finite Amount of Communication [1.9199742103141069]
分散仮説テスト(ソーシャルラーニング)の問題点を考察する。
エージェントのネットワークは、有限の仮説から世界の真の状態を特定しようとする。
エージェントがネットワークの直径を知っていれば,アルゴリズムをさらに改良して,すべてのエージェントが真の状態を学習できることが示される。
論文 参考訳(メタデータ) (2020-04-02T23:38:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。