論文の概要: Cluster-Based Social Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2003.00627v2
- Date: Mon, 23 Mar 2020 18:46:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 04:23:55.807067
- Title: Cluster-Based Social Reinforcement Learning
- Title(参考訳): クラスタ型ソーシャル強化学習
- Authors: Mahak Goindani, Jennifer Neville
- Abstract要約: ソーシャル強化学習法は、偽ニュースの緩和、パーソナライズされた教育・医療、バイラルマーケティングに有用である。
ネットワークサイズと疎結合データのために、エージェント間の依存関係をモデルに効果的に組み込むことは困難である。
従来のソーシャルRLアプローチは、エージェント依存を無視したり、計算集約的な方法でそれらをモデル化する。
- 参考スコア(独自算出の注目度): 16.821802372973004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social Reinforcement Learning methods, which model agents in large networks,
are useful for fake news mitigation, personalized teaching/healthcare, and
viral marketing, but it is challenging to incorporate inter-agent dependencies
into the models effectively due to network size and sparse interaction data.
Previous social RL approaches either ignore agents dependencies or model them
in a computationally intensive manner. In this work, we incorporate agent
dependencies efficiently in a compact model by clustering users (based on their
payoff and contribution to the goal) and combine this with a method to easily
derive personalized agent-level policies from cluster-level policies. We also
propose a dynamic clustering approach that captures changing user behavior.
Experiments on real-world datasets illustrate that our proposed approach learns
more accurate policy estimates and converges more quickly, compared to several
baselines that do not use agent correlations or only use static clusters.
- Abstract(参考訳): 大規模ネットワークにおけるエージェントをモデル化するソーシャル強化学習手法は、偽ニュースの緩和、パーソナライズされた教育/医療、バイラルマーケティングに有用であるが、ネットワークサイズとスパースなインタラクションデータにより、モデルにエージェント間の依存関係を効果的に組み込むことは困難である。
従来のソーシャルRLアプローチは、エージェント依存を無視したり、計算集約的な方法でそれらをモデル化する。
本研究では,利用者の報酬と目標への貢献に基づく)クラスタ化によるコンパクトモデルにおいて,エージェント依存性を効率的に取り入れ,クラスタレベルのポリシからエージェントレベルのポリシをパーソナライズする手法と組み合わせる。
また,ユーザ行動の変化を捉える動的クラスタリング手法を提案する。
実世界のデータセットの実験では,エージェント相関や静的クラスタのみを使用しないいくつかのベースラインと比較して,提案手法がより正確なポリシ推定を学習し,より高速に収束することを示す。
関連論文リスト
- Accelerated Stochastic ExtraGradient: Mixing Hessian and Gradient Similarity to Reduce Communication in Distributed and Federated Learning [50.382793324572845]
分散コンピューティングはデバイス間の通信を伴うため、効率性とプライバシという2つの重要な問題を解決する必要がある。
本稿では,データ類似性とクライアントサンプリングのアイデアを取り入れた新しい手法について分析する。
プライバシー問題に対処するために,付加雑音の手法を適用し,提案手法の収束への影響を解析する。
論文 参考訳(メタデータ) (2024-09-22T00:49:10Z) - Retrieval Augmentation via User Interest Clustering [57.63883506013693]
インダストリアルレコメンデータシステムは、ユーザ・イテム・エンゲージメントのパターンに敏感である。
本稿では,ユーザの関心を効率的に構築し,計算コストの低減を図る新しい手法を提案する。
当社のアプローチはMetaの複数の製品に展開されており、ショートフォームビデオ関連の推奨を助長しています。
論文 参考訳(メタデータ) (2024-08-07T16:35:10Z) - Causal Coordinated Concurrent Reinforcement Learning [8.654978787096807]
本稿では,データ共有と協調探索のための新しいアルゴリズムフレームワークを提案する。
本アルゴリズムは,独立規制による個人差分制御モデルパラメータの抽出において,付加雑音モデル-混合モデル(ANM-MM)という形で因果推論アルゴリズムを利用する。
抽出したモデルパラメータの類似度に基づく新しいデータ共有方式を提案し, 自己回帰, 振り子, カートポールのスイングアップタスクのセットにおいて, 優れた学習速度を示す。
論文 参考訳(メタデータ) (2024-01-31T17:20:28Z) - Dynamic Clustering and Cluster Contrastive Learning for Unsupervised
Person Re-identification [29.167783500369442]
教師なしRe-ID手法は、ラベルのないデータから堅牢で差別的な特徴を学習することを目的としている。
本稿では,動的クラスタリングとクラスタコントラスト学習(DCCC)手法を提案する。
提案したDCCCの有効性を検証するために, 広く利用されている複数の公開データセットの実験を行った。
論文 参考訳(メタデータ) (2023-03-13T01:56:53Z) - Fully Decentralized Model-based Policy Optimization for Networked
Systems [23.46407780093797]
本研究の目的は,モデルベース学習によるマルチエージェント制御のデータ効率の向上である。
エージェントが協力的であり、隣人とのみローカルに通信するネットワークシステムについて検討する。
提案手法では,各エージェントが将来の状態を予測し,通信によって予測をブロードキャストする動的モデルを学習し,その後,モデルロールアウトに基づいてポリシーをトレーニングする。
論文 参考訳(メタデータ) (2022-07-13T23:52:14Z) - Personalized Federated Learning with Multiple Known Clusters [20.585114235701603]
我々は,ユーザの中に既知のクラスタ構造が存在する場合,個人化フェデレーション学習の問題点を考察する。
直感的なアプローチは、パラメータを規則化し、同じクラスタのユーザが同様のモデルの重みを共有することである。
我々は,各クラスタが独立して通信し,収束結果を導出するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-04-28T16:32:29Z) - Robust and Efficient Aggregation for Distributed Learning [37.203175053625245]
平均化に基づく分散学習スキームは、外れ値に影響を受けやすいことが知られている。
単一の悪意のあるエージェントは、平均的な分散学習アルゴリズムを任意に貧弱なモデルに駆動することができる。
これは、中央値とトリミング平均の変動に基づくロバストアグリゲーションスキームの発展を動機付けている。
論文 参考訳(メタデータ) (2022-04-01T17:17:41Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - DEALIO: Data-Efficient Adversarial Learning for Imitation from
Observation [57.358212277226315]
観察ifoからの模倣学習において、学習エージェントは、実演者の生成した制御信号にアクセスせずに、実演行動の観察のみを用いて実演エージェントを模倣しようとする。
近年、逆模倣学習に基づく手法は、ifO問題に対する最先端のパフォーマンスをもたらすが、データ非効率でモデルなしの強化学習アルゴリズムに依存するため、サンプルの複雑さに悩まされることが多い。
この問題は、サンプルの収集が時間、エネルギー、およびリスクの面で高いコストを被る可能性がある現実世界の設定に展開することは非現実的です。
よりデータ効率の高いifOアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-31T23:46:32Z) - Deep Interactive Bayesian Reinforcement Learning via Meta-Learning [63.96201773395921]
他のエージェントの戦略に対する不確実性下での最適適応行動は、インタラクティブベイズ強化学習フレームワークを用いて計算することができる。
本稿では,メタラーン近似的信念推論とベイズ最適行動を提案する。
提案手法は, モデルフリーアプローチ, 近似後部からのサンプル採取, 他者のメモリフリーモデル維持, あるいは環境の既知の構造を完全に活用しない既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-01-11T13:25:13Z) - Multi-Agent Interactions Modeling with Correlated Policies [53.38338964628494]
本稿では,マルチエージェントインタラクションモデリング問題をマルチエージェント模倣学習フレームワークに実装する。
相関ポリシー(CoDAIL)を用いた分散型適応模倣学習アルゴリズムの開発
様々な実験により、CoDAILはデモレーターに近い複雑な相互作用をより良く再生できることが示されている。
論文 参考訳(メタデータ) (2020-01-04T17:31:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。