論文の概要: Developing Decentralised Resilience to Malicious Influence in Collective
Perception Problem
- arxiv url: http://arxiv.org/abs/2211.03063v1
- Date: Sun, 6 Nov 2022 08:53:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 18:49:52.354100
- Title: Developing Decentralised Resilience to Malicious Influence in Collective
Perception Problem
- Title(参考訳): 集団知覚問題における悪意的影響に対する分散レジリエンスの開発
- Authors: Chris Wise, Aya Hussein, Heba El-Fiqi
- Abstract要約: 集合的な意思決定において、局所的な情報のみを用いてスワムレベルの振る舞いに影響を与えるアルゴリズムを設計することは、自明な問題ではない。
我々は、機械学習技術を用いて、Swarmメンバーに環境の局所的な認識を最適な行動にマッピングするように教えた。
我々は、エージェントに悪意ある影響に対するレジリエンスを教えるカリキュラムを作成することで、従来のアプローチを拡張した。
- 参考スコア(独自算出の注目度): 0.7734726150561088
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In collective decision-making, designing algorithms that use only local
information to effect swarm-level behaviour is a non-trivial problem. We used
machine learning techniques to teach swarm members to map their local
perceptions of the environment to an optimal action. A curriculum inspired by
Machine Education approaches was designed to facilitate this learning process
and teach the members the skills required for optimal performance in the
collective perception problem. We extended upon previous approaches by creating
a curriculum that taught agents resilience to malicious influence. The
experimental results show that well-designed rules-based algorithms can produce
effective agents. When performing opinion fusion, we implemented decentralised
resilience by having agents dynamically weight received opinion. We found a
non-significant difference between constant and dynamic weights, suggesting
that momentum-based opinion fusion is perhaps already a resilience mechanism.
- Abstract(参考訳): 集団意思決定において、局所的な情報のみを使用して群レベルの行動に影響を及ぼすアルゴリズムを設計することは、非自明な問題である。
我々は、機械学習技術を用いて、Swarmメンバーに環境の局所的な認識を最適な行動にマッピングするように教えた。
機械教育のアプローチにインスパイアされたカリキュラムは、この学習プロセスを促進し、メンバーに集団認識問題における最適なパフォーマンスに必要なスキルを教えるために設計された。
我々は,エージェントに悪影響に対するレジリエンスを教えるカリキュラムを作成することで,これまでのアプローチを拡張した。
実験の結果,よく設計されたルールベースアルゴリズムが効果的なエージェントを生成できることが示されている。
意見融合を行う際,エージェントを動的に重み付けすることで分散レジリエンスを実現した。
定数と動的重みの非有意差を見出した結果,運動量に基づく意見融合はすでに弾力性のあるメカニズムである可能性が示唆された。
関連論文リスト
- External Model Motivated Agents: Reinforcement Learning for Enhanced Environment Sampling [3.536024441537599]
強化学習(RL)エージェントとは異なり、人間は環境の変化において有能なマルチタスクのままである。
環境変化における外部モデルの適応効率を向上させるために,RLエージェントのエージェント影響フレームワークを提案する。
提案手法は,効率と性能の両面を測る指標に対する外部モデル適応の観点から,ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-06-28T23:31:22Z) - The Role of Learning Algorithms in Collective Action [8.955918346078935]
本研究では,学習アルゴリズムの特性に大きく依存していることを示す。
このことは、機械学習における集団行動の影響を研究する際に、学習アルゴリズムを考慮に入れる必要性を強調している。
論文 参考訳(メタデータ) (2024-05-10T16:36:59Z) - RLIF: Interactive Imitation Learning as Reinforcement Learning [56.997263135104504]
我々は,対話型模倣学習と類似するが,さらに実践的な仮定の下で,非政治強化学習によってパフォーマンスが向上できることを実証する。
提案手法は,ユーザ介入信号を用いた強化学習を報奨として利用する。
このことは、インタラクティブな模倣学習において介入する専門家がほぼ最適であるべきだという仮定を緩和し、アルゴリズムが潜在的に最適でない人間の専門家よりも改善される行動を学ぶことを可能にする。
論文 参考訳(メタデータ) (2023-11-21T21:05:21Z) - Imitation Learning based Alternative Multi-Agent Proximal Policy
Optimization for Well-Formed Swarm-Oriented Pursuit Avoidance [15.498559530889839]
本稿では,分散学習に基づく代替的マルチエージェント・プロキシ・ポリシー最適化(IA-MAPPO)アルゴリズムを提案する。
擬似学習を利用して生成コントローラを分散化し,通信オーバーヘッドを低減し,スケーラビリティを向上させる。
シミュレーションの結果,IA-MAPPOの有効性が検証され,広範囲なアブレーション実験により,通信オーバーヘッドが著しく減少する集中型解に匹敵する性能が示された。
論文 参考訳(メタデータ) (2023-11-06T06:58:16Z) - Decentralized Adversarial Training over Graphs [55.28669771020857]
機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。
この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文 参考訳(メタデータ) (2023-03-23T15:05:16Z) - Pessimism meets VCG: Learning Dynamic Mechanism Design via Offline
Reinforcement Learning [114.36124979578896]
オフライン強化学習アルゴリズムを用いて動的メカニズムを設計する。
我々のアルゴリズムは悲観主義の原理に基づいており、オフラインデータセットのカバレッジについて軽度な仮定しか必要としない。
論文 参考訳(メタデータ) (2022-05-05T05:44:26Z) - Resilient robot teams: a review integrating decentralised control,
change-detection, and learning [10.312968200748116]
本稿では、レジリエントなロボットチームにおける分散制御、変化検出、学習の機会と課題についてレビューする。
最近の知見:外因性断層検出法は, 回復液を用いた総合的検出や特定診断を行うことができる。
認知-行動-コミュニケーションループ、マルチエージェント強化学習、具体的進化、オンライン適応によるオフライン進化、明示的なタスク割り当て、スワムロボティクスにおけるスティグマーギーの学習において、分散制御のためのレジリエントな方法が開発されている。
論文 参考訳(メタデータ) (2022-04-21T12:51:27Z) - Rethinking Learning Dynamics in RL using Adversarial Networks [79.56118674435844]
本稿では,スキル埋め込み空間を通じてパラメータ化された,密接に関連するスキルの強化学習のための学習機構を提案する。
本研究の主な貢献は、エントロピー規則化政策勾配定式化の助けを借りて、強化学習のための敵の訓練体制を定式化することである。
論文 参考訳(メタデータ) (2022-01-27T19:51:09Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Distributed Bayesian Online Learning for Cooperative Manipulation [9.582645137247667]
ベイズ原理を用いた協調操作の模範的タスクのための新しい分散学習フレームワークを提案する。
各エージェントは、局所状態情報のみを使用して、オブジェクトダイナミクスの推定を取得し、キネマティクスを把握する。
対象のダイナミクスと把持キネマティックスの各々の推定には不確実性の尺度が伴うため、高い確率で有界な予測誤差を保証できる。
論文 参考訳(メタデータ) (2021-04-09T13:03:09Z) - Decentralized Reinforcement Learning: Global Decision-Making via Local
Economic Transactions [80.49176924360499]
我々は、シーケンシャルな意思決定問題を解決するために、単純で専門的で自己関心のあるエージェントの社会を指示する枠組みを確立する。
我々は分散強化学習アルゴリズムのクラスを導出する。
我々は、より効率的な移動学習のための社会固有のモジュラー構造の潜在的な利点を実証する。
論文 参考訳(メタデータ) (2020-07-05T16:41:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。