Fugu-MT 論文翻訳(概要): Distributed Multi-Agent Deep Reinforcement Learning for Robust Coordination against Noise

論文の概要: Distributed Multi-Agent Deep Reinforcement Learning for Robust Coordination against Noise

arxiv url: http://arxiv.org/abs/2205.09705v1
Date: Thu, 19 May 2022 17:18:51 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-20 14:05:42.291893
Title: Distributed Multi-Agent Deep Reinforcement Learning for Robust Coordination against Noise
Title（参考訳）: 雑音に対するロバスト調整のための分散マルチエージェント深部強化学習
Authors: Yoshinari Motokawa and Toshiharu Sugawara
Abstract要約: マルチエージェントシステム(DA3-X)のための多機能アクターアーキテクチャモデルを提案する。我々は,DA3-Xのエージェントが雑音環境を選択的に学習し,協調して行動できることを実証した。我々は,DA3-Xの有効性を実験的に評価し,DA3-Xのエージェントがベースラインエージェントよりも優れた性能が得られることを示す。
参考スコア（独自算出の注目度）: 2.741266294612776
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In multi-agent systems, noise reduction techniques are important for improving the overall system reliability as agents are required to rely on limited environmental information to develop cooperative and coordinated behaviors with the surrounding agents. However, previous studies have often applied centralized noise reduction methods to build robust and versatile coordination in noisy multi-agent environments, while distributed and decentralized autonomous agents are more plausible for real-world application. In this paper, we introduce a \emph{distributed attentional actor architecture model for a multi-agent system} (DA3-X), using which we demonstrate that agents with DA3-X can selectively learn the noisy environment and behave cooperatively. We experimentally evaluate the effectiveness of DA3-X by comparing learning methods with and without DA3-X and show that agents with DA3-X can achieve better performance than baseline agents. Furthermore, we visualize heatmaps of \emph{attentional weights} from the DA3-X to analyze how the decision-making process and coordinated behavior are influenced by noise.
Abstract（参考訳）: マルチエージェントシステムでは,周囲のエージェントとの協調的協調行動を促進するために,限られた環境情報に頼らなければならないため,システム全体の信頼性を向上させるためにノイズ低減技術が重要である。しかし、従来の研究では、雑音の多いマルチエージェント環境においてロバストで多用途な協調を構築するために集中型ノイズ低減法を適用してきた。本稿では,多エージェントシステム(DA3-X)のための<emph{distributed attentional actor architecture model(DA3-X)を紹介し,DA3-Xを持つエージェントが雑音環境を選択的に学習し,協調して振る舞うことを実証する。 DA3-Xの学習方法とDA3-Xの有無を比較し,DA3-Xのエージェントがベースラインエージェントよりも優れた性能が得られることを示す。さらに,DA3-Xから<emph{attentional weights</e>の熱マップを可視化し,決定過程と協調行動がノイズに与える影響を分析する。

関連論文リスト

Enhancing Multi-Agent Collaboration with Attention-Based Actor-Critic Policies [0.0]
Team-Attention-Actor-Critic (TAAC)は、協調環境におけるマルチエージェントコラボレーションを強化するために設計された学習アルゴリズムである。シミュレーションサッカー環境におけるTAACをベンチマークアルゴリズムを用いて評価する。
論文参考訳（メタデータ） (2025-07-30T15:48:38Z)
Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文参考訳（メタデータ） (2025-07-12T17:11:06Z)
Multi-Agent Collaboration via Evolving Orchestration [61.93162413517026]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。 LLMをベースとしたマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し、中央オーケストレータがタスク状態の進化に応じてエージェントを動的に指示する。クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文参考訳（メタデータ） (2025-05-26T07:02:17Z)
A-IDE : Agent-Integrated Denoising Experts [0.46040036610482665]
textbfAgent-Integrated Denoising Experts (A-IDE) フレームワークを導入し、3つの解剖学的領域特定RED-CNNモデルを統合する。 A-IDEは、RMSE、PSNR、SSIMにおいて単一の統一デノイザに比べて優れた性能を発揮する。
論文参考訳（メタデータ） (2025-03-21T01:26:54Z)
Causal Mean Field Multi-Agent Reinforcement Learning [10.767740092703777]
平均場強化学習(MFRL)と呼ばれるフレームワークは、平均場理論を用いることでスケーラビリティの問題を軽減することができる。このフレームワークには、非定常環境下での本質的な相互作用を識別する能力がない。拡張性問題に対処するために,因果平均Q-ラーニング (CMFQ) と呼ばれるアルゴリズムを提案する。
論文参考訳（メタデータ） (2025-02-20T02:15:58Z)
CoDiff: Conditional Diffusion Model for Collaborative 3D Object Detection [9.28605575548509]
協調型3次元物体検出は、自律運転の分野において重要な役割を担っている。推定誤差と時間遅延のため、エージェント間の情報の融合はしばしば空間的および時間的ノイズを伴う特徴表現をもたらす。我々は,新しいロバストな協調認識フレームワークであるCoDiffを提案する。
論文参考訳（メタデータ） (2025-02-17T03:20:52Z)
CEReBrO: Compact Encoder for Representations of Brain Oscillations Using Efficient Alternating Attention [53.539020807256904]
交互注意(CEReBrO)を用いた脳振動の表現のための圧縮法について紹介する。トークン化方式は、チャネルごとのパッチで脳波信号を表現します。本研究では,チャネル内時間的ダイナミックスとチャネル間空間的相関を共同でモデル化し,通常の自己アテンションに比べて6倍少ないメモリで2倍の速度向上を実現するための注意機構を提案する。
論文参考訳（メタデータ） (2025-01-18T21:44:38Z)
AgentAlign: Misalignment-Adapted Multi-Agent Perception for Resilient Inter-Agent Sensor Correlations [8.916036880001734]
既存の研究は、マルチエージェント設定における脆弱なマルチセンサ相関を概観している。 AgentAlignは、現実世界の異種エージェントのクロスモダリティ機能アライメントフレームワークである。多様な環境条件下での現実的なセンサの欠陥をシミュレートする新しいV2XSet-noiseデータセットを提案する。
論文参考訳（メタデータ） (2024-12-09T01:51:18Z)
A Multi-Modal Unsupervised Machine Learning Approach for Biomedical Signal Processing in CPR [12.81782890394599]
CPR中の生体信号のリアルタイム解析は、モニタリングと意思決定に不可欠である。フィルタのような従来の分極法は、CPR信号に存在する様々な複雑なノイズパターンに適応するのに苦労する。本稿では,マルチモーダルフレームワークを用いたCPR信号の非教師なし機械学習(ML)手法を提案する。
論文参考訳（メタデータ） (2024-11-03T18:40:25Z)
Semi-supervised Anomaly Detection via Adaptive Reinforcement Learning-Enabled Method with Causal Inference for Sensor Signals [15.249261198557218]
センサ信号の半教師付き異常検出は、スマート製造におけるシステムの信頼性確保に不可欠である。本稿では,三重補足型因果強化学習モデル(Tri-CRLAD)を革新的に構築する。 7つのセンサ信号データセットに対する実験結果から、Tri-CRLADは9つの最先端のベースライン法より優れていることが示された。
論文参考訳（メタデータ） (2024-05-11T06:10:05Z)
Collaborative Filtering Based on Diffusion Models: Unveiling the Potential of High-Order Connectivity [10.683635786183894]
CF-Diffは新しい拡散モデルに基づく協調フィルタリング手法である。マルチホップの隣人と一緒に、協調的な信号を完全に活用することができる。最高の競争相手に比べて7.29%も上昇している。
論文参考訳（メタデータ） (2024-04-22T14:49:46Z)
Learning to Use Tools via Cooperative and Interactive Agents [58.77710337157665]
ツール学習は、外部ツールを使用してユーティリティを拡張するエージェントとして、大きな言語モデル(LLM)を促進する。ツール選択,ツール実行,アクションキャリブレーションの3つの特別なエージェントを個別にコーディネートする,協調型対話型エージェントフレームワークであるConAgentsを提案する。 3つのデータセットに対する実験により、LLMは、ConAgentsを装備した場合、大幅に改善されたベースラインよりも優れた性能を示した。
論文参考訳（メタデータ） (2024-03-05T15:08:16Z)
Multiagent Copilot Approach for Shared Autonomy between Human EEG and TD3 Deep Reinforcement Learning [1.6627862444646657]
人体の脳波(EEG)からデコードされた作用指令と、与えられた環境に対する双発遅延DDPG(TD3)エージェントから生成された作用との間には、共有自律性が認められた。提案手法は,EEG(EEG-NB)やTD3(TD3制御)よりも有意に優れていた。
論文参考訳（メタデータ） (2023-12-22T06:15:50Z)
Relative Distributed Formation and Obstacle Avoidance with Multi-agent Reinforcement Learning [20.401609420707867]
マルチエージェント強化学習(MARL)に基づく分散生成・障害物回避手法を提案する。提案手法は, 障害物回避における生成誤差, 生成収束率, オンパー成功率に関して, ベースラインと比較して高い性能を実現する。
論文参考訳（メタデータ） (2021-11-14T13:02:45Z)
Locality Matters: A Scalable Value Decomposition Approach for Cooperative Multi-Agent Reinforcement Learning [52.7873574425376]
協調型マルチエージェント強化学習(MARL)は,エージェント数で指数関数的に大きい状態空間と動作空間により,スケーラビリティの問題に直面する。本稿では,学習分散実行パラダイムに局所報酬を組み込んだ,新しい価値に基づくマルチエージェントアルゴリズム LOMAQ を提案する。
論文参考訳（メタデータ） (2021-09-22T10:08:15Z)
Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。コア最適化問題の実用的なパラメトリゼーションを提供する。
論文参考訳（メタデータ） (2021-07-08T18:01:02Z)
F2A2: Flexible Fully-decentralized Approximate Actor-critic for Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文参考訳（メタデータ） (2020-04-17T14:56:29Z)
Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning [55.20040781688844]
QMIXは、中央集権的なエンドツーエンドで分散ポリシーをトレーニングできる新しい価値ベースの手法である。深層多エージェント強化学習のための新しいベンチマークとして,StarCraft Multi-Agent Challenge (SMAC)を提案する。
論文参考訳（メタデータ） (2020-03-19T16:51:51Z)
FACMAC: Factored Multi-Agent Centralised Policy Gradients [103.30380537282517]
FACtored Multi-Agent Centralized Policy gradients (FACMAC)を提案する。離散的および連続的な行動空間における協調的マルチエージェント強化学習のための新しい手法である。我々は,マルチエージェント粒子環境の変動に対するFACMAC,新しいマルチエージェント MuJoCo ベンチマーク,およびStarCraft II マイクロマネジメントタスクの挑戦的セットについて評価した。
論文参考訳（メタデータ） (2020-03-14T21:29:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。