Fugu-MT 論文翻訳(概要): Parallel Best Arm Identification in Heterogeneous Environments

論文の概要: Parallel Best Arm Identification in Heterogeneous Environments

arxiv url: http://arxiv.org/abs/2207.08015v3
Date: Thu, 18 Apr 2024 14:31:11 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-19 14:48:42.452027
Title: Parallel Best Arm Identification in Heterogeneous Environments
Title（参考訳）: 異種環境における並列ベストアーム識別
Authors: Nikolai Karpov, Qin Zhang,
Abstract要約: 異種協調学習モデルにおける最適な腕識別問題の時間と通信ラウンド数のトレードオフについて検討する。ほぼ厳密な上界と下界を証明することにより、不均一な環境での協調学習が、同質な環境での学習よりも本質的に困難であることを示す。
参考スコア（独自算出の注目度）: 8.915120653822433
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we study the tradeoffs between the time and the number of communication rounds of the best arm identification problem in the heterogeneous collaborative learning model, where multiple agents interact with possibly different environments and they want to learn in parallel an objective function in the aggregated environment. By proving almost tight upper and lower bounds, we show that collaborative learning in the heterogeneous setting is inherently more difficult than that in the homogeneous setting in terms of the time-round tradeoff.
Abstract（参考訳）: 本稿では,異種協調学習モデルにおいて,複数のエージェントが異なる環境と相互作用し,集約された環境における目的関数を並列に学習したいという,最適なアーム識別問題の時間と通信ラウンド数とのトレードオフについて検討する。ほぼ厳密な上界と下界を証明することにより、不均一な環境における協調学習は、時間的トレードオフの観点からの同質な環境よりも本質的に困難であることを示す。

関連論文リスト

Single-Loop Federated Actor-Critic across Heterogeneous Environments [9.276123988094698]
エージェントが2段階のフェデレート方式でアクター・クリティカル・ラーニングを行うためのテキストサイトSingle-loop Federated Actor Critic (SFAC) について検討する。 SFACの収束誤差は環境に比例してほぼ定常点に収束することを示す。
論文参考訳（メタデータ） (2024-12-19T06:13:59Z)
POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation [76.67608003501479]
主評価指標の基礎に基づいて計算された領域関連メトリクスの範囲を定義する評価プロトコルを導入・指定する。このような比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含むものである。
論文参考訳（メタデータ） (2024-07-20T16:37:21Z)
Collaboration in Immersive Environments: Challenges and Solutions [0.0]
本稿では,没入型環境における協調研究の現状について概説する。それはVRやARなど、没入型環境のさまざまなタイプと、これらの環境で起こりうるコラボレーションのさまざまな形態について論じている。
論文参考訳（メタデータ） (2023-11-01T17:45:22Z)
Generalizable Heterogeneous Federated Cross-Correlation and Instance Similarity Learning [60.058083574671834]
本稿では,新しいFCCL+,フェデレーション相関と非ターゲット蒸留との類似性学習を提案する。不均一な問題に対しては、無関係な公開データを通信に活用する。局所的な更新段階における破滅的な忘れ物として、FCCL+はFederated Non Target Distillationを導入している。
論文参考訳（メタデータ） (2023-09-28T09:32:27Z)
Heterogeneous Embodied Multi-Agent Collaboration [21.364827833498254]
不均一なマルチエージェントタスクは現実世界のシナリオでは一般的である。本稿では,複数の異種エージェントが協調して異種物体を検出し,適切な位置に配置する異種マルチエージェント・タイピング・アップタスクを提案する。本稿では, 乱れ検出に基づく階層的決定モデル, 合理的な受容器予測, およびハンドシェイクに基づくグループ通信機構を提案する。
論文参考訳（メタデータ） (2023-07-26T04:33:05Z)
Adaptive Coordination in Social Embodied Rearrangement [49.35582108902819]
本研究では,エージェントが新しいパートナーと協力し,ロボットが新しいパートナーと協力するシナリオをエミュレートする作業において,ゼロショットコーディネート(ZSC)を研究する。本稿では,識別可能性の目的を通じて多様性を促進する新しいZSCアプローチである行動多様性プレイ(BDP)を提案する。以上の結果から,BDPは視覚的コーディネーションに対処可能な適応エージェントを学習し,ゼロショットは未確認環境において新たなパートナーに一般化し,ベースラインに比べて35%,効率が32%向上した。
論文参考訳（メタデータ） (2023-05-31T18:05:51Z)
Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文参考訳（メタデータ） (2022-10-17T07:16:44Z)
Stateful active facilitator: Coordination and Environmental Heterogeneity in Cooperative Multi-Agent Reinforcement Learning [71.53769213321202]
環境の調整レベルと不均一度の概念を定式化する。異なるMARLアプローチの実証評価を容易にするマルチエージェント環境のスイートであるHECOGridを提案する。本研究では,エージェントが高配向環境と高配向環境において効率的に作業することを可能にする訓練分散実行学習手法を提案する。
論文参考訳（メタデータ） (2022-10-04T18:17:01Z)
Collaborative Training of Heterogeneous Reinforcement Learning Agents in Environments with Sparse Rewards: What and When to Share? [7.489793155793319]
本研究は,本質的なモチベーションを通じて得られた情報と,より効率的な探索と学習の高速化を目的とした情報を組み合わせることに焦点を当てる。計算コストの少ない協調的なフレームワークが知識を共有することなく独立した学習プロセスより優れていることを示す。
論文参考訳（メタデータ） (2022-02-24T16:15:51Z)
Cooperative Policy Learning with Pre-trained Heterogeneous Observation Representations [51.8796674904734]
事前訓練された異種観察表現を用いた新たな協調学習フレームワークを提案する。エンコーダ-デコーダに基づくグラフアテンションを用いて、複雑な相互作用と異種表現を学習する。
論文参考訳（メタデータ） (2020-12-24T04:52:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。