Fugu-MT 論文翻訳(概要): Massive Parallel Deep Reinforcement Learning for Active SLAM

論文の概要: Massive Parallel Deep Reinforcement Learning for Active SLAM

arxiv url: http://arxiv.org/abs/2603.25834v1
Date: Thu, 26 Mar 2026 18:58:20 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-30 21:49:48.240413
Title: Massive Parallel Deep Reinforcement Learning for Active SLAM
Title（参考訳）: アクティブSLAMのための大規模並列深部強化学習
Authors: Martín Arce Llobera, Julio A. Placed, Mariano De Paula, Pablo De Cristóforis,
Abstract要約: 並列コンピューティングの最近の進歩は、Active SLAMのような計算集約的な学習問題の新たな機会を生み出している。本稿では,能動SLAMのためのスケーラブルなエンドツーエンドDRLフレームワークを提案する。
参考スコア（独自算出の注目度）: 0.8299692647308321
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Recent advances in parallel computing and GPU acceleration have created new opportunities for computation-intensive learning problems such as Active SLAM -- where actions are selected to reduce uncertainty and improve joint mapping and localization. However, existing DRL-based approaches remain constrained by the lack of scalable parallel training. In this work, we address this challenge by proposing a scalable end-to-end DRL framework for Active SLAM that enables massively parallel training. Compared with the state of the art, our method significantly reduces training time, supports continuous action spaces and facilitates the exploration of more realistic scenarios. It is released as an open-source framework to promote reproducibility and community adoption.
Abstract（参考訳）: 並列コンピューティングとGPUアクセラレーションの最近の進歩は、Active SLAMのような計算集約的な学習問題の新たな機会を生み出している。しかし、既存のDRLベースのアプローチは、拡張性のある並列トレーニングの欠如によって制約を受け続けている。本稿では,Active SLAMのためのスケーラブルなエンドツーエンドDRLフレームワークを提案することで,この課題に対処する。最先端技術と比較して,本手法はトレーニング時間を大幅に短縮し,連続的な行動空間をサポートし,より現実的なシナリオの探索を容易にする。再現性とコミュニティの採用を促進するオープンソースフレームワークとしてリリースされている。

関連論文リスト

Sample-Efficient Neurosymbolic Deep Reinforcement Learning [49.60927398960061]
本稿では,背景記号知識を統合し,サンプル効率を向上させるニューロシンボリックディープRL手法を提案する。オンライン推論は2つのメカニズムを通じてトレーニングプロセスのガイドを行う。我々は、最先端の報奨機ベースラインよりも優れた性能を示す。
論文参考訳（メタデータ） (2026-01-06T09:28:53Z)
DiRL: An Efficient Post-Training Framework for Diffusion Language Models [54.405206032785706]
Diffusion Language Models (dLLMs) はAuto-Regressive(AR)モデルに代わる有望な代替品として登場した。既存の手法は、訓練と推論の間の計算の非効率性と客観的なミスマッチに悩まされている。我々は,FlexAttention-accelerated blockwise trainingとLMDeploy-timized inferenceを密接に統合した,効率的なポストトレーニングフレームワークであるDiRLを紹介した。
論文参考訳（メタデータ） (2025-12-23T08:33:19Z)
Periodic Asynchrony: An Effective Method for Accelerating Reinforcement Learning [8.395046547177806]
強化学習 (RL) が注目され, 再生・適用への取り組みが高まっている。主流のRLフレームワークでは、推論とトレーニングは一般的に同じデバイスにデプロイされる。本研究では、推論とトレーニングの展開を分離する戦略に戻ります。従来の同期アーキテクチャを周期的な非同期フレームワークに変換し、各コンポーネントの要求駆動、独立、および弾力的なスケーリングを可能にします。
論文参考訳（メタデータ） (2025-11-24T08:22:50Z)
Reinforcement Learning with Discrete Diffusion Policies for Combinatorial Action Spaces [57.466101098183884]
強化学習(Reinforcement Learning, RL)は、現実の多くの問題に共通する大規模なアクション空間にスケールするために苦労する。本稿では、複雑な環境下での高効率なポリシーとして、離散拡散モデルを訓練するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-09-26T21:53:36Z)
DAWM: Diffusion Action World Models for Offline Reinforcement Learning via Action-Inferred Transitions [6.723690093335988]
本研究では,現在の状態,行動,帰路を条件に,将来の状態逆トラジェクトリを生成する拡散型世界モデルを提案する。我々は、TD3BCやIQLのような保守的なオフラインRLアルゴリズムは、これらの拡張軌道のトレーニングから大きな恩恵を受けることを示す。
論文参考訳（メタデータ） (2025-09-23T20:06:26Z)
Action Mapping for Reinforcement Learning in Continuous Environments with Constraints [4.521631014571241]
本稿では,アクションマッピングを利用した新しいDRL学習手法を提案し,学習プロセスの合理化を図る。動作マッピングは制約のある環境でのトレーニング性能を大幅に向上させる実験を通して実証する。
論文参考訳（メタデータ） (2024-12-05T16:42:45Z)
CODE-CL: Conceptor-Based Gradient Projection for Deep Continual Learning [6.738409533239947]
深層ニューラルネットワークは、タスクを逐次学習する際に破滅的な忘れに苦しむ。最近のアプローチでは、勾配投影を用いた部分空間の更新が制限されている。本稿では,Deep Continual Learning (CODE-CL) のための概念ベース勾配予測法を提案する。
論文参考訳（メタデータ） (2024-11-21T22:31:06Z)
Training Neural Networks from Scratch with Parallel Low-Rank Adapters [46.764982726136054]
計算ノード間の複数の低ランクヘッドの並列トレーニングを実現するために設計された,新しい双方向最適化アルゴリズムである LoRA-the-Explorer (LTE) を導入する。我々のアプローチには、様々なビジョンデータセットを用いたビジョントランスフォーマーの広範な実験が含まれており、LTEが標準の事前トレーニングと競合していることが示されている。
論文参考訳（メタデータ） (2024-02-26T18:55:13Z)
Action-Quantized Offline Reinforcement Learning for Robotic Skill Learning [68.16998247593209]
オフライン強化学習(RL)パラダイムは、静的な行動データセットを、データを収集したポリシーよりも優れたパフォーマンスのポリシーに変換するためのレシピを提供する。本稿では,アクション量子化のための適応型スキームを提案する。 IQL,CQL,BRACといった最先端のオフラインRL手法が,提案手法と組み合わせることで,ベンチマークのパフォーマンスが向上することを示す。
論文参考訳（メタデータ） (2023-10-18T06:07:10Z)
Accelerated Policy Learning with Parallel Differentiable Simulation [59.665651562534755]
微分可能シミュレータと新しいポリシー学習アルゴリズム(SHAC)を提案する。本アルゴリズムは,スムーズな批判機能により局所最小化の問題を軽減する。現状のRLと微分可能なシミュレーションベースアルゴリズムと比較して,サンプル効率と壁面時間を大幅に改善した。
論文参考訳（メタデータ） (2022-04-14T17:46:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。