論文の概要: Topology-Driven Anti-Entanglement Control for Soft Robots
- arxiv url: http://arxiv.org/abs/2605.05236v1
- Date: Fri, 01 May 2026 06:08:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.295493
- Title: Topology-Driven Anti-Entanglement Control for Soft Robots
- Title(参考訳): ソフトロボットのトポロジー駆動型アンチエンタングルメント制御
- Authors: Haoyang Le, Shengxuan Wang, Mohan Chen, Shuo Feng,
- Abstract要約: 本稿では,トポロジ駆動型マルチエージェント強化学習(TD-MARL)フレームワークを提案する。
具体的には、クリティカルネットワークは集中型学習を採用しており、各知能体は他の知能体の戦略を知覚することができる。
統合トポロジカルセキュリティ層は、トポロジカル不変量を用いて、戦略が局所的な困難に陥るのを避けるために、絡み合いのリスクを正確に評価し軽減する。
- 参考スコア(独自算出の注目度): 3.223232489699093
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of precision manufacturing in complex constrained environments, the role of soft robots is increasingly prominent, and the realization of anti-winding control based on multi-intelligent body reinforcement learning has become a research hotspot. One of the core problems at present is to coordinate multiple robots to complete the unwinding operation in a highly constrained environment. The existing distributed training framework faces some observability challenges in high-density barrier and unstable environments, resulting in poor learning results. This paper proposes a topology-driven Multi-Agent Reinforcement Learning (TD-MARL) framework to coordinate multi-robot systems to avoid entanglement. Specifically, the critical network adopts centralized learning, so that each intelligent body can perceive the strategies of other intelligent bodies by sharing the topological state, thus alleviating the training instability caused by complex interactions; eliminating the demand for communication resources between robots through distributed execution, Upgrade system reliability; the integrated topological security layer uses topological invariants to accurately assess and mitigate the risk of entanglement to avoid the strategy from falling into local difficulties. Finally, the full simulation experiments carried out in the real simulation environment show that the method is better than the current advanced deep reinforcement learning (DRL) method in terms of convergence and anti-winding effect.
- Abstract(参考訳): 複雑な制約のある環境での精密製造の分野では、ソフトロボットの役割がますます顕著になり、多知能体力強化学習に基づく対風制御の実現が研究ホットスポットとなっている。
現状の課題の1つは、複数のロボットを協調させて、高度に制約された環境での巻き外し操作を完了させることである。
既存の分散トレーニングフレームワークは、高密度障壁と不安定な環境において、いくつかの可観測性に直面する。
本稿では,トポロジ駆動型マルチエージェント強化学習(TD-MARL)フレームワークを提案する。
具体的には、クリティカルネットワークは、各知能体が、トポロジカルな状態を共有することによって、他の知能体の戦略を知覚し、複雑な相互作用によるトレーニング不安定を軽減し、分散実行によるロボット間の通信リソースの要求をなくし、システム信頼性を向上し、統合トポロジカルセキュリティ層は、トポロジカル不変量を用いて、戦略が局所的な困難に陥るのを避けるために、絡み合いのリスクを正確に評価し軽減する。
最後に, 実シミュレーション環境で実施した全シミュレーション実験により, 収束性および反巻線効果の観点から, 現在の高度深部強化学習法(DRL)法よりも優れた結果を得た。
関連論文リスト
- Decentralized Heterogeneous Multi-Robot Collaborative Exploration for Indoor and Outdoor 3D Environments [11.81511178687002]
本稿では,異種マルチロボットシステムのための分散協調フレームワークを提案する。
このフレームワークは、異種ロボット間の探索作業を調整し、優れた探索効率と通信節約を実現する。
論文 参考訳(メタデータ) (2026-04-26T13:16:13Z) - IMAGINE: Intelligent Multi-Agent Godot-based Indoor Networked Exploration [0.0]
本稿では,2次元屋内環境における課題に対処するために,MARL(Multi-Agent Reinforcement Learning)を実装した。
政策訓練は、不確実性の下で創発的な協調行動と意思決定を達成することを目的としている。
論文 参考訳(メタデータ) (2026-02-02T22:08:41Z) - Latent Space Reinforcement Learning for Multi-Robot Exploration [0.0]
未知環境の自動マッピングシステムを開発した。
必須空間情報を保存しつつ,高忠実度占有率マップを潜在状態ベクトルに圧縮する。
共有データへの依存を変調する重み付きコンセンサス機構を導入する。
論文 参考訳(メタデータ) (2026-01-03T10:06:40Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。