論文の概要: Octopus-inspired Distributed Control for Soft Robotic Arms: A Graph Neural Network-Based Attention Policy with Environmental Interaction
- arxiv url: http://arxiv.org/abs/2603.10198v1
- Date: Tue, 10 Mar 2026 19:56:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.180001
- Title: Octopus-inspired Distributed Control for Soft Robotic Arms: A Graph Neural Network-Based Attention Policy with Environmental Interaction
- Title(参考訳): オクトプスに触発されたソフトロボットアームの分散制御:環境相互作用を考慮したグラフニューラルネットワークによる注意ポリシー
- Authors: Linxin Hou, Qirui Wu, Zhihang Qin, Yongxin Guo, Cecilia Laschi,
- Abstract要約: 本稿では,タコに触発されたソフトロボットアームの分散制御アーキテクチャであるSoftGMを提案する。
ソフトGMは、各アームセクションを協調剤として定式化し、アームと環境の相互作用をグラフとして表現する。
我々は,環境の複雑さを増大させる3つのタスクに対して,Cosserat-rodシミュレータ(PyElastica)を用いてSoftGMを評価した。
- 参考スコア(独自算出の注目度): 12.469641645103332
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper proposes SoftGM, an octopus-inspired distributed control architecture for segmented soft robotic arms that learn to reach targets in contact-rich environments using online obstacle discovery without relying on global obstacle geometry. SoftGM formulates each arm section as a cooperative agent and represents the arm-environment interaction as a graph. SoftGM uses a two-stage graph attention message passing scheme following a Centralised Training Decentralised Execution (CTDE) paradigm with a centralised critic and decentralised actor. We evaluate SoftGM in a Cosserat-rod simulator (PyElastica) across three tasks that increase the complexity of the environment: obstacle-free, structured obstacles, and a wall-with-hole scenario. Compared with six widely used MARL baselines (IDDPG, IPPO, ISAC, MADDPG, MAPPO, MASAC) under identical information content and training conditions, SoftGM matches strong CTDE methods in simpler settings and achieves the best performance in the wall-with-hole task. Robustness tests with observation noise, single-section actuation failure, and transient disturbances show that SoftGM preserves success while keeping control effort bounded, indicating resilient coordination driven by selective contact-relevant information routing.
- Abstract(参考訳): 本論文では,タコに触発されたソフトロボットアームの分散制御アーキテクチャであるSoftGMを提案する。
ソフトGMは、各アームセクションを協調剤として定式化し、アームと環境の相互作用をグラフとして表現する。
SoftGMは、中央集中訓練分散実行(CTDE)パラダイムに従って、2段階のグラフアテンションメッセージパッシングスキームを使用している。
我々は,Cosserat-rodシミュレータ(PyElastica)において,障害物のない,構造化された障害物,壁付きシナリオという,環境の複雑さを増大させる3つのタスクでSoftGMを評価する。
6つのMARLベースライン (IDDPG, IPPO, ISAC, MADDPG, MAPPO, MASAC) を同一の情報量とトレーニング条件で比較した場合, SoftGM は強力な CTDE 手法と簡易な設定で一致し,壁付きタスクにおける最高の性能を実現する。
観測ノイズ, 単区間動作障害, 過渡的障害によるロバストネス試験は, ソフトGMが制御作業の拘束を保ちながら成功を保ち, 選択的接触関連情報ルーティングによる弾力的な調整を示す。
関連論文リスト
- Multi-Agent Deep Reinforcement Learning for Collaborative UAV Relay Networks under Jamming Atatcks [36.380478794869234]
本稿では,この課題を,分散実行トレーニング(CTDE)フレームワークを用いて解決したMARL(Multi-Agent Reinforcement Learning)問題として定式化する。
提案手法はベースラインを著しく上回り,システム全体のスループットを約50%向上し,同時にほぼゼロの衝突速度を実現した。
重要な発見は、エージェントが明示的なプログラミングなしに創発的なアンチジャミング戦略を開発することである。
論文 参考訳(メタデータ) (2025-12-09T08:11:21Z) - Deep Reinforcement Learning for Multi-Agent Coordination [8.250169938213558]
本稿では,仮想フェロモンを用いて局所的・社会的相互作用をモデル化するS-MADRL(Stigmergic Multi-Agent Deep Reinforcement Learning)フレームワークを提案する。
我々は,ロボットが非対称な作業負荷分布に自己組織化される,最大8つのエージェントの最も効果的な協調を実現していることを示す。
この創発的行動は、自然界で観察される戦略に類似しており、混雑した環境下での分散マルチエージェント協調のためのスケーラブルなソリューションを示している。
論文 参考訳(メタデータ) (2025-10-04T00:47:20Z) - Bayesian Ego-graph inference for Networked Multi-Agent Reinforcement Learning [16.190458233440864]
本稿では,ネットワーク型MARLのためのグラフベースのポリシーを提案する。
ベイズ変分法による疎密なコンテキスト認識相互作用構造を学習する分散型アクターフレームであるBayesGを紹介する。
BayesGは、最大167エージェントの大規模トラフィック制御タスクにおいて、強力なMARLベースラインを上回っている。
論文 参考訳(メタデータ) (2025-09-20T10:09:37Z) - Benchmarking LLMs' Swarm intelligence [51.648605206159125]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - COMBO-Grasp: Learning Constraint-Based Manipulation for Bimanual Occluded Grasping [56.907940167333656]
集積ロボットグルーピングは、表面衝突などの環境制約により、所望のグルーピングポーズが運動的に不可能な場所である。
従来のロボット操作アプローチは、人間が一般的に使用する非包括的または双対的戦略の複雑さに苦しむ。
本稿では,2つの協調ポリシーを活用する学習ベースアプローチであるCOMBO-Grasp(Constraint-based Manipulation for Bimanual Occluded Grasping)を紹介する。
論文 参考訳(メタデータ) (2025-02-12T01:31:01Z) - Deep Implicit Coordination Graphs for Multi-agent Reinforcement Learning [36.844163371495995]
本稿では,このようなシナリオに対するディープ暗黙協調グラフ(DICG)アーキテクチャを提案する。
DICGは、動的コーディネーショングラフ構造を推論するモジュールで構成されており、グラフニューラルネットワークベースのモジュールによって、ジョイントアクションや値について暗黙的に推論することを学ぶために使用される。
以上の結果から,DICGは捕食・捕食作業における相対的過一般化の問題を解消し,また,課題であるStarCraft II Multi-agent Challenge (SMAC) や交通ジャンクション環境において,様々なMARLベースラインを上回ります。
論文 参考訳(メタデータ) (2020-06-19T23:41:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。