論文の概要: PIMbot: A Self-Adaptive Attack Framework for Adversarial Manipulation of Multi-Robot Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.23027v1
- Date: Thu, 21 May 2026 20:50:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.094752
- Title: PIMbot: A Self-Adaptive Attack Framework for Adversarial Manipulation of Multi-Robot Reinforcement Learning
- Title(参考訳): PIMbot:マルチロボット強化学習の逆操作のための自己適応型アタックフレームワーク
- Authors: Zexin Li, Ziliang Zhang, Hyoseung Kim, Cong Liu,
- Abstract要約: PIMbotは、2つの補完的なレバーを介して結果を操作するフレームワークである。
我々の研究は、近年のマルチエージェントRL社会ジレンマにおいて、操作に対する新しいアプローチを導入している。
- 参考スコア(独自算出の注目度): 6.551131440595008
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent research has demonstrated the potential of reinforcement learning in effective multi-robot collaboration, particularly in social dilemmas where robots face a trade-off between self-interest and collective benefits. However, environmental factors such as miscommunication and adversarial robots can impact cooperation, making it crucial to explore how multi-robot communication can be manipulated to achieve different outcomes. This paper presents PIMbot, a framework that manipulates outcomes via two complementary levers: (i) incentive manipulation of the reward channel and (ii) policy manipulation of an agent's own actions. An adaptive multi-objective controller balances these levers in an online manner. Our work introduces a novel approach to manipulation in recent multi-agent RL social dilemmas that utilize a unique reward function for incentivization. By utilizing our proposed PIMbot mechanisms, a robot is able to manipulate the social dilemma environment effectively. Comprehensive experimental results demonstrate the effectiveness of our proposed methods in the Gazebo-simulated multi-robot environment. Moreover, a real embedded device case study on NVIDIA Jetson Orin Nano quantifies system cost and validates PIMbot's effectiveness on realistic autonomous embedded systems scenarios beyond simulation. Together, these results position PIMbot as a rigorous stress-test tool exposing critical vulnerabilities in multi-robot cooperative tasks.
- Abstract(参考訳): 最近の研究は、特にロボットが自己利益と集団利益のトレードオフに直面している社会的ジレンマにおいて、効果的なマルチロボットコラボレーションにおける強化学習の可能性を示している。
しかし, コミュニケーションミスや対人ロボットなどの環境要因が協調に影響を及ぼす可能性があり, 異なる結果を得るために, マルチロボットコミュニケーションをどのように操作するかを検討することが重要である。
本稿では,2つの相補的レバーを用いた結果操作フレームワークであるPIMbotについて述べる。
一 報酬チャンネル及び報酬チャンネルのインセンティブ操作
二 代理人自身の行為の政策操作
適応多目的コントローラは、これらのレバーをオンライン的にバランスさせる。
本研究は、近年のマルチエージェントRL社会ジレンマにおいて、インセンティブ化にユニークな報酬関数を利用する新しい操作手法を提案する。
提案するPIMbot機構を利用することで,ロボットが社会的ジレンマ環境を効果的に操作することができる。
総合実験により,ガゼボ模擬マルチロボット環境における提案手法の有効性が示された。
さらに、NVIDIA Jetson Orin Nanoの実際の組み込みデバイスケーススタディでは、システムコストを定量化し、シミュレーション以外の現実的な自律的な組み込みシステムシナリオにおけるPIMbotの有効性を検証する。
これらの結果はPIMbotをマルチロボット協調作業における重大な脆弱性を明らかにする厳格なストレステストツールとして位置づけた。
関連論文リスト
- HACTS: a Human-As-Copilot Teleoperation System for Robot Learning [47.9126187195398]
HACTS(Human-As-Copilot Teleoperation System)は,ロボットアームと遠隔操作ハードウェアを双方向でリアルタイムに同期させるシステムである。
このシンプルで効果的なフィードバックメカニズムは、自動運転車のステアリングホイールに似たもので、人間の操縦士がシームレスに介入し、将来の学習のために行動補正データを収集することを可能にする。
論文 参考訳(メタデータ) (2025-03-31T13:28:13Z) - EMOS: Embodiment-aware Heterogeneous Multi-robot Operating System with LLM Agents [33.77674812074215]
異種ロボット間の効果的な協調を実現するための新しいマルチエージェントフレームワークを提案する。
エージェントがロボットURDFファイルを理解し、ロボットキネマティクスツールを呼び出し、その物理能力の記述を生成する。
Habitat-MASベンチマークは、マルチエージェントフレームワークがエンボディメント認識推論を必要とするタスクをどのように処理するかを評価するように設計されている。
論文 参考訳(メタデータ) (2024-10-30T03:20:01Z) - Human-Agent Joint Learning for Efficient Robot Manipulation Skill Acquisition [48.65867987106428]
本稿では,人間とロボットの協調学習システムについて紹介する。
これにより、ロボットエンドエフェクターの制御を学習支援エージェントと共有することができる。
これにより、ダウンストリームタスクにおいて、収集されたデータが十分な品質であることを保証しながら、人間の適応の必要性を減らすことができる。
論文 参考訳(メタデータ) (2024-06-29T03:37:29Z) - PIMbot: Policy and Incentive Manipulation for Multi-Robot Reinforcement
Learning in Social Dilemmas [4.566617428324801]
本稿では,マルチロボットコラボレーションにおける報酬関数を操作するための新しいアプローチ,すなわちPIMbotを提案する。
提案するPIMbot機構を利用することで,ロボットが社会的ジレンマ環境を効果的に操作することができる。
我々の研究は、ロボット間通信をどのように操作するかについての洞察を与え、様々なロボットアプリケーションに影響を及ぼす。
論文 参考訳(メタデータ) (2023-07-29T09:34:45Z) - Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement
Learning [54.636562516974884]
模倣と強化学習において、人間の監督コストは、ロボットが訓練できるデータの量を制限する。
本研究では,自己改善型ロボットシステムのための新しい設計手法であるMEDAL++を提案する。
ロボットは、タスクの実施と解除の両方を学ぶことで、自律的にタスクを練習し、同時にデモンストレーションから報酬関数を推論する。
論文 参考訳(メタデータ) (2023-03-02T18:51:38Z) - Active Exploration for Robotic Manipulation [40.39182660794481]
本稿では,スパース・リワード型ロボット操作作業における効率的な学習を可能にするモデルに基づく能動探索手法を提案する。
我々は,提案アルゴリズムをシミュレーションおよび実ロボットで評価し,スクラッチから本手法を訓練した。
論文 参考訳(メタデータ) (2022-10-23T18:07:51Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。