論文の概要: Adversarial joint attacks on legged robots
- arxiv url: http://arxiv.org/abs/2205.10098v1
- Date: Fri, 20 May 2022 11:30:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-23 15:03:11.279994
- Title: Adversarial joint attacks on legged robots
- Title(参考訳): 脚部ロボットの逆行性関節攻撃
- Authors: Takuto Otomo, Hiroshi Kera, Kazuhiko Kawamoto
- Abstract要約: 深部強化学習によって訓練された脚付きロボットの関節におけるアクチュエータに対する敵攻撃について検討する。
本研究では,アクチュエータのトルク制御信号に対する逆方向の摂動が,ロボットの報酬を著しく低減し,歩行不安定を生じさせることを示す。
- 参考スコア(独自算出の注目度): 3.480626767752489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We address adversarial attacks on the actuators at the joints of legged
robots trained by deep reinforcement learning. The vulnerability to the joint
attacks can significantly impact the safety and robustness of legged robots. In
this study, we demonstrate that the adversarial perturbations to the torque
control signals of the actuators can significantly reduce the rewards and cause
walking instability in robots. To find the adversarial torque perturbations, we
develop black-box adversarial attacks, where, the adversary cannot access the
neural networks trained by deep reinforcement learning. The black box attack
can be applied to legged robots regardless of the architecture and algorithms
of deep reinforcement learning. We employ three search methods for the
black-box adversarial attacks: random search, differential evolution, and
numerical gradient descent methods. In experiments with the quadruped robot
Ant-v2 and the bipedal robot Humanoid-v2, in OpenAI Gym environments, we find
that differential evolution can efficiently find the strongest torque
perturbations among the three methods. In addition, we realize that the
quadruped robot Ant-v2 is vulnerable to the adversarial perturbations, whereas
the bipedal robot Humanoid-v2 is robust to the perturbations. Consequently, the
joint attacks can be used for proactive diagnosis of robot walking instability.
- Abstract(参考訳): 深層強化学習により訓練された脚部ロボットの関節におけるアクチュエータに対する敵意攻撃について述べる。
関節攻撃の脆弱性は、脚のあるロボットの安全性と堅牢性に大きな影響を及ぼす可能性がある。
本研究では,アクチュエータのトルク制御信号に対する逆摂動が,ロボットの報酬を著しく減少させ,歩行不安定を引き起こすことを実証する。
逆方向のトルク摂動を見つけるために,深い強化学習によって訓練されたニューラルネットワークにアクセスできないブラックボックスの逆方向攻撃を発生させる。
ブラックボックス攻撃は、深層強化学習のアーキテクチャやアルゴリズムにかかわらず、脚のあるロボットに適用することができる。
我々は,ブラックボックス攻撃に対して,ランダム探索,微分進化,数値勾配降下という3つの探索手法を用いる。
四足歩行ロボットAnt-v2と二足歩行ロボットHumanoid-v2を用いた実験では,3つの方法の中で最も強いトルク摂動を効率よく発見できることがわかった。
また,二足歩行ロボットのヒューマノイドv2は摂動に対して頑健であるのに対し,四足歩行ロボットのant-v2は逆摂動に対して脆弱であることが分かった。
これにより、関節発作はロボット歩行不安定症の予防診断に使用できる。
関連論文リスト
- Pedipulate: Enabling Manipulation Skills using a Quadruped Robot's Leg [11.129918951736052]
脚のついたロボットは、メンテナンス、ホームサポート、探索のシナリオにおいて不可欠になる可能性がある。
本研究では,ロボットの脚を操作に用いたペディピュレーションについて検討する。
論文 参考訳(メタデータ) (2024-02-16T17:20:45Z) - HERD: Continuous Human-to-Robot Evolution for Learning from Human
Demonstration [57.045140028275036]
本研究では,マイクロ進化的強化学習を用いて,操作スキルを人間からロボットに伝達可能であることを示す。
本稿では,ロボットの進化経路とポリシーを協調的に最適化する多次元進化経路探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-08T15:56:13Z) - Illusory Attacks: Detectability Matters in Adversarial Attacks on
Sequential Decision-Makers [74.8408990716076]
既存の強化学習エージェントに対する観測空間攻撃は共通の弱点を有することを示す。
提案手法は, 有効かつ統計的に検出不可能な, 逐次的意思決定者に対する新たな攻撃形態である完全照準攻撃を導入する。
従来の攻撃と比較すると、R攻撃は自動で検出するのがかなり難しいことが実証されている。
論文 参考訳(メタデータ) (2022-07-20T19:49:09Z) - Adversarial Body Shape Search for Legged Robots [3.480626767752489]
ロボットの脚の長さと厚みに対する逆襲攻撃の進化的計算法を提案する。
対向体の形状を見つけることで、足歩行の脆弱性を積極的に診断することができる。
論文 参考訳(メタデータ) (2022-05-20T13:55:47Z) - Revisiting the Adversarial Robustness-Accuracy Tradeoff in Robot
Learning [121.9708998627352]
近年の研究では、現実的なロボット学習の応用において、対人訓練の効果が公平なトレードオフを起こさないことが示されている。
本研究は,ロボット学習におけるロバストネスと精度のトレードオフを再考し,最近のロバストトレーニング手法と理論の進歩により,現実のロボット応用に適した対人トレーニングが可能かどうかを解析する。
論文 参考訳(メタデータ) (2022-04-15T08:12:15Z) - A Transferable Legged Mobile Manipulation Framework Based on Disturbance
Predictive Control [15.044159090957292]
四足歩行ロボットにロボットアームを装着した足の移動操作は、ロボットの性能を大幅に向上させる。
本稿では,潜在動的アダプタを用いた強化学習スキームを低レベルコントローラに組み込んだ統合フレームワーク外乱予測制御を提案する。
論文 参考訳(メタデータ) (2022-03-02T14:54:10Z) - REvolveR: Continuous Evolutionary Models for Robot-to-robot Policy
Transfer [57.045140028275036]
本研究では,運動学や形態学など,異なるパラメータを持つ2つの異なるロボット間でポリシーを伝達する問題を考察する。
模倣学習手法を含む動作や状態遷移の分布を一致させることで、新しいポリシーを訓練する既存のアプローチは、最適な動作や/または状態分布が異なるロボットでミスマッチしているために失敗する。
本稿では,物理シミュレータに実装されたロボット政策伝達に連続的進化モデルを用いることで,$RevolveR$という新しい手法を提案する。
論文 参考訳(メタデータ) (2022-02-10T18:50:25Z) - Learning Control Policies for Fall prevention and safety in bipedal
locomotion [0.0]
本研究では,2種類のロボットに対して,プッシュリカバリ制御ポリシを合成可能な学習ベースアルゴリズムを開発した。
1)ヒューマノイドロボットの安全落下防止戦略の学習,2)ロボット支援装置を用いたヒトの転倒防止戦略の学習,である。
論文 参考訳(メタデータ) (2022-01-04T22:00:21Z) - The Feasibility and Inevitability of Stealth Attacks [63.14766152741211]
我々は、攻撃者が汎用人工知能システムにおける決定を制御できる新しい敵の摂動について研究する。
敵対的なデータ修正とは対照的に、ここで考慮する攻撃メカニズムには、AIシステム自体の変更が含まれる。
論文 参考訳(メタデータ) (2021-06-26T10:50:07Z) - Fault-Aware Robust Control via Adversarial Reinforcement Learning [35.16413579212691]
本稿では, 関節損傷症例に対するロボットの脆弱性を大幅に向上させる, 対向強化学習フレームワークを提案する。
我々は,本アルゴリズムを3本指ロボットと4本指ロボットで検証する。
我々のアルゴリズムはシミュレーションでのみ訓練でき、微調整なしで実際のロボットに直接展開できる。
論文 参考訳(メタデータ) (2020-11-17T16:01:06Z) - Enhanced Adversarial Strategically-Timed Attacks against Deep
Reinforcement Learning [91.13113161754022]
本稿では,DRLに基づくナビゲーションシステムに対して,選択した時間フレーム上の物理ノイズパターンを妨害することにより,タイミングに基づく逆方向戦略を導入する。
実験結果から, 対向タイミング攻撃は性能低下を引き起こす可能性が示唆された。
論文 参考訳(メタデータ) (2020-02-20T21:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。