Fugu-MT 論文翻訳(概要): Gameplay Filters: Safe Robot Walking through Adversarial Imagination

論文の概要: Gameplay Filters: Safe Robot Walking through Adversarial Imagination

arxiv url: http://arxiv.org/abs/2405.00846v1
Date: Wed, 1 May 2024 20:21:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-03 18:33:31.769598
Title: Gameplay Filters: Safe Robot Walking through Adversarial Imagination
Title（参考訳）: 対戦型イマジネーションを歩き回る安全なロボット「Gameplay Filters」
Authors: Duy P. Nguyen, Kai-Chieh Hsu, Wenhao Yu, Jie Tan, Jaime F. Fisac,
Abstract要約: 脚のあるロボットの移動のための既存のソリューションはまだ単純化されたダイナミクスに依存しており、ロボットが予め定義された安定した歩行から離れていれば失敗する可能性がある。本稿では,オフラインゲーム理論の強化学習を活用し,高次非線形力学のための高堅牢な安全フィルタを合成する一般手法を提案する。ゲームプレイ安全フィルタは、手動チューニングや計算設計なしで、sim-to-realギャップに固有の堅牢性を示す。
参考スコア（独自算出の注目度）: 12.548355269509882
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Ensuring the safe operation of legged robots in uncertain, novel environments is crucial to their widespread adoption. Despite recent advances in safety filters that can keep arbitrary task-driven policies from incurring safety failures, existing solutions for legged robot locomotion still rely on simplified dynamics and may fail when the robot is perturbed away from predefined stable gaits. This paper presents a general approach that leverages offline game-theoretic reinforcement learning to synthesize a highly robust safety filter for high-order nonlinear dynamics. This gameplay filter then maintains runtime safety by continually simulating adversarial futures and precluding task-driven actions that would cause it to lose future games (and thereby violate safety). Validated on a 36-dimensional quadruped robot locomotion task, the gameplay safety filter exhibits inherent robustness to the sim-to-real gap without manual tuning or heuristic designs. Physical experiments demonstrate the effectiveness of the gameplay safety filter under perturbations, such as tugging and unmodeled irregular terrains, while simulation studies shed light on how to trade off computation and conservativeness without compromising safety.
Abstract（参考訳）: 脚付きロボットが不確実で新しい環境で安全に運用されることは、その普及に不可欠である。近年の安全フィルタの進歩により、任意のタスク駆動型ポリシーが安全上の障害を引き起こすのを防ぐことができるが、脚のあるロボットの移動のための既存のソリューションは、まだ単純化されたダイナミクスに依存しており、ロボットが予め定義された安定した歩行から遠ざかっているときに失敗する可能性がある。本稿では,オフラインゲーム理論の強化学習を活用し,高次非線形力学のための高堅牢な安全フィルタを合成する一般手法を提案する。このゲームプレイフィルタは、敵の未来を継続的にシミュレートし、将来のゲームを失う(したがって安全を損なう)ようなタスク駆動アクションを先取りすることにより、実行時の安全性を維持する。ゲームプレイ安全フィルタは、36次元の四足歩行タスクで検証され、手動のチューニングやヒューリスティックなデザインなしで、シム・トゥ・リアルギャップに固有の堅牢性を示す。物理実験は、タグ付けや不規則な地形などの摂動下でのゲームプレイ安全フィルタの有効性を実証し、シミュレーション研究は、安全性を損なうことなく計算と保守性をトレードオフする方法に光を当てた。

関連論文リスト

Flow Policy Gradients for Robot Control [67.61978635211048]
フローマッチングポリシ勾配は、より表現力のあるポリシのトレーニングと微調整に有効である。我々は、スクラッチからトレーニングを行う際に、フロー表現をどのように活用するかを示し、ベースラインよりもきめ細やかな堅牢性を改善する。
論文参考訳（メタデータ） (2026-02-02T18:56:49Z)
Diffusion-Guided Backdoor Attacks in Real-World Reinforcement Learning [13.244940433694024]
バックドア攻撃は、強化学習ポリシーに隠された悪意のある振る舞いを埋め込み、テスト時にトリガーを使用してそれらをアクティベートする。既存の攻撃のほとんどはシミュレーションでのみ検証されているが、実際のロボットシステムでの有効性はまだ不明である。これまでに見過ごされてきた問題を考察し,現実世界のRLに対する拡散誘導型バックドアアタックフレームワーク(DGBA)を提案する。
論文参考訳（メタデータ） (2026-01-20T16:03:51Z)
SPiDR: A Simple Approach for Zero-Shot Safety in Sim-to-Real Transfer [60.19411648245077]
悲観的領域ランダム化によるSim-to-realの略称であるSPiDRを提案する。 SPiDRは、安全なsim-to-real転送を保証するスケーラブルなアルゴリズムである。我々は,SPiDRが性能を維持しつつ,シミュレートとリアルのギャップを保ちながら,安全性を効果的に確保できることを実証した。
論文参考訳（メタデータ） (2025-09-23T05:03:00Z)
3D Gaussian Splatting Driven Multi-View Robust Physical Adversarial Camouflage Generation [50.03578546845548]
物理敵攻撃法は、ディープニューラルネットワークの脆弱性を露呈し、自律運転のような安全クリティカルなシナリオに重大な脅威をもたらす。カモフラージュをベースとした物理的な攻撃は、パッチベースの攻撃よりも有望なアプローチであり、複雑な物理的環境においてより強力な対逆効果を提供する。本稿では,PGAと命名された3Dガウススティング(3DGS)に基づく物理的攻撃フレームワークを提案する。
論文参考訳（メタデータ） (2025-07-02T05:10:16Z)
Uncertainty-aware Latent Safety Filters for Avoiding Out-of-Distribution Failures [7.0540936204654]
本研究では,不確実性を考慮した潜伏型安全フィルタを導入し,ロボットを既知の障害や目に見えない障害から遠ざけている。この不確実性認識型安全フィルタは,潜在的な安全でないシナリオを事前に検出し,安全かつ不分配な動作を確実に提案することを示す。
論文参考訳（メタデータ） (2025-05-01T18:18:17Z)
Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis [6.267574471145217]
Hamilton-Jacobi (H) は、ロボットが安全でない状態を同時に検出し、アクションを生成するための厳格なフレームワークである。生観測データを直接操作する潜在空間到達性であるLa Safety Filtersを提案する。
論文参考訳（メタデータ） (2025-02-02T22:00:20Z)
Pre-Trained Vision Models as Perception Backbones for Safety Filters in Autonomous Driving [2.4381063627159523]
エンド・ツー・エンドのビジョンに基づく自動運転において、安全は依然として大きな関心事である。我々は、凍結した事前学習された視覚表現モデルを知覚バックボーンとして使用し、視覚に基づく安全フィルタを設計する。この状況下では、4つの一般的な事前学習型視覚モデルのオフライン性能を実証的に評価する。
論文参考訳（メタデータ） (2024-10-29T22:59:23Z)
ReGentS: Real-World Safety-Critical Driving Scenario Generation Made Stable [88.08120417169971]
機械学習に基づく自律運転システムは、現実世界のデータでは稀な安全クリティカルなシナリオで課題に直面していることが多い。この研究は、軌道最適化によって複雑な現実世界の通常のシナリオを変更することによって、安全クリティカルな運転シナリオを生成することを検討する。提案手法は、頑健なプランナーの訓練には役に立たない非現実的な発散軌道と避けられない衝突シナリオに対処する。
論文参考訳（メタデータ） (2024-09-12T08:26:33Z)
SAFE-GIL: SAFEty Guided Imitation Learning for Robotic Systems [15.782203322922017]
安全に配慮した行動クローニングポリシーを学習するための設計時手法であるSAFE-GILを提案する。我々は,データ収集中にシステム内の敵対的障害を注入し,専門家を安全クリティカルな状態へ誘導する。この障害注入は、システムがテスト時に遭遇する可能性のある潜在的なポリシーエラーをシミュレートする。
論文参考訳（メタデータ） (2024-04-08T07:25:25Z)
Uniformly Safe RL with Objective Suppression for Multi-Constraint Safety-Critical Applications [73.58451824894568]
広く採用されているCMDPモデルは予測のリスクを制約しており、長い尾の州で危険な行動を起こす余地がある。安全クリティカルな領域では、そのような行動は破滅的な結果をもたらす可能性がある。本稿では,目標を最大化するタスク報酬を適応的に抑制する新しい手法であるObjective Suppressionを提案する。
論文参考訳（メタデータ） (2024-02-23T23:22:06Z)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳（メタデータ） (2023-12-31T04:14:43Z)
Modular Control Architecture for Safe Marine Navigation: Reinforcement Learning and Predictive Safety Filters [0.0]
強化学習は複雑なシナリオに適応するためにますます使われていますが、安全性と安定性を保証するための標準フレームワークは欠如しています。予測安全フィルタ(PSF)は、明示的な制約処理を伴わずに、学習ベースの制御における制約満足度を確保する、有望なソリューションを提供する。この手法を海洋航法に適用し,シミュレーションされたCybership IIモデル上でRLとPSFを組み合わせた。その結果, PSF が安全維持に有効であることは, RL エージェントの学習速度と性能を損なうことなく示され, PSF を使用せずに標準 RL エージェントに対して評価された。
論文参考訳（メタデータ） (2023-12-04T12:37:54Z)
Safe Deep Policy Adaptation [7.2747306035142225]
強化学習(RL)に基づく政策適応は、汎用性と汎用性を提供するが、安全性と堅牢性に挑戦する。政策適応と安全強化学習の課題を同時に解決する新しいRLおよび制御フレームワークであるSafeDPAを提案する。我々は、SafeDPAの理論的安全性を保証し、学習エラーや余分な摂動に対するSafeDPAの堅牢性を示す。
論文参考訳（メタデータ） (2023-10-08T00:32:59Z)
Learning Vision-based Pursuit-Evasion Robot Policies [54.52536214251999]
我々は、部分的に観察可能なロボットの監督を生成する完全観測可能なロボットポリシーを開発する。我々は、RGB-Dカメラを搭載した4足歩行ロボットに、野生での追従回避のインタラクションにポリシーを展開させる。
論文参考訳（メタデータ） (2023-08-30T17:59:05Z)
Nonprehensile Planar Manipulation through Reinforcement Learning with Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。分類分布を用いたマルチモーダル探索手法を提案する。学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文参考訳（メタデータ） (2023-08-04T16:55:00Z)
A Multiplicative Value Function for Safe and Efficient Reinforcement Learning [131.96501469927733]
本稿では,安全評論家と報酬評論家からなる新しい乗法値関数を持つモデルフリーRLアルゴリズムを提案する。安全評論家は、制約違反の確率を予測し、制限のないリターンのみを見積もる報酬批評家を割引する。安全制約を付加した古典的RLベンチマークや、画像を用いたロボットナビゲーションタスク、生のライダースキャンを観察する4つの環境において、本手法の評価を行った。
論文参考訳（メタデータ） (2023-03-07T18:29:15Z)
Modular Safety-Critical Control of Legged Robots [0.0]
脚付きロボットの操作時の安全上の懸念に対処し、広く使用できるようにする必要がある。本研究は,脚付きロボットの安全性,すなわち転倒の可能性を低下させるモジュール型安全フィルタを提案する。
論文参考訳（メタデータ） (2023-03-04T11:36:21Z)
In-Distribution Barrier Functions: Self-Supervised Policy Filters that Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文参考訳（メタデータ） (2023-01-27T22:28:19Z)
ISAACS: Iterative Soft Adversarial Actor-Critic for Safety [0.9217021281095907]
この研究は、ロボットシステムのための堅牢な安全維持コントローラのスケーラブルな合成を可能にする新しいアプローチを導入する。安全を追求するフォールバックポリシーは、モデルエラーの最悪のケースの実現を促進するために、敵の「混乱」エージェントと共同で訓練される。学習した制御ポリシーは本質的に安全性を保証するものではないが、リアルタイムの安全フィルタを構築するために使用される。
論文参考訳（メタデータ） (2022-12-06T18:53:34Z)
DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文参考訳（メタデータ） (2022-10-25T01:51:36Z)
Safe Reinforcement Learning Using Black-Box Reachability Analysis [20.875010584486812]
強化学習(Reinforcement Learning, RL)は、不確実な環境下でのロボットの動き計画と制御を高度に行うことができる。広範な展開を正当化するためには、ロボットは性能を犠牲にすることなく安全上の制約を尊重しなければならない。我々は3つの主要コンポーネントを持つブラックボックス到達可能性に基づく安全層(BRSL)を提案する。
論文参考訳（メタデータ） (2022-04-15T10:51:09Z)
Evaluating the Robustness of Semantic Segmentation for Autonomous Driving against Real-World Adversarial Patch Attacks [62.87459235819762]
自動運転車のような現実のシナリオでは、現実の敵例(RWAE)にもっと注意を払わなければならない。本稿では,デジタルおよび実世界の敵対パッチの効果を検証し,一般的なSSモデルのロバスト性を詳細に評価する。
論文参考訳（メタデータ） (2021-08-13T11:49:09Z)
Adaptive Feature Alignment for Adversarial Training [56.17654691470554]
CNNは通常、敵攻撃に対して脆弱であり、セキュリティに敏感なアプリケーションに脅威をもたらす。任意の攻撃強度の特徴を生成するための適応的特徴アライメント(AFA)を提案する。本手法は任意の攻撃強度の特徴を自動的に整列するように訓練されている。
論文参考訳（メタデータ） (2021-05-31T17:01:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。