論文の概要: Multimodal Adversarial Quality Policy for Safe Grasping
- arxiv url: http://arxiv.org/abs/2603.01479v2
- Date: Tue, 10 Mar 2026 02:14:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.813831
- Title: Multimodal Adversarial Quality Policy for Safe Grasping
- Title(参考訳): 安全なグラッピングのためのマルチモーダル・ディバイサル品質政策
- Authors: Kunlin Xie, Chenghao Li, Haolan Zhang, Nak Young Chong,
- Abstract要約: Deep Neural Networks (DNN) に基づく視覚誘導型ロボットグリーピングの一般化とヒューマン・ロボットインタラクション(HRI)における安全性のリスク
近年の研究は、RGBのモード性を持つ良質な敵攻撃やパッチを設計することで解決されているが、深さに依存しない特性はRGBDのモード性に対する効果を制限している。
マルチモーダル安全な把握を実現するためのマルチモーダル適応品質ポリシー(MAQP)を提案する。
- 参考スコア(独自算出の注目度): 5.171217591330313
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision-guided robot grasping based on Deep Neural Networks (DNNs) generalizes well but poses safety risks in the Human-Robot Interaction (HRI). Recent works solved it by designing benign adversarial attacks and patches with RGB modality, yet depth-independent characteristics limit their effectiveness on RGBD modality. In this work, we propose the Multimodal Adversarial Quality Policy (MAQP) to realize multimodal safe grasping. Our framework introduces two key components. First, the Heterogeneous Dual-Patch Optimization Scheme (HDPOS) mitigates the distribution discrepancy between RGB and depth modalities in patch generation by adopting modality-specific initialization strategies, employing a Gaussian distribution for depth patches and a uniform distribution for RGB patches, while jointly optimizing both modalities under a unified objective function. Second, the Gradient-Level Modality Balancing Strategy (GLMBS) is designed to resolve the optimization imbalance from RGB and Depth patches in patch shape adaptation by reweighting gradient contributions based on per-channel sensitivity analysis and applying distance-adaptive perturbation bounds. We conduct extensive experiments on the benchmark datasets and a cobot, showing the effectiveness of MAQP.
- Abstract(参考訳): ディープニューラルネットワーク(DNN)に基づく視覚誘導型ロボットグルーピングは,人間-ロボットインタラクション(HRI)において安全リスクを生じさせる。
近年の研究は、RGBのモード性を持つ良質な敵攻撃やパッチを設計することで解決されているが、深さに依存しない特性はRGBDのモード性に対する効果を制限している。
本研究では,マルチモーダルな安全把握を実現するためのマルチモーダル適応品質ポリシー(MAQP)を提案する。
フレームワークには2つの重要なコンポーネントがあります。
まず、不均質なデュアルパッチ最適化スキーム(HDPOS)は、モダリティ固有の初期化戦略を採用し、奥行きパッチのガウス分布とRGBパッチの均一分布を用い、両モードを統一目的関数の下で共同最適化することにより、RGBと奥行きモダリティの分布差を緩和する。
第二に、GLMBS(Gradient-Level Modality Balancing Strategy)は、チャネルごとの感度解析に基づく勾配寄与の再重み付けと距離適応摂動境界の適用により、RGBおよびDepthパッチからのパッチ形状適応における最適化不均衡を解決するように設計されている。
ベンチマークデータセットとコボットについて広範な実験を行い,MAQPの有効性を示した。
関連論文リスト
- OmniVL-Guard: Towards Unified Vision-Language Forgery Detection and Grounding via Balanced RL [63.388513841293616]
既存の偽造検出手法は、現実世界の誤報に多いインターリーブされたテキスト、画像、ビデオを扱うのに失敗する。
このギャップを埋めるため,本論文では,オムニバス・ビジョン言語による偽造検出と接地のための統一フレームワークの開発を目標としている。
我々は、OmniVL-Guardという、オムニバス視覚言語による偽造検出と接地のためのバランスの取れた強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-11T09:41:36Z) - Deep Reinforcement Learning-Based Precoding for Multi-RIS-Aided Multiuser Downlink Systems with Practical Phase Shift [44.303967859644295]
本研究では、RIS位相シフト行列をスペクトル効率に最適化することを目的として、複数再構成可能なマルチユーザダウンリンクシステムについて検討する。
提案するDD-DRLフレームワークは,mmWaveチャネル設定において,両方のランダムなユーザ数で評価される。
論文 参考訳(メタデータ) (2025-09-30T01:57:57Z) - Mirror Descent Policy Optimisation for Robust Constrained Markov Decision Processes [12.666842349236788]
本稿では,ロバストなマルコフ決定過程に対するミラー降下ポリシーの最適化について述べる。
政策勾配法を用いて、ラグランジアン上のポリシー(最大値)と遷移カーネル(最小値)の両方を最適化する。
実験は、制約付きおよび制約なし最適化におけるミラー降下ポリシー最適化の利点を確認する。
論文 参考訳(メタデータ) (2025-06-29T09:55:52Z) - Sim-to-Real Grasp Detection with Global-to-Local RGB-D Adaptation [19.384129689848294]
本稿では,RGB-Dグリップ検出のシム・ツー・リアル問題に着目し,ドメイン適応問題として定式化する。
本稿では,RGBと深度データにおけるハイブリッドドメインギャップに対処し,マルチモーダルな特徴アライメントが不十分なグローバル・ローカルな手法を提案する。
論文 参考訳(メタデータ) (2024-03-18T06:42:38Z) - Deep Reinforcement Learning for Inventory Networks: Toward Reliable Policy Optimization [2.9016349714298157]
我々は、在庫管理が深層強化学習(DRL)の信頼性向上にユニークな機会をもたらすと論じている。
1つ目はHendsight Differentiable Policy Optimization (HDPO)であり、これはオフラインのカウンターファクトシミュレーションからパスワイズ勾配を用いてポリシー性能を直接かつ効率的に最適化する。
グラフニューラルネットワーク(GNN)を,サプライチェーン構造を符号化する自然な帰納バイアスとして利用し,最適かつほぼ最適なポリシを2つの理論的設定で表現できること,および6つの多様な在庫問題におけるデータ要求の低減を実証的に示す。
論文 参考訳(メタデータ) (2023-06-20T02:58:25Z) - Anchor-Changing Regularized Natural Policy Gradient for Multi-Objective
Reinforcement Learning [17.916366827429034]
複数の報酬値関数を持つマルコフ決定プロセス(MDP)のポリシー最適化について検討する。
本稿では,順応的な一階法からアイデアを取り入れたアンカー変更型正規化自然政策グラディエントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-10T21:09:44Z) - Dual Swin-Transformer based Mutual Interactive Network for RGB-D Salient
Object Detection [67.33924278729903]
本研究では,Dual Swin-Transformerを用いたMutual Interactive Networkを提案する。
視覚入力における長距離依存をモデル化するために,RGBと奥行きモードの両方の機能抽出器としてSwin-Transformerを採用している。
5つの標準RGB-D SODベンチマークデータセットに関する総合的な実験は、提案手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-06-07T08:35:41Z) - Cross-modality Discrepant Interaction Network for RGB-D Salient Object
Detection [78.47767202232298]
本稿では,RGB-D SODのためのクロスモダリティ離散相互作用ネットワーク(CDINet)を提案する。
2つのコンポーネントは、効果的な相互モダリティ相互作用を実装するように設計されている。
我々のネットワークは、定量的にも質的にも15ドルの最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-08-04T11:24:42Z) - High-resolution Depth Maps Imaging via Attention-based Hierarchical
Multi-modal Fusion [84.24973877109181]
誘導DSRのための新しい注意に基づく階層型マルチモーダル融合ネットワークを提案する。
本手法は,再現精度,動作速度,メモリ効率の点で最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-04T03:28:33Z) - Ultra-Reliable Indoor Millimeter Wave Communications using Multiple
Artificial Intelligence-Powered Intelligent Surfaces [115.85072043481414]
複数人工知能(AI)対応再構成可能なインテリジェントサーフェス(RIS)を用いた超信頼性ミリ波(mmW)通信を保証する新しいフレームワークを提案する。
複数のAI駆動RISを使用することで、mmWアクセスポイント(AP)から送信される信号の伝搬方向を変更できます。
mmW APとRISのポリシーを制御するために、2つの集中型および分散コントローラが提案されている。
論文 参考訳(メタデータ) (2021-03-31T19:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。