論文の概要: CoFreeVLA: Collision-Free Dual-Arm Manipulation via Vision-Language-Action Model and Risk Estimation
- arxiv url: http://arxiv.org/abs/2601.21712v2
- Date: Tue, 03 Feb 2026 08:23:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.011318
- Title: CoFreeVLA: Collision-Free Dual-Arm Manipulation via Vision-Language-Action Model and Risk Estimation
- Title(参考訳): CoFreeVLA:ビジョンランゲージ・アクションモデルとリスク推定による衝突のないデュアルアームマニピュレーション
- Authors: Xuanran Zhai, Binkai Ou, Qiaojun Yu, Ce Hao, Yaohua Liu,
- Abstract要約: CoFreeVLAは、短地平線自己衝突リスク推定器を備えたエンドツーエンドビジョン言語アクション(VLA)を強化している。
この推定装置は危険な命令をゲートし、リスク誘導調整によって安全な状態に回復し、より安全なロールアウトのための政策改善を形作る。
PiPERロボットアームの5つのバイマニュアルタスクにおいて、CoFreeVLAは自己照合を減らし、RTTやAPEXと比較して成功率を向上させる。
- 参考スコア(独自算出の注目度): 7.957404667299983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Vision Language Action (VLA) models enable instruction following manipulation, yet dualarm deployment remains unsafe due to under modeled selfcollisions between arms and grasped objects. We introduce CoFreeVLA, which augments an endtoend VLA with a short horizon selfcollision risk estimator that predicts collision likelihood from proprioception, visual embeddings, and planned actions. The estimator gates risky commands, recovers to safe states via risk-guided adjustments, and shapes policy refinement for safer rollouts. It is pre-trained with model-based collision labels and posttrained on real robot rollouts for calibration. On five bimanual tasks with the PiPER robot arm, CoFreeVLA reduces selfcollisions and improves success rates versus RDT and APEX.
- Abstract(参考訳): 視覚言語アクション(VLA)モデルは操作の指示を可能にするが、両腕の配置は、腕と掴まれた物体の間のモデル化された自己衝突のため安全ではない。
提案するCoFreeVLAは,プロセプション,視覚的埋め込み,計画行動から衝突確率を予測する,短地平線自己衝突リスク推定器を用いて,終端VLAを増強する。
この推定装置は危険な命令をゲートし、リスク誘導調整によって安全な状態に回復し、より安全なロールアウトのための政策改善を形作る。
モデルベースの衝突ラベルで事前訓練され、キャリブレーションのための実際のロボットロールアウトで後続訓練される。
PiPERロボットアームの5つのバイマニュアルタスクにおいて、CoFreeVLAは自己照合を減らし、RTTやAPEXと比較して成功率を向上させる。
関連論文リスト
- Steering Externalities: Benign Activation Steering Unintentionally Increases Jailbreak Risk for Large Language Models [62.16655896700062]
活性化ステアリングは大規模言語モデル(LLM)の有用性を高める技術である
重要かつ過度に調査された安全リスクを無意識に導入することを示します。
実験によると、これらの介入は強制乗算器として機能し、ジェイルブレイクに新たな脆弱性を発生させ、標準ベンチマークで攻撃成功率を80%以上向上させる。
論文 参考訳(メタデータ) (2026-02-03T12:32:35Z) - AttackVLA: Benchmarking Adversarial and Backdoor Attacks on Vision-Language-Action Models [60.39655329875822]
VLA(Vision-Language-Action)モデルは、ロボットが自然言語の命令を解釈し、多様なタスクを実行することを可能にするモデルである。
このようなモデルを攻撃することへの関心は高まっているが、既存の手法の有効性は依然として不明である。
我々はVLA開発ライフサイクルに合わせて統合されたフレームワークであるAttackVLAを提案する。
論文 参考訳(メタデータ) (2025-11-15T10:30:46Z) - Controllable Collision Scenario Generation via Collision Pattern Prediction [22.736678908526653]
制御可能な衝突シナリオ生成を導入し、ユーザが特定した衝突タイプとTTA(Time-to-accident)を実現するトラジェクトリを作成する。
本研究では,衝突パターンを予測するフレームワークを提案する。衝突パターンは,衝突時のエゴと敵車両の空間的構成を捉える,コンパクトで解釈可能な表現である。
実験により, 衝突速度と制御性の両方において, 本手法が強いベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2025-10-14T06:56:33Z) - TabVLA: Targeted Backdoor Attacks on Vision-Language-Action Models [63.51290426425441]
バックドア付きVLAエージェントは、プレインジェクトされたバックドアによって隠蔽的にトリガーされ、敵のアクションを実行することができる。
我々は,VLAモデルに対するターゲットバックドア攻撃について検討し,ブラックボックスファインチューニングによる攻撃を可能にする新しいフレームワークであるTabVLAを紹介した。
我々の研究は、バックドア操作をターゲットにしたVLAモデルの脆弱性を強調し、より高度な防御の必要性を強調します。
論文 参考訳(メタデータ) (2025-10-13T02:45:48Z) - FreezeVLA: Action-Freezing Attacks against Vision-Language-Action Models [124.02734355214325]
Vision-Language-Action(VLA)モデルはロボティクスの急速な進歩を加速している。
敵画像はVLAモデルを「凍結」し、その後の命令を無視する。
FreezeVLAは、min-maxバイレベル最適化を通じて、アクション凍結攻撃を生成し、評価する。
論文 参考訳(メタデータ) (2025-09-24T08:15:28Z) - Steering Away from Harm: An Adaptive Approach to Defending Vision Language Model Against Jailbreaks [16.508109544083496]
視覚言語モデル(VLM)は、敵の攻撃にさらされると意図しない有害なコンテンツを生成できる。
既存の防御(例えば、入力前処理、敵の訓練、応答評価に基づく手法)は、実世界の展開には実用的ではないことが多い。
本稿では,VLM攻撃に対する対向的特徴方向からモデルを誘導し,効果的かつ効果的な防御法であるASTRAを提案する。
論文 参考訳(メタデータ) (2024-11-23T02:17:17Z) - Physical Backdoor Attack can Jeopardize Driving with Vision-Large-Language Models [53.701148276912406]
Vision-Large-Language-models (VLMs) は自動運転において大きな応用可能性を持っている。
BadVLMDriverは、物理的オブジェクトを使用して実際に起動できる自動運転のためのVLMに対する最初のバックドア攻撃である。
BadVLMDriverは、赤い風船を持った歩行者に突如、加速を誘導する攻撃の成功率を92%達成する。
論文 参考訳(メタデータ) (2024-04-19T14:40:38Z) - Learning Risk-Aware Quadrupedal Locomotion using Distributional Reinforcement Learning [12.156082576280955]
危険環境への展開には、ロボットが事故を防ぐための行動や動きに関連するリスクを理解する必要がある。
本稿では,分散強化学習を用いたリスクセンシティブな移動訓練手法を提案する。
シミュレーションおよび四足歩行ロボットANYmalにおいて,突発的リスクに敏感な移動行動を示す。
論文 参考訳(メタデータ) (2023-09-25T16:05:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。