論文の概要: FAWAM: Force-Aware World Action Models for Closed-Loop Contact-Rich Manipulation
- arxiv url: http://arxiv.org/abs/2606.08555v2
- Date: Fri, 12 Jun 2026 03:16:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 13:53:03.484201
- Title: FAWAM: Force-Aware World Action Models for Closed-Loop Contact-Rich Manipulation
- Title(参考訳): FAWAM:クローズドループコンタクトリッチマニピュレーションのための力覚世界行動モデル
- Authors: Haotian He, Zeyu Yan, Qipeng Liu, Ning Guo, Wenzhao Lian,
- Abstract要約: 本稿では,力覚的世界行動モデルであるFAWAMを提案する。
実世界の実験では、FAWAMは視覚のみのベースラインより36.25%、既存のフォース対応ベースラインより21.25%向上している。
- 参考スコア(独自算出の注目度): 15.60337615237323
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Force signals provide critical interaction cues for contact-rich robotic manipulation. However, existing methods mostly use force as an additional observation modality, without fully exploiting its role in modeling future interaction dynamics or guiding execution-time feedback correction. In this paper, we propose FAWAM, a force-aware world action model that incorporates force information at three levels: perception, prediction, and closed-loop execution. FAWAM first encodes historical 6-axis force/torque signals to modulate action generation, then jointly predicts future actions and end-effector wrenches to explicitly model contact evolution. It further introduces a residual correction module that uses the predicted wrench trajectory as an execution-time reference to refine actions online based on real-time force feedback. Real-world experiments across multiple contact-rich tasks show that FAWAM improves the average success rate by 36.25% over vision-only baselines and 21.25% over existing force-aware baselines, demonstrating the effectiveness of our force-aware framework for robust contact-rich manipulation.
- Abstract(参考訳): 力信号は、接触に富んだロボット操作のための重要な相互作用手段を提供する。
しかし、既存の手法では、将来の相互作用のダイナミクスをモデル化したり、実行時フィードバックの修正を導くのに、その役割を完全に活用することなく、追加の観測モダリティとして力を使うことが多い。
本稿では,力覚的世界行動モデルであるFAWAMを提案する。
FAWAMは、まず6軸力/トルク信号を符号化してアクション生成を変調し、その後、将来のアクションを共同で予測し、エンドエフェクターレンチによって接触の進化を明示的にモデル化する。
さらに、予測されたレンチ軌道を、リアルタイムの力フィードバックに基づいてオンラインの精巧なアクションに対する実行時参照として使用する残差補正モジュールも導入している。
複数のコンタクトリッチタスクを対象とした実世界の実験では、FAWAMは視覚のみのベースラインよりも平均成功率を36.25%向上し、既存のフォース対応ベースラインより21.25%向上し、堅牢なコンタクトリッチ操作のための力覚フレームワークの有効性を実証している。
関連論文リスト
- ForceFlow: Learning to Feel and Act via Contact-Driven Flow Matching [53.30290192030814]
ForceFlowは、フローマッチングに基づいて構築された、フォース対応のリアクティブフレームワークである。
ForceFlowは、強力なベースラインであるForceVLAよりも37%の成功率の向上を実現している。
また、接触力の自己調節において、正確な力信号予測と優れた性能を示す。
論文 参考訳(メタデータ) (2026-05-11T13:27:00Z) - ForceVLA2: Unleashing Hybrid Force-Position Control with Force Awareness for Contact-Rich Manipulation [75.39847750457626]
エンドツーエンドの視覚言語アクションフレームワークであるForceVLA2は、ハイブリッドな力配置制御と明示的な力覚を備えたロボットを装備する。
学習と評価を支援するために,5つの接触豊富なタスクに1,000の軌道を含むForceVLA2-Datasetを構築した。
実験により、ForceVLA2は接触リッチな操作における成功率と信頼性を大幅に改善することが示された。
論文 参考訳(メタデータ) (2026-03-16T12:03:58Z) - ImplicitRDP: An End-to-End Visual-Force Diffusion Policy with Structural Slow-Fast Learning [52.86018040861575]
本稿では,単一のネットワークに視覚計画と反応力制御を統合した,一貫したエンドツーエンドの視覚力拡散政策を提案する。
本稿では,非同期な視覚と力のトークンを同時に処理するための因果的注意力を利用した構造的スローフォールストラーニングを紹介する。
コンタクトリッチタスクの実験では、ImplicitRDPは視覚のみのベースラインと階層的なベースラインの両方で著しく優れていた。
論文 参考訳(メタデータ) (2025-12-11T18:59:46Z) - ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation [62.58034332427291]
ForceVLAは、新しいエンドツーエンド操作フレームワークである。
外部力センシングは、VLAシステム内の第一級のモダリティとして扱う。
論文 参考訳(メタデータ) (2025-05-28T09:24:25Z) - ForceGrip: Reference-Free Curriculum Learning for Realistic Grip Force Control in VR Hand Manipulation [0.10995326465245926]
本稿では,現実的な手操作動作を合成する深層学習エージェントであるForceGripを紹介する。
我々は、指の位置決め、意図適応、動的安定化を含む3段階のカリキュラム学習フレームワークを採用する。
以上の結果から,ForceGripの出力制御性と信頼性は最先端の手法に比べて優れていた。
論文 参考訳(メタデータ) (2025-03-11T05:39:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。