論文の概要: Force Generative Imitation Learning: Bridging Position Trajectory and Force Commands through Control Technique
- arxiv url: http://arxiv.org/abs/2602.06620v1
- Date: Fri, 06 Feb 2026 11:25:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.231938
- Title: Force Generative Imitation Learning: Bridging Position Trajectory and Force Commands through Control Technique
- Title(参考訳): 力生成模倣学習:制御手法によるブリッジ位置軌跡と力指令
- Authors: Hiroshi Sato, Sho Sakaino, Toshiaki Tsuji,
- Abstract要約: 本研究では,所定の位置軌跡から力の指令を推定する力生成モデルを提案する。
目に見えない位置の軌跡を扱う場合、モデルは正確な力の指令を生成するのに苦労する。
このアプローチは、目に見えない位置軌跡であっても、システムがフォースコマンドを効果的に生成することを可能にする。
- 参考スコア(独自算出の注目度): 7.742860621303155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In contact-rich tasks, while position trajectories are often easy to obtain, appropriate force commands are typically unknown. Although it is conceivable to generate force commands using a pretrained foundation model such as Vision-Language-Action (VLA) models, force control is highly dependent on the specific hardware of the robot, which makes the application of such models challenging. To bridge this gap, we propose a force generative model that estimates force commands from given position trajectories. However, when dealing with unseen position trajectories, the model struggles to generate accurate force commands. To address this, we introduce a feedback control mechanism. Our experiments reveal that feedback control does not converge when the force generative model has memory. We therefore adopt a model without memory, enabling stable feedback control. This approach allows the system to generate force commands effectively, even for unseen position trajectories, improving generalization for real-world robot writing tasks.
- Abstract(参考訳): 接点の多いタスクでは、位置軌跡は容易に取得できるが、適切な力のコマンドは通常不明である。
VLA(Vision-Language-Action)モデルのような事前訓練された基礎モデルを用いて力コマンドを生成することができるが、力制御はロボットの特定のハードウェアに依存するため、そのようなモデルの適用は困難である。
このギャップを埋めるために、所定の位置軌跡から力の指令を推定する力の生成モデルを提案する。
しかし、見知らぬ位置軌跡を扱う場合、モデルは正確な力の指令を生成するのに苦労する。
そこで我々はフィードバック制御機構を導入する。
実験の結果, 出力生成モデルにメモリがある場合, フィードバック制御は収束しないことがわかった。
したがって、メモリのないモデルを採用し、安定したフィードバック制御を可能にします。
このアプローチにより,見当たらない位置軌跡であっても,力のコマンドを効果的に生成することができ,実世界のロボット記述タスクの一般化が向上する。
関連論文リスト
- Direction Matters: Learning Force Direction Enables Sim-to-Real Contact-Rich Manipulation [28.707088673008172]
本稿では,専門家が設計したコントローラロジックを転送に利用するフレームワークを提案する。
タスクにおける特権的監督の成功に触発されて、シミュレーションには人間によって設計された有限状態マシンベースの位置/力制御を用いる。
シミュレーションの不正確さに非常に敏感な力の大きさとは異なり、力の方向はハイレベルなタスク形状を符号化し、シム・トゥ・リアルギャップをまたいで頑健なままである。
論文 参考訳(メタデータ) (2026-02-15T14:57:13Z) - Learning Force-Regulated Manipulation with a Low-Cost Tactile-Force-Controlled Gripper [18.40849472506029]
TF-グリッパー(TF-Gripper)は、触覚をフィードバックとして統合する低コストのパラレルジャウグリップである。
RETAFは、アームポーズ予測から握力制御を分離するフレームワークである。
TF-Gripper と RETAF は,実世界の5つのタスクにおいて,正確な力規制を必要とする。
論文 参考訳(メタデータ) (2026-02-10T17:36:33Z) - Feel the Force: Contact-Driven Learning from Humans [52.36160086934298]
操作中のきめ細かい力の制御は、ロボット工学における中核的な課題である。
We present FeelTheForce, a robot learning system that model human tactile behavior to learn force-sensitive control。
提案手法は,5つの力覚的操作タスクで77%の成功率を達成した,スケーラブルな人間の監督において,堅牢な低レベル力制御を実現する。
論文 参考訳(メタデータ) (2025-06-02T17:57:52Z) - ForceVLA: Enhancing VLA Models with a Force-aware MoE for Contact-rich Manipulation [62.58034332427291]
ForceVLAは、新しいエンドツーエンド操作フレームワークである。
外部力センシングは、VLAシステム内の第一級のモダリティとして扱う。
論文 参考訳(メタデータ) (2025-05-28T09:24:25Z) - FACET: Force-Adaptive Control via Impedance Reference Tracking for Legged Robots [23.645867340878574]
インピーダンス参照追跡(FACET)を用いたemphForce-Adaptive Controlを提案する。
インピーダンス制御にインスパイアされた我々は、RLを使って制御ポリシーを訓練し、仮想的な質量ばね減衰系を模倣する。
シミュレーションでは、我々の四足歩行ロボットが大きな衝動に対して堅牢性を向上し、制御可能なコンプライアンスを示すことを示す。
論文 参考訳(メタデータ) (2025-05-11T07:23:26Z) - Towards Transferring Tactile-based Continuous Force Control Policies
from Simulation to Robot [19.789369416528604]
グリップフォースコントロールは、物体に作用する力の量を制限することによって、物体を安全に操作することを目的としている。
以前の作品では、手動制御器、モデルベースのアプローチ、あるいはsim-to-realトランスファーを示さなかった。
シミュレーションで訓練されたモデルなしの深層強化学習手法を提案し,さらに微調整を行わずにロボットに移行した。
論文 参考訳(メタデータ) (2023-11-13T11:29:06Z) - Reinforcement Learning for Robust Parameterized Locomotion Control of
Bipedal Robots [121.42930679076574]
シミュレーションにおけるロコモーションポリシをトレーニングするためのモデルフリー強化学習フレームワークを提案する。
ドメインランダム化は、システムダイナミクスのバリエーションにまたがる堅牢な振る舞いを学ぶためのポリシーを奨励するために使用されます。
本研究では、目標歩行速度、歩行高さ、旋回ヨーなどの多目的歩行行動について示す。
論文 参考訳(メタデータ) (2021-03-26T07:14:01Z) - Posterior Control of Blackbox Generation [126.33511630879713]
我々は、構造化潜在変数アプローチにより学習した離散制御状態を持つニューラルジェネレーションモデルの拡張を検討する。
この手法は標準ベンチマークよりも改善され、きめ細かい制御も可能である。
論文 参考訳(メタデータ) (2020-05-10T03:22:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。