論文の概要: Bridging the sim2real gap in the table tennis robot with a transformer-based ball states predictor
- arxiv url: http://arxiv.org/abs/2606.11464v1
- Date: Tue, 09 Jun 2026 21:35:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 14:55:26.689094
- Title: Bridging the sim2real gap in the table tennis robot with a transformer-based ball states predictor
- Title(参考訳): 変圧器を用いた球状態予測器を用いた卓球ロボットにおけるsim2realギャップのブリッジ
- Authors: Yin Bi, Christian Conti, Bilan Yang, Alexander Sigrist, Peter Dürr, Naoya Takahashi,
- Abstract要約: ロボットテーブルテニスは、動的環境における高速でクローズドループなロボット制御のための代表的なベンチマークである。
本稿では,テーブル球状態予測のための変圧器ベースのフレームワークを提案する。
様々なスキルレベルと多様なボールキャノン構成の選手から、大規模な実世界のデータセットを収集します。
- 参考スコア(独自算出の注目度): 42.252953556229066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic table tennis is a representative benchmark for high-speed, closed-loop robotic control in dynamic environments, where accurate and fast prediction of ball states is critical for reliable planning and control. Physics-based approaches rely heavily on accurate parameter identification and precise initial state, while learning-based methods often struggle to capture long-range temporal dependencies and are typically trained on limited or simulated data. We propose a transformer-based framework for table tennis ball state prediction that leverages attention mechanisms to model long-range temporal correlations directly from historical observations, without relying on explicit flight or bounce models. To support robust learning and generalization, we collected a large-scale real-world dataset from players of varying skill levels and diverse ball cannon configurations. The combination of a high-capacity transformer architecture and extensive real-world data enables accurate long-horizon forecasting. Building on this capability, we introduce a plug-and-play sim-to-real transfer strategy, Swap Predictor at Deployment (SPAD), which replaces the physics-based simulator used during training with the proposed real-world-trained predictor at deployment, improving the sim-to-real transferability of the policy without requiring retraining. We demonstrate that this simple substitution effectively narrows the sim-to-real gap while preserving the efficiency and scalability of simulation-based training.
- Abstract(参考訳): ロボットテーブルテニスは、動的環境における高速でクローズドループなロボット制御のための代表的ベンチマークであり、ボール状態の正確かつ迅速な予測は、信頼性の高い計画と制御にとって重要である。
物理に基づくアプローチは正確なパラメータ識別と正確な初期状態に大きく依存するが、学習に基づく手法は、しばしば長距離の時間的依存を捉えるのに苦労し、典型的には制限されたデータやシミュレートされたデータに基づいて訓練される。
本研究では, 卓球状態予測のためのトランスフォーマーベースのフレームワークを提案する。これは, 目立った飛行やバウンスモデルに頼ることなく, 歴史的観測から直接, 長距離時間相関をモデル化するための注意機構を利用する。
頑健な学習と一般化を支援するため,さまざまなスキルレベルと多種多様な球砲構成を持つ選手から,大規模な実世界のデータセットを収集した。
高容量トランスアーキテクチャと広範な実世界のデータを組み合わせることで、正確な長距離予測が可能になる。
この能力に基づいて,本システムでは,トレーニング時に使用する物理ベースのシミュレータを実世界の予測器に置き換える,プラグ・アンド・プレイ・シミュレート・トランスファー戦略であるSwap Predictor at Deployment (SPAD)を導入し,リトレーニングを必要とせず,シミュレート・トゥ・リアルなトランスファー性の向上を図る。
この単純な置換はシミュレーションベーストレーニングの効率性とスケーラビリティを保ちながら、sim-to-realギャップを効果的に狭めることを実証する。
関連論文リスト
- Simulation Distillation: Pretraining World Models in Simulation for Rapid Real-World Adaptation [46.80452332618188]
シミュレーション蒸留(SimDist)は、シミュレータから潜在世界モデルに構造的事前を蒸留するフレームワークである。
報酬モデルと価値モデルをシミュレーションから直接転送することで、SimDistは生の知覚から密集した計画信号を提供する。
SimDistは、データ効率、安定性、最終的なパフォーマンスにおいて、従来の方法よりも大幅に優れています。
論文 参考訳(メタデータ) (2026-03-16T18:00:23Z) - Contact-Aware Neural Dynamics [42.83872574010789]
本研究では,シミュレータのダイナミクスと接触情報との整合性を学習する暗黙のsim-to-realフレームワークを提案する。
本研究では,ロボットハンドの触覚接触情報を用いることで,接触に富む作業に係わる非滑らかな不連続性を効果的にモデル化できることを示す。
論文 参考訳(メタデータ) (2026-01-19T07:56:13Z) - Data-Driven Dynamic Parameter Learning of manipulator robots [0.8679862302950613]
動的パラメータ推定のためのトランスフォーマーに基づく手法を提案する。
データセットは、8,192個のロボットで構成され、慣性および摩擦特性は様々である。
我々のモデルは時間的および空間的依存の両方を効果的に捉えている。
論文 参考訳(メタデータ) (2025-12-09T16:15:58Z) - Learning Contact Dynamics for Control with Action-conditioned Face Interaction Graph Networks [4.942750934906048]
本稿では,ロボットエンドエフェクタの高精度な動作と力トルク予測を,接触リッチな操作で実現する物理シミュレータを提案する。
提案モデルは,最新のGNNベースシミュレータを,新しいノードとエッジタイプで拡張する。
論文 参考訳(メタデータ) (2025-09-15T17:15:31Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Bridging the Sim-to-Real Gap with Bayesian Inference [53.61496586090384]
データからロボットダイナミクスを学習するためのSIM-FSVGDを提案する。
我々は、ニューラルネットワークモデルのトレーニングを規則化するために、低忠実度物理プリエンスを使用します。
高性能RCレースカーシステムにおけるSIM-to-realギャップのブリッジ化におけるSIM-FSVGDの有効性を実証する。
論文 参考訳(メタデータ) (2024-03-25T11:29:32Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。