論文の概要: roto 2.0: The Robot Tactile Olympiad
- arxiv url: http://arxiv.org/abs/2605.21429v1
- Date: Wed, 20 May 2026 17:22:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.809525
- Title: roto 2.0: The Robot Tactile Olympiad
- Title(参考訳): Roto 2.0:ロボット触覚オリンピアド
- Authors: Elle Miller, Jayaram Reddy, Ayush Deshmukh, Trevor McInroe, David Abel, Oisin Mac Aodha, Sethu Vijayakumar,
- Abstract要約: 触覚ベースのRLを標準化するためのGPU並列化ベンチマークであるRobot Tactile Olympiad(texttroto 2.0)のv2を紹介する。
盲目のエージェントは10秒で13個のボーディングボール回転を達成し、現在の最先端の速度よりも桁違いに速い性能の跳躍を実演しています。
- 参考スコア(独自算出の注目度): 29.999005615635458
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tactile-based reinforcement learning (RL) is currently hindered by fragmented research and a focus on over-saturated orientation tasks. We introduce v2 of the Robot Tactile Olympiad (\texttt{roto 2.0}), a GPU-parallelised benchmark designed to standardise tactile-based RL across four distinct robotic morphologies (16-DOF to 24-DOF). Unlike prior benchmarks, roto focuses on end-to-end "blind" manipulation, utilising only proprioception and tactile sensing without state information or distillation. We demonstrate a significant performance leap, with our blind agents achieving 13 Baoding ball rotations in 10 seconds, an order of magnitude faster than current state-of-the-art speeds. By open-sourcing our environments and robustly tuned baselines, we reduce the barrier to entry and enable researchers to prioritise fundamental algorithmic challenges over tedious RL tuning. Website: https://elle-miller.github.io/roto/
- Abstract(参考訳): 触覚に基づく強化学習(RL)は,現在,断片化研究と過飽和配向タスクに焦点を当てている。
触覚に基づくRLを4つの異なるロボット形態(16-DOFから24-DOF)で標準化するGPU並列化ベンチマークであるRobot Tactile Olympiad(\texttt{roto 2.0})のv2を紹介する。
以前のベンチマークとは異なり、rotoは、状態情報や蒸留を使わずに、プロプレセプションと触覚のみを活用する、エンドツーエンドの"盲目"操作に重点を置いている。
目隠しエージェントは10秒で13個のバオディングボールを回転させ、現在の最先端の速度よりも桁違いに高速に動作します。
環境をオープンソース化し、ベースラインをしっかり調整することで、参入の障壁を減らし、研究者が退屈なRLチューニングよりも基本的なアルゴリズム上の課題を優先できるようにします。
ウェブサイト:https://elle-miller.github.io/roto/
関連論文リスト
- Enhancing Tactile-based Reinforcement Learning for Robotic Control [32.565866574593635]
我々は,触覚観察をより効果的に活用するために,自己教師付き学習法(SSL)を開発した。
疎二元触覚信号がデキスタリティに重要であることを実証的に実証した。
我々は,ロボット触覚オリンピアド(RoTO)ベンチマークを公開し,触覚に基づく操作に関する今後の研究を標準化し,促進する。
論文 参考訳(メタデータ) (2025-10-24T16:15:05Z) - Assistax: A Hardware-Accelerated Reinforcement Learning Benchmark for Assistive Robotics [18.70896736010314]
ゲームは、関連する課題を提示し、実行しやすく、理解しやすいため、強化学習ベンチマークを支配しています。
Assistaxは、支援ロボットタスクに起因する課題に対処するために設計されたオープンソースのベンチマークである。
オープンループのウォールタイムに関しては、AsistaxはCPUベースの代替よりもベクタライジングトレーニングの実行が速い場合、最大370タイムで動作します。
論文 参考訳(メタデータ) (2025-07-29T09:49:11Z) - FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control [49.08235196039602]
FastTD3は強化学習(RL)アルゴリズムで、1つのA100 GPU上で3時間以内のHumanoidBenchタスクを解く。
我々はまた、ロボット工学におけるRL研究を加速するために、FastTD3の軽量で使いやすい実装を提供する。
論文 参考訳(メタデータ) (2025-05-28T17:55:26Z) - Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot [7.516046071926082]
シミュレーションロボットと現実ロボットのギャップを軽減するための新しい枠組みを提案する。
本フレームワークはパラメータ選択のための構造化ガイドラインとシミュレーションにおける動的ランダム化の範囲を提供する。
結果は、我々の知る限り、実四足歩行ロボットにおいて、RLベースの制御ポリシーによって実証された最も高く、最も長いジャンプの1つです。
論文 参考訳(メタデータ) (2024-04-23T14:52:09Z) - Braille Letter Reading: A Benchmark for Spatio-Temporal Pattern
Recognition on Neuromorphic Hardware [50.380319968947035]
近年の深層学習手法は,そのようなタスクにおいて精度が向上しているが,従来の組込みソリューションへの実装は依然として計算量が非常に高く,エネルギーコストも高い。
文字読み込みによるエッジにおける触覚パターン認識のための新しいベンチマークを提案する。
フィードフォワードとリカレントスパイキングニューラルネットワーク(SNN)を、サロゲート勾配の時間によるバックプロパゲーションを用いてオフラインでトレーニングし比較し、効率的な推論のためにIntel Loihimorphicチップにデプロイした。
LSTMは14%の精度で繰り返しSNNより優れており、Loihi上での繰り返しSNNは237倍のエネルギーである。
論文 参考訳(メタデータ) (2022-05-30T14:30:45Z) - Anti-Oversmoothing in Deep Vision Transformers via the Fourier Domain
Analysis: From Theory to Practice [111.47461527901318]
Vision Transformer (ViT) は先日,コンピュータビジョン問題における有望性を実証した。
ViTは観察された注意崩壊やパッチの均一性のために、深さが増加するにつれて急速に飽和する。
所望の低域制限を緩和する2つの手法を提案する。
論文 参考訳(メタデータ) (2022-03-09T23:55:24Z) - Accelerating Robotic Reinforcement Learning via Parameterized Action
Primitives [92.0321404272942]
強化学習は汎用ロボットシステムの構築に使用することができる。
しかし、ロボット工学の課題を解決するためにRLエージェントを訓練することは依然として困難である。
本研究では,ロボット行動プリミティブ(RAPS)のライブラリを手動で指定し,RLポリシーで学習した引数をパラメータ化する。
動作インターフェースへの簡単な変更は、学習効率とタスクパフォーマンスの両方を大幅に改善する。
論文 参考訳(メタデータ) (2021-10-28T17:59:30Z) - Vision-Guided Quadrupedal Locomotion in the Wild with Multi-Modal Delay
Randomization [9.014518402531875]
我々は、予め定義されたコントローラや参照動作を使わずに、物理シミュレータにおけるエンドツーエンド制御のためのRLポリシーを訓練する。
ロボットが高速でスムーズに動き、障害物を回避し、ベースラインよりも大幅に改善できることを実証する。
論文 参考訳(メタデータ) (2021-09-29T16:48:05Z) - Smooth Exploration for Robotic Reinforcement Learning [11.215352918313577]
強化学習(Reinforcement Learning, RL)は、ロボットが現実世界との対話からスキルを学ぶことを可能にする。
実際には、Deep RLで使用される非構造的なステップベースの探索は、実際のロボットにジャーキーな動きパターンをもたらす。
本稿では、状態依存探索(SDE)を現在のDeep RLアルゴリズムに適応させることにより、これらの問題に対処する。
論文 参考訳(メタデータ) (2020-05-12T12:28:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。