論文の概要: TARC: Time-Adaptive Robotic Control
- arxiv url: http://arxiv.org/abs/2510.23176v1
- Date: Mon, 27 Oct 2025 10:10:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 17:41:22.012742
- Title: TARC: Time-Adaptive Robotic Control
- Title(参考訳): TARC: 時間適応型ロボット制御
- Authors: Arnav Sukhija, Lenart Treven, Jin Cheng, Florian Dörfler, Stelian Coros, Andreas Krause,
- Abstract要約: ロボット工学における固定周波数制御は、低周波数制御の効率と高周波制御の堅牢性との間のトレードオフを課す。
我々は、ポリシーが制御行動とその適用期間を共同で選択する強化学習アプローチでこの問題に対処する。
2つの異なるハードウェアプラットフォーム上でのゼロショットsim-to-real実験により本手法の有効性を検証した。
- 参考スコア(独自算出の注目度): 48.61871569444481
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fixed-frequency control in robotics imposes a trade-off between the efficiency of low-frequency control and the robustness of high-frequency control, a limitation not seen in adaptable biological systems. We address this with a reinforcement learning approach in which policies jointly select control actions and their application durations, enabling robots to autonomously modulate their control frequency in response to situational demands. We validate our method with zero-shot sim-to-real experiments on two distinct hardware platforms: a high-speed RC car and a quadrupedal robot. Our method matches or outperforms fixed-frequency baselines in terms of rewards while significantly reducing the control frequency and exhibiting adaptive frequency control under real-world conditions.
- Abstract(参考訳): ロボット工学における固定周波数制御は、低周波制御の効率性と高周波制御の堅牢性との間のトレードオフを課している。
本研究では、ロボットが状況に応じて制御周波数を自律的に調整できるように、ポリシーが協調して制御動作とその適用期間を選択できる強化学習手法を用いてこの問題に対処する。
高速RCカーと四足歩行ロボットの2つの異なるハードウェアプラットフォーム上でのゼロショットシミュレート実験により,本手法の有効性を検証した。
提案手法は,実世界の条件下での制御周波数を著しく低減し,適応周波数制御を行うとともに,報酬の観点から固定周波数ベースラインの整合性や性能を向上する。
関連論文リスト
- RT-HCP: Dealing with Inference Delays and Sample Efficiency to Learn Directly on Robotic Platforms [16.18687520299694]
ロボット上でコントローラを直接学習するには、極端なサンプル効率が必要である。
本稿では,RT-HCPを提案する。RT-HCPは,性能,サンプル効率,推論時間に優れたトレードオフを提供するアルゴリズムである。
我々はRT-HCPの優位性を実験で検証し、簡単なが高周波な振り子プラットフォーム上で直接コントローラを学習する実験を行った。
論文 参考訳(メタデータ) (2025-09-08T14:09:33Z) - Real Time Control of Tandem-Wing Experimental Platform Using Concerto Reinforcement Learning [0.0]
本稿では,DDTWEP(Direct-Drive Tandem-Wing Experimental Platform)のリアルタイム制御性能向上を目的とした改良強化学習法であるCRL2RTアルゴリズムを提案する。
その結果,CRL2RTは標準CPUで2500Hzを超える制御周波数を実現することがわかった。
論文 参考訳(メタデータ) (2025-02-08T03:46:40Z) - Deployable Reinforcement Learning with Variable Control Rate [14.838483990647697]
可変制御率を持つ強化学習(RL)の変種を提案する。
このアプローチでは、ポリシーは、エージェントが取るべきアクションと、そのアクションに関連する時間ステップの期間を決定する。
ニュートンキネマティクスを用いたエージェントを駆動する概念実証シミュレーションによりSEACの有効性を示す。
論文 参考訳(メタデータ) (2024-01-17T15:40:11Z) - Tuning Legged Locomotion Controllers via Safe Bayesian Optimization [47.87675010450171]
本稿では,ロボットハードウェアプラットフォームにおけるモデルベースコントローラの展開を効率化するための,データ駆動型戦略を提案する。
モデルフリーな安全な学習アルゴリズムを用いて制御ゲインのチューニングを自動化し、制御定式化で使用される単純化されたモデルと実システムとのミスマッチに対処する。
論文 参考訳(メタデータ) (2023-06-12T13:10:14Z) - Adaptive PD Control using Deep Reinforcement Learning for Local-Remote
Teleoperation with Stochastic Time Delays [5.977871949434069]
ローカルリモートシステムは、ロボットが危険な環境で複雑なタスクを実行できる。
時間遅延はシステムのパフォーマンスと安定性を損なう可能性がある。
本稿では,時間遅れ制御問題に対処するため,強化学習を用いた適応制御手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T14:34:45Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Guided Constrained Policy Optimization for Dynamic Quadrupedal Robot
Locomotion [78.46388769788405]
我々は,制約付きポリシー最適化(CPPO)の実装に基づくRLフレームワークであるGCPOを紹介する。
誘導制約付きRLは所望の最適値に近い高速収束を実現し,正確な報酬関数チューニングを必要とせず,最適かつ物理的に実現可能なロボット制御動作を実現することを示す。
論文 参考訳(メタデータ) (2020-02-22T10:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。