論文の概要: Learning to Balance Motor Thermal Safety and Quadrupedal Locomotion Performance with Residual Policy
- arxiv url: http://arxiv.org/abs/2605.27046v1
- Date: Tue, 26 May 2026 14:00:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.206948
- Title: Learning to Balance Motor Thermal Safety and Quadrupedal Locomotion Performance with Residual Policy
- Title(参考訳): 残留政策を考慮したモータ熱安全と四足歩行性能のバランスの学習
- Authors: Yuhang Wan, Weixian Lin, Letian Qian, Yiqi Zou, Weiwei Wu, Shengwei Wu, Chuanlin Zhao, Xin Luo,
- Abstract要約: 本稿では,四足歩行ロボットの全身熱モデルを強化学習パイプラインに統合し,運動温度を更新する。
残留ポリシーは、ロボットの熱状態に基づいて補正アクションを提供するための名目上のポリシーに基づいて訓練される。
シミュレーションの結果, 提案手法は, モータの熱安全性と移動性能のバランスを効果的に向上することを示した。
- 参考スコア(独自算出の注目度): 10.18073760686127
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motor thermal management is often overlooked in the context of electrically-actuated robots, particularly legged robots, but motor overheating is a key factor that limits long-duration locomotion especially under payload conditions. This paper integrates a whole-body thermal model of a quadruped robot into the reinforcement learning pipeline to update motor temperatures, and proposes a two-stage training framework for motor thermal management. In this framework, a nominal policy is first pre-trained as a locomotion baseline capable of traversing diverse terrains. A residual policy is then trained on top of the nominal policy to provide corrective actions based on the robot's thermal state, ensuring high performance under low-temperature conditions and preventing motor overheating under high-temperature conditions. Simulation results demonstrate that the proposed policy achieves an effective balance between motor thermal safety and locomotion performance. Real-world experiments on a Unitree A1 quadruped robot further validate the approach: under a 3 kg payload, the robot achieves stable locomotion across multiple terrains for over 13 minutes, while the nominal policy alone leads to motor overheating in about 5 minutes.
- Abstract(参考訳): モーター熱管理は、電気的に作動するロボット、特に脚のついたロボットの文脈で見過ごされることが多いが、特にペイロード条件下での長時間の移動を制限する重要な要因はモーター過熱である。
本稿では,四足歩行ロボットの全身熱モデルを強化学習パイプラインに統合して運動温度を更新し,運動熱管理のための2段階のトレーニングフレームワークを提案する。
この枠組みでは、名目上の政策は、まず様々な地形を横断できる移動ベースラインとして事前訓練される。
残留ポリシーは、ロボットの熱状態に基づいて補正アクションを提供するための名目上のポリシーに基づいて訓練され、低温条件下での高性能を確保し、高温条件下でのモータ過熱を防止する。
シミュレーションの結果, 提案手法は, モータの熱安全性と移動性能のバランスを効果的に向上することを示した。
3kgのペイロードの下で、ロボットは複数の地形を13分以上移動し、名目上はモーターオーバーヒートを約5分で行う。
関連論文リスト
- Learning Thermal-Aware Locomotion Policies for an Electrically-Actuated Quadruped Robot [8.393707423105182]
本研究は、運動温度を強化学習ロコモーションポリシーに組み込む熱認識制御法を提案する。
ユニツリーA1の実際の実験では、固定された3kgのペイロードの下で、ベースラインポリシーがオーバーヒート保護をトリガーし、約7分以内に停止することを示した。
提案手法は,命令追跡性能を同等に保ちながら,熱的中断なく27分以上連続的に動作可能である。
論文 参考訳(メタデータ) (2026-03-02T09:06:59Z) - SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。
大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。
本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文 参考訳(メタデータ) (2025-10-20T19:53:02Z) - Deep Generative and Discriminative Digital Twin endowed with Variational Autoencoder for Unsupervised Predictive Thermal Condition Monitoring of Physical Robots in Industry 6.0 and Society 6.0 [0.0]
生成AIを備えたデジタル双生児は、熱的異常を管理し、非クリティカルなロボット状態を生成するために利用される。
ロボットは、このスコアを使用して、産業用6.0および社会用6.0の新興アプリケーションからの要求を満たすために、所望の運動プロファイルの熱的可能性の予測、予測、共有を行うことができる。
論文 参考訳(メタデータ) (2025-09-16T06:52:59Z) - Deep Learning for Model-Free Prediction of Thermal States of Robot Joint Motors [0.0]
本研究では,ロボットマニピュレータのジョイントモータの熱的挙動を予測するために,ディープニューラルネットワークを訓練する。
この目的のために、センサ付きジョイントトルクを収集処理し、ジョイントモータの熱的挙動を予測する。
論文 参考訳(メタデータ) (2025-09-16T06:52:30Z) - Temperature Estimation in Induction Motors using Machine Learning [0.0]
モーターの内部温度をモニターし、しきい値以下に保つことは、重要な第一歩だ。
現代の電気駆動装置がシステム動作中に収集するすべてのデータから、熱的挙動を推定するためにデータ駆動型アプローチを適用することが可能である。
本稿では,誘導電動機におけるステータ巻線と軸受の温度を近似する複数の機械学習手法について検討した。
論文 参考訳(メタデータ) (2025-04-25T06:22:31Z) - Powerful ordered collective heat engines [58.720142291102135]
本稿では,同期動作を行うユニットのシステムによって性能が向上するエンジンのクラスを紹介する。
熱機関として運用するには,Isingライクな相互作用と集合秩序体制との相互作用が不可欠であることを示す。
論文 参考訳(メタデータ) (2023-01-16T20:14:19Z) - VAE-Loco: Versatile Quadruped Locomotion by Learning a Disentangled Gait
Representation [78.92147339883137]
本研究では,特定の歩行を構成する主要姿勢位相を捕捉する潜在空間を学習することにより,制御器のロバスト性を高めることが重要であることを示す。
本研究では,ドライブ信号マップの特定の特性が,歩幅,歩幅,立位などの歩行パラメータに直接関係していることを示す。
生成モデルを使用することで、障害の検出と緩和が容易になり、汎用的で堅牢な計画フレームワークを提供する。
論文 参考訳(メタデータ) (2022-05-02T19:49:53Z) - Minimizing Energy Consumption Leads to the Emergence of Gaits in Legged
Robots [71.61319876928009]
実四足歩行ロボットにおいて,エネルギー消費を最小化するための学習が自然移動歩行の出現に重要な役割を担っていることを示す。
創発的な足跡は理想的な地形で構築されており、馬や羊のものと似ている。
同じアプローチは、動物運動制御の発見と一致した荒地における非構造的な歩行につながる。
論文 参考訳(メタデータ) (2021-10-25T17:59:58Z) - Conv1D Energy-Aware Path Planner for Mobile Robots in Unstructured
Environments [9.230959086746736]
エネルギー消費は、困難な環境における移動ロボットのナビゲーションにおいて重要な役割を果たします。
本稿では,複雑な地形を横断するロボットの走行エネルギー消費量とエネルギー回収量を推定できるエネルギー認識経路プランナーの最初の結果について報告する。
この手法の新たな特徴は、1次元畳み込みニューラルネットワークを用いて、移動中にロボットが経験するのと同じ時間順に地形をシーケンシャルに解析することである。
論文 参考訳(メタデータ) (2021-04-04T08:13:54Z) - Maximal power for heat engines: role of asymmetric interaction times [110.83289076967895]
本稿では、エンジン性能を最適化するために、相互作用時間非対称性を調整するという考え方を紹介する。
個別最適化プロトコルは熱力学の枠組みで解析される。
論文 参考訳(メタデータ) (2020-12-16T22:26:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。