論文の概要: ECO: Energy-Constrained Optimization with Reinforcement Learning for Humanoid Walking
- arxiv url: http://arxiv.org/abs/2602.06445v1
- Date: Fri, 06 Feb 2026 07:14:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.224864
- Title: ECO: Energy-Constrained Optimization with Reinforcement Learning for Humanoid Walking
- Title(参考訳): ECO:人型歩行のための強化学習によるエネルギー制約最適化
- Authors: Weidong Huang, Jingwen Zhang, Jiongye Li, Shibowen Zhang, Jiayang Wu, Jiayi Wang, Hangxin Liu, Yaodong Yang, Yao Su,
- Abstract要約: ECO(Energy-Constrained Optimization)は、エネルギー関連メトリクスを報酬から分離する制約付きRLフレームワークである。
その結果,エコは歩行性能を維持しながら,ベースラインに比べてエネルギー消費を著しく減少させることがわかった。
- 参考スコア(独自算出の注目度): 18.843782019570735
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Achieving stable and energy-efficient locomotion is essential for humanoid robots to operate continuously in real-world applications. Existing MPC and RL approaches often rely on energy-related metrics embedded within a multi-objective optimization framework, which require extensive hyperparameter tuning and often result in suboptimal policies. To address these challenges, we propose ECO (Energy-Constrained Optimization), a constrained RL framework that separates energy-related metrics from rewards, reformulating them as explicit inequality constraints. This method provides a clear and interpretable physical representation of energy costs, enabling more efficient and intuitive hyperparameter tuning for improved energy efficiency. ECO introduces dedicated constraints for energy consumption and reference motion, enforced by the Lagrangian method, to achieve stable, symmetric, and energy-efficient walking for humanoid robots. We evaluated ECO against MPC, standard RL with reward shaping, and four state-of-the-art constrained RL methods. Experiments, including sim-to-sim and sim-to-real transfers on the kid-sized humanoid robot BRUCE, demonstrate that ECO significantly reduces energy consumption compared to baselines while maintaining robust walking performance. These results highlight a substantial advancement in energy-efficient humanoid locomotion. All experimental demonstrations can be found on the project website: https://sites.google.com/view/eco-humanoid.
- Abstract(参考訳): 安定的でエネルギー効率のよい移動を実現することは、ヒューマノイドロボットが現実世界のアプリケーションで継続的に動作するために不可欠である。
既存の MPC と RL のアプローチは、しばしば多目的最適化フレームワークに埋め込まれたエネルギー関連のメトリクスに依存する。
これらの課題に対処するため、エネルギー関連メトリクスを報酬から分離し、明示的な不等式制約として再構成する制約付きRLフレームワークであるECO(Energy-Constrained Optimization)を提案する。
この方法は、エネルギーコストの明確で解釈可能な物理的表現を提供し、エネルギー効率を向上させるためのより効率的で直感的なハイパーパラメータチューニングを可能にする。
ECOは、人型ロボットのための安定的で対称的でエネルギー効率の良い歩行を実現するために、ラグランジアン法によって強制されるエネルギー消費と参照運動の専用制約を導入している。
我々は,MPCに対するECO,報酬形成を伴う標準RL,最先端の制約付きRL法を4つ評価した。
子供サイズのヒューマノイドロボットBRUCEにおけるシム・トゥ・シム・トゥ・シム・トゥ・リアル・トランスファー(sim-to-sim)やシム・トゥ・リアル・トランスファー(sim-to-real transfer)を含む実験は、エコが頑丈な歩行性能を維持しながら、ベースラインに比べてエネルギー消費を著しく減少させることを示した。
これらの結果は、エネルギー効率の良いヒューマノイド移動の大幅な進歩を浮き彫りにした。
すべての実験的なデモはプロジェクトのWebサイトで見ることができる。
関連論文リスト
- Optimising for Energy Efficiency and Performance in Machine Learning [3.8803432012641395]
エネルギー消費オプティマイザ(ECOpt)はエネルギー効率とモデル性能を最適化することを示す。
ECOptは、これらのメトリクス間のトレードオフを解釈可能なフロンティアとして定量化する。
ECOpt の環境影響は,CIFAR-10 の 7 つのモデルを明らかにするのに有効であることを示す。
論文 参考訳(メタデータ) (2026-01-13T21:28:58Z) - Fast Visuomotor Policy for Robotic Manipulation [31.26284715644132]
エネルギー政策は、高周波ロボットタスクと資源制約システムのために設計されている。
単一のフォワードパスにおけるマルチモーダル動作を予測し、高速で高精度な操作を可能にする。
その結果、エネルギー政策は最先端の操作方法のパフォーマンスにマッチするか、超越しているかを示す。
論文 参考訳(メタデータ) (2025-10-14T13:18:45Z) - Tu(r)ning AI Green: Exploring Energy Efficiency Cascading with Orthogonal Optimizations [2.829284162137884]
本稿では, エネルギー効率を第一級市民として, 計算集約パイプラインの基本設計として扱うことを強調する。
5つのAIパイプラインフェーズ(データ、モデル、トレーニング、システム、推論)の戦略的選択によって、カスケード効率が向上することを示す。
組み合わせによってエネルギー消費は94.6ドル%まで減少し、最適化されていないパイプラインの元々のF1スコアの95.95ドル%を維持できる。
論文 参考訳(メタデータ) (2025-06-23T04:52:08Z) - Joint Resource Management for Energy-efficient UAV-assisted SWIPT-MEC: A Deep Reinforcement Learning Approach [50.52139512096988]
6G Internet of Things (IoT)ネットワークは、地上インフラストラクチャが利用できない遠隔地や災害シナリオにおいて、課題に直面している。
本稿では、指向性アンテナにより強化された新しい無人航空機(UAV)支援コンピューティングシステムを提案する。
論文 参考訳(メタデータ) (2025-05-06T06:46:19Z) - Latent Adaptive Planner for Dynamic Manipulation [43.959104380268066]
Latent Adaptive Planner (LAP) は、動的非包括的操作のための軌道レベルの遅延変数ポリシーである。
LAPは低次元の潜在空間における推論として計画を定式化し、人間のデモビデオから効果的に学習する。
論文 参考訳(メタデータ) (2025-05-06T00:09:09Z) - Green MLOps to Green GenOps: An Empirical Study of Energy Consumption in Discriminative and Generative AI Operations [2.2765705959685234]
本研究では,実世界のMLOpsパイプラインにおける識別型および生成型AIモデルのエネルギー消費について検討する。
さまざまな構成、モデル、データセットにわたるレプリケーションの容易性を保証するために、ソフトウェアベースのパワー測定を採用しています。
論文 参考訳(メタデータ) (2025-03-31T10:28:04Z) - Impact of ML Optimization Tactics on Greener Pre-Trained ML Models [46.78148962732881]
本研究の目的は,画像分類データセットと事前学習モデルの解析,最適化モデルと非最適化モデルを比較して推論効率を向上させること,最適化の経済的影響を評価することである。
画像分類におけるPyTorch最適化手法(動的量子化、トーチ・コンパイル、局所プルーニング、グローバルプルーニング)と42のHugging Faceモデルの影響を評価するための制御実験を行った。
動的量子化は推論時間とエネルギー消費の大幅な削減を示し、大規模システムに非常に適している。
論文 参考訳(メタデータ) (2024-09-19T16:23:03Z) - Adaptive Energy Management for Self-Sustainable Wearables in Mobile
Health [21.97214707198675]
ウェアラブルデバイスの小さなフォームファクタは、バッテリーのサイズと寿命を制限します。
ウェアラブル機器の持続可能な運用に有効な方法として、エネルギー収穫が出現している。
本稿では, 蓄電池エネルギーを補充し, ユーザによる手動充電を減らすことで, 自己維持可能なウェアラブルを目標とする適応型エネルギー管理の新たな課題について検討する。
論文 参考訳(メタデータ) (2022-01-16T23:49:20Z) - Risk-Aware Energy Scheduling for Edge Computing with Microgrid: A
Multi-Agent Deep Reinforcement Learning Approach [82.6692222294594]
マイクログリッドを用いたMECネットワークにおけるリスク対応エネルギースケジューリング問題について検討する。
ニューラルネットワークを用いたマルチエージェントディープ強化学習(MADRL)に基づくアドバンテージアクター・クリティック(A3C)アルゴリズムを適用し,その解を導出する。
論文 参考訳(メタデータ) (2020-02-21T02:14:38Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。