論文の概要: Energy-Aware Reinforcement Learning for Robotic Manipulation of Articulated Components in Infrastructure Operation and Maintenance
- arxiv url: http://arxiv.org/abs/2602.12288v1
- Date: Sun, 25 Jan 2026 18:19:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-23 12:01:13.524207
- Title: Energy-Aware Reinforcement Learning for Robotic Manipulation of Articulated Components in Infrastructure Operation and Maintenance
- Title(参考訳): インフラ運用・保守における人工部品のロボット操作のための省エネルギー強化学習
- Authors: Xiaowen Tao, Yinuo Wang, Haitao Ding, Yuanyang Qi, Ziyu Song,
- Abstract要約: 本稿では,インテリジェントインフラストラクチャO&Mにおけるロボット操作のための,音節に依存しない,エネルギーを意識した強化学習フレームワークを提案する。
この方法は、部分誘導3次元知覚、重み付き点サンプリング、およびPointNetベースの符号化を組み合わせて、コンパクトな幾何学的表現を得る。
代表的なO&Mタスクの実験では、エネルギー消費が16%~30%減少し、成功へのステップが16%~32%減少した。
- 参考スコア(独自算出の注目度): 4.019133420452149
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the growth of intelligent civil infrastructure and smart cities, operation and maintenance (O&M) increasingly requires safe, efficient, and energy-conscious robotic manipulation of articulated components, including access doors, service drawers, and pipeline valves. However, existing robotic approaches either focus primarily on grasping or target object-specific articulated manipulation, and they rarely incorporate explicit actuation energy into multi-objective optimisation, which limits their scalability and suitability for long-term deployment in real O&M settings. Therefore, this paper proposes an articulation-agnostic and energy-aware reinforcement learning framework for robotic manipulation in intelligent infrastructure O&M. The method combines part-guided 3D perception, weighted point sampling, and PointNet-based encoding to obtain a compact geometric representation that generalises across heterogeneous articulated objects. Manipulation is formulated as a Constrained Markov Decision Process (CMDP), in which actuation energy is explicitly modelled and regulated via a Lagrangian-based constrained Soft Actor-Critic scheme. The policy is trained end-to-end under this CMDP formulation, enabling effective articulated-object operation while satisfying a long-horizon energy budget. Experiments on representative O&M tasks demonstrate 16%-30% reductions in energy consumption, 16%-32% fewer steps to success, and consistently high success rates, indicating a scalable and sustainable solution for infrastructure O&M manipulation.
- Abstract(参考訳): インテリジェントな土木インフラとスマートシティの成長に伴い、オペレーション・アンド・メンテナンス(O&M)は、アクセスドア、サービス引き出し、パイプラインバルブなど、接続されたコンポーネントの安全、効率的、エネルギーを意識したロボット操作を必要としている。
しかし、既存のロボットのアプローチは、主に掴み取りか、対象物固有の調音操作に焦点を合わせ、明示的な運動エネルギーを多目的最適化に組み込むことは滅多になく、実際のO&M環境での長期展開のスケーラビリティと適合性を制限している。
そこで本稿では,インテリジェントインフラストラクチャO&Mにおけるロボット操作のための,音声に依存しない,エネルギーを意識した強化学習フレームワークを提案する。
この方法は、部分誘導3次元知覚、重み付き点サンプリング、およびポイントネットに基づく符号化を組み合わせて、不均一な調音対象を一般化するコンパクトな幾何学的表現を得る。
操作はCMDP(Constrained Markov Decision Process)として定式化され、運動エネルギーはラグランジアンベースの制約されたソフトアクター・クリティカル・スキームによって明示的にモデル化・制御される。
このCMDPの定式化により, 長期のエネルギー予算を充足しつつ, 効果的な定式化操作が可能となった。
代表的なO&Mタスクの実験では、エネルギー消費が16%~30%削減され、成功へのステップが16%~32%減少し、一貫して高い成功率が示され、インフラのO&M操作のためのスケーラブルで持続可能なソリューションが示される。
関連論文リスト
- AGORA: Agentic Green Orchestration Architecture for Beyond 5G Networks [0.0]
5Gネットワークを越えたエージェントグリーンオーケストレーションアーキテクチャAGORAを提案する。
AGORAは、ローカルツール拡張大型言語モデル(LLM)エージェントをモバイルネットワーク制御ループに組み込んで、自然言語サステナビリティ目標をテレメトリ基底アクションに変換する。
その結果,ツール駆動制御ループにおける遅延-エネルギー結合が強く,コンパクトモデルが低エネルギーフットプリントを実現できることが示唆された。
論文 参考訳(メタデータ) (2026-02-08T20:39:54Z) - EmboCoach-Bench: Benchmarking AI Agents on Developing Embodied Robots [68.29056647487519]
Embodied AIは、高忠実度シミュレーションと大規模データ収集によって実現されている。
しかし、このスケーリング能力は、労働集約的な手作業の監視に依存しているため、いまだにボトルネックになっている。
実装ポリシーを自律的に構築するための LLM エージェントの能力を評価するベンチマークである textscEmboCoach-Bench を紹介する。
論文 参考訳(メタデータ) (2026-01-29T11:33:49Z) - Joint Optimization of Cooperation Efficiency and Communication Covertness for Target Detection with AUVs [105.81167650318054]
本稿では,自律型水中車両(AUV)を用いた水中協調目標検出について検討する。
まず,共同軌道と電力制御の最適化問題を定式化し,それを解決するための革新的な階層的行動管理フレームワークを提案する。
集中学習と分散実行のパラダイムの下で,我々の目標検出フレームワークは,エネルギーとモビリティの制約を満たすとともに,適応的なカバート協調を可能にする。
論文 参考訳(メタデータ) (2025-10-21T02:14:11Z) - Fast Visuomotor Policy for Robotic Manipulation [31.26284715644132]
エネルギー政策は、高周波ロボットタスクと資源制約システムのために設計されている。
単一のフォワードパスにおけるマルチモーダル動作を予測し、高速で高精度な操作を可能にする。
その結果、エネルギー政策は最先端の操作方法のパフォーマンスにマッチするか、超越しているかを示す。
論文 参考訳(メタデータ) (2025-10-14T13:18:45Z) - Joint Resource Management for Energy-efficient UAV-assisted SWIPT-MEC: A Deep Reinforcement Learning Approach [50.52139512096988]
6G Internet of Things (IoT)ネットワークは、地上インフラストラクチャが利用できない遠隔地や災害シナリオにおいて、課題に直面している。
本稿では、指向性アンテナにより強化された新しい無人航空機(UAV)支援コンピューティングシステムを提案する。
論文 参考訳(メタデータ) (2025-05-06T06:46:19Z) - Instruction-Augmented Long-Horizon Planning: Embedding Grounding Mechanisms in Embodied Mobile Manipulation [39.43049944895508]
Instruction-Augmented Long-Horizon Planning (IALP) システムを提案する。
その結果, IALPシステムでは, 平均成功率80%を超えるタスクを効率的に解けることがわかった。
論文 参考訳(メタデータ) (2025-03-11T06:37:33Z) - Efficient Skill Acquisition for Complex Manipulation Tasks in Obstructed
Environments [18.348489257164356]
本稿では,オブジェクト指向生成モデル(OCGM)を多目的ゴール識別に活用する,効率的なスキル獲得システムを提案する。
OCGMは、新しいシーンでワンショットターゲットオブジェクトの識別と再識別を可能にし、MPは障害物を避けながらロボットを対象オブジェクトに誘導することができる。
論文 参考訳(メタデータ) (2023-03-06T18:49:59Z) - Energy-Efficient Multi-Orchestrator Mobile Edge Learning [54.28419430315478]
Mobile Edge Learning(MEL)は、エッジデバイス上で機械学習(ML)モデルの分散トレーニングを特徴とする、協調学習パラダイムである。
MELでは、異なるデータセットで複数の学習タスクが共存する可能性がある。
本稿では, エネルギー消費, 精度, 解複雑性のトレードオフを容易にする軽量なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-02T07:37:10Z) - Multi-Agent Meta-Reinforcement Learning for Self-Powered and Sustainable
Edge Computing Systems [87.4519172058185]
エッジコンピューティング機能を有するセルフパワー無線ネットワークの効率的なエネルギー分配機構について検討した。
定式化問題を解くために,新しいマルチエージェントメタ強化学習(MAMRL)フレームワークを提案する。
実験の結果、提案されたMAMRLモデルは、再生不可能なエネルギー使用量を最大11%削減し、エネルギーコストを22.4%削減できることが示された。
論文 参考訳(メタデータ) (2020-02-20T04:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。