Fugu-MT 論文翻訳(概要): Task-Oriented Grasping Using Reinforcement Learning with a Contextual Reward Machine

論文の概要: Task-Oriented Grasping Using Reinforcement Learning with a Contextual Reward Machine

arxiv url: http://arxiv.org/abs/2512.10235v1
Date: Thu, 11 Dec 2025 02:42:40 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-23 08:17:40.274112
Title: Task-Oriented Grasping Using Reinforcement Learning with a Contextual Reward Machine
Title（参考訳）: コンテクストリワードマシンを用いた強化学習によるタスク指向型グラスピング
Authors: Hui Li, Akhlak Uz Zaman, Fujian Yan, Hongsheng He,
Abstract要約: 本稿では,タスク指向の把握にContextual Reward Machineを組み込んだ強化学習フレームワークを提案する。 Contextual Reward Machineは、タスクを管理可能なサブタスクに分解することで、タスクの複雑さを低減する。 The Proximal Policy Optimization algorithm, proposed to a 95% success rate across 1,000simulated grasping task。
参考スコア（独自算出の注目度）: 2.4967362464308303
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper presents a reinforcement learning framework that incorporates a Contextual Reward Machine for task-oriented grasping. The Contextual Reward Machine reduces task complexity by decomposing grasping tasks into manageable sub-tasks. Each sub-task is associated with a stage-specific context, including a reward function, an action space, and a state abstraction function. This contextual information enables efficient intra-stage guidance and improves learning efficiency by reducing the state-action space and guiding exploration within clearly defined boundaries. In addition, transition rewards are introduced to encourage or penalize transitions between stages which guides the model toward desirable stage sequences and further accelerates convergence. When integrated with the Proximal Policy Optimization algorithm, the proposed method achieved a 95% success rate across 1,000 simulated grasping tasks encompassing diverse objects, affordances, and grasp topologies. It outperformed the state-of-the-art methods in both learning speed and success rate. The approach was transferred to a real robot, where it achieved a success rate of 83.3% in 60 grasping tasks over six affordances. These experimental results demonstrate superior accuracy, data efficiency, and learning efficiency. They underscore the model's potential to advance task-oriented grasping in both simulated and real-world settings.
Abstract（参考訳）: 本稿では,タスク指向の把握にContextual Reward Machineを組み込んだ強化学習フレームワークを提案する。 Contextual Reward Machineは、タスクを管理可能なサブタスクに分解することで、タスクの複雑さを低減する。各サブタスクは、報酬関数、アクション空間、状態抽象化関数を含むステージ固有のコンテキストに関連付けられている。この文脈情報により、効率的な段階内指導が可能となり、状態空間を小さくし、明確に定義された境界内の探索を導くことにより学習効率を向上させることができる。さらに、遷移報酬を導入して、モデルを望ましい段階列へと導く段階間の遷移を奨励または罰し、さらに収束を加速する。近似ポリシー最適化アルゴリズムと統合した場合, 提案手法は, 多様な対象, 可視性, トポロジを包含する1000個のシミュレートされた把握タスクに対して, 95%の成功率を達成した。学習速度と成功率の両方において最先端の手法よりも優れていた。アプローチは本物のロボットに移管され、6つの余裕で60の作業で83.3%の成功率を達成した。これらの実験結果から, 精度, データ効率, 学習効率が向上した。彼らは、シミュレーションと現実世界の両方の設定でタスク指向の把握を前進させるモデルの可能性を強調している。

関連論文リスト

FAST: Similarity-based Knowledge Transfer for Efficient Policy Learning [57.4737157531239]
Transfer Learningは、タスク間で知識を伝達することで学習を加速する能力を提供する。これは、負の転送、ドメイン適応、ソリッドソースポリシーの選択における非効率といった重要な課題に直面します。本研究では,知識伝達の改善,タスク間のパフォーマンスの促進,計算コストの削減など,TLの課題に挑戦する。
論文参考訳（メタデータ） (2025-07-27T22:21:53Z)
Semantic-Geometric-Physical-Driven Robot Manipulation Skill Transfer via Skill Library and Tactile Representation [6.324290412766366]
操作知識を整理するための知識グラフに基づくスキルライブラリ構築手法を提案する。また,スキルライブラリと触覚表現に基づく新しい階層型スキル伝達フレームワークを提案する。提案手法のスキル伝達と適応性について実験を行った。
論文参考訳（メタデータ） (2024-11-18T16:42:07Z)
BiKC: Keypose-Conditioned Consistency Policy for Bimanual Robotic Manipulation [48.08416841005715]
両面操作に適したキーポーズ条件の整合性ポリシーを導入する。階層的な模倣学習フレームワークであり、ハイレベルなキープレース予測器と低レベルな軌道生成器から構成される。シミュレーションおよび実世界の実験結果から,提案手法は成功率と運用効率の点で基準法を超越していることが示された。
論文参考訳（メタデータ） (2024-06-14T14:49:12Z)
Identifying Suitable Tasks for Inductive Transfer Through the Analysis of Feature Attributions [78.55044112903148]
我々は、単一タスクモデル間のニューラルネットワークアクティベーションの比較を通じて、タスクペアが相補的になるかどうかを予測するために、説明可能性技術を使用する。提案手法により,TREC-IS 2020-Aデータセットでは,正のクラスF1の0.034の削減に留まらず,最大83.5%のトレーニング時間を短縮することが可能である。
論文参考訳（メタデータ） (2022-02-02T15:51:07Z)
Learning Transferable Motor Skills with Hierarchical Latent Mixture Policies [37.09286945259353]
階層的混合潜時変動モデルを用いて,データから抽象運動スキルを学習する手法を提案する。提案手法は,オフラインデータを異なる実行動作に効果的にクラスタ化することができることを示す。
論文参考訳（メタデータ） (2021-12-09T17:37:14Z)
MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。正規化最大度(NML)分布の計算法を提案する。得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文参考訳（メタデータ） (2021-07-15T08:19:57Z)
Constrained-Space Optimization and Reinforcement Learning for Complex Tasks [42.648636742651185]
Demonstrationからの学習は、オペレータ操作スキルをロボットに転送するためにますます利用されている。本稿では,複雑なタスクを管理するための制約付き空間最適化と強化学習手法を提案する。
論文参考訳（メタデータ） (2020-04-01T21:50:11Z)
Gradient Surgery for Multi-Task Learning [119.675492088251]
マルチタスク学習は、複数のタスク間で構造を共有するための有望なアプローチとして登場した。マルチタスク学習がシングルタスク学習と比較して難しい理由は、完全には理解されていない。本稿では,他の作業の勾配の正規平面上にタスクの勾配を投影する勾配手術の一形態を提案する。
論文参考訳（メタデータ） (2020-01-19T06:33:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。