論文の概要: Find the Fruit: Designing a Zero-Shot Sim2Real Deep RL Planner for Occlusion Aware Plant Manipulation
- arxiv url: http://arxiv.org/abs/2505.16547v1
- Date: Thu, 22 May 2025 11:37:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.25735
- Title: Find the Fruit: Designing a Zero-Shot Sim2Real Deep RL Planner for Occlusion Aware Plant Manipulation
- Title(参考訳): 植物操作を意識したゼロショットSim2リアル深部RLプランナの設計
- Authors: Nitesh Subedi, Hsin-Jung Yang, Devesh K. Jha, Soumik Sarkar,
- Abstract要約: 本稿では, 乱雑な植物環境におけるロボット操作のためのエンドツーエンドの深層強化学習フレームワークを提案する。
ロボット制御からキネマティック計画問題を分離し、訓練されたポリシーに対するゼロショットsim2real転送を簡素化する。
本研究は, 各種初期条件における実地試験において, 最大86.7%の成果が得られたことを実証した。
- 参考スコア(独自算出の注目度): 13.987904621536256
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents an end-to-end deep reinforcement learning (RL) framework for occlusion-aware robotic manipulation in cluttered plant environments. Our approach enables a robot to interact with a deformable plant to reveal hidden objects of interest, such as fruits, using multimodal observations. We decouple the kinematic planning problem from robot control to simplify zero-shot sim2real transfer for the trained policy. Our results demonstrate that the trained policy, deployed using our framework, achieves up to 86.7% success in real-world trials across diverse initial conditions. Our findings pave the way toward autonomous, perception-driven agricultural robots that intelligently interact with complex foliage plants to "find the fruit" in challenging occluded scenarios, without the need for explicitly designed geometric and dynamic models of every plant scenario.
- Abstract(参考訳): 本稿では, 乱雑な植物環境における隠蔽型ロボット操作のための, エンドツーエンドの深部強化学習(RL)フレームワークを提案する。
本手法により, 変形可能な植物と相互作用し, 果実などの隠れた対象をマルチモーダル観察により明らかにすることができる。
ロボット制御からキネマティック計画問題を分離し、訓練されたポリシーに対するゼロショットsim2real転送を簡素化する。
本研究の結果から,本フレームワークを応用したトレーニングポリシは,さまざまな初期条件において,実世界の試験において最大86.7%の成功を収めていることがわかった。
我々の研究結果は、複雑な葉植物とインテリジェントに相互作用し、あらゆる植物シナリオの幾何学的・動的モデルを明示的に設計することなく、難解なシナリオで「果物を仕上げる」ための自律的認識駆動型農業ロボットへの道を開いた。
関連論文リスト
- SimScale: Learning to Drive via Real-World Simulation at Scale [45.08991279559151]
本稿では,既存の運転ログ上に巨大な未確認状態を合成可能な,新規でスケーラブルなシミュレーションフレームワークを提案する。
我々のパイプラインは、高度なニューラルレンダリングとリアクティブ環境を利用して、高忠実度マルチビュー観測を生成する。
我々は、これらの新しいシミュレーション状態に対する擬似経験的軌跡生成機構を開発し、行動監視を行う。
論文 参考訳(メタデータ) (2025-11-28T17:17:38Z) - RealD$^2$iff: Bridging Real-World Gap in Robot Manipulation via Depth Diffusion [48.86480272116588]
雑音深度を合成することを学ぶクリーン・ツー・ノイズのパラダイムを提案する。
本稿では,階層的な粗い拡散フレームワークであるRealD$2$iffを紹介する。
本パラダイムの有効性を示す実証的,実験的な検証を行う。
論文 参考訳(メタデータ) (2025-11-27T14:36:56Z) - DexNDM: Closing the Reality Gap for Dexterous In-Hand Rotation via Joint-Wise Neural Dynamics Model [22.46947045094797]
我々は,シミュレーションで訓練された単一ポリシーを,現実世界のさまざまな対象や条件に一般化することのできる,新しいフレームワークを開発した。
単一のポリシーは、複雑な形状(例えば動物)、高いアスペクト比(最大5.33)、小さなサイズで挑戦対象を回転させることに成功した。
論文 参考訳(メタデータ) (2025-10-09T17:59:11Z) - FLEX: A Framework for Learning Robot-Agnostic Force-based Skills Involving Sustained Contact Object Manipulation [9.292150395779332]
本稿では,力空間におけるオブジェクト中心の操作ポリシーを学習するための新しいフレームワークを提案する。
提案手法は, 動作空間を単純化し, 不要な探索を低減し, シミュレーションオーバーヘッドを低減させる。
評価の結果,本手法はベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2025-03-17T17:49:47Z) - Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids [56.892520712892804]
本稿では,ヒューマノイドロボットを訓練して3つの巧妙な操作を行う,実用的なシミュレート・トゥ・リアルなRLレシピを提案する。
未確認のオブジェクトやロバストで適応的な政策行動に対して高い成功率を示す。
論文 参考訳(メタデータ) (2025-02-27T18:59:52Z) - AdaManip: Adaptive Articulated Object Manipulation Environments and Policy Learning [25.331956706253614]
人工物体操作は、ロボットが現実世界のシナリオで様々なタスクを遂行する上で重要な機能である。
音声オブジェクトの以前のデータセットとシミュレーション環境は、主に単純な操作機構に焦点を合わせてきた。
そこで我々は,新しいオブジェクト操作環境を構築し,それを9つのカテゴリのオブジェクトに装備する。
環境とオブジェクトに基づいて,適応的な実演コレクションと3次元視覚拡散に基づく模倣学習パイプラインを提案する。
論文 参考訳(メタデータ) (2025-02-16T13:45:10Z) - DRAPER: Towards a Robust Robot Deployment and Reliable Evaluation for Quasi-Static Pick-and-Place Cloth-Shaping Neural Controllers [2.720296126199296]
本研究では、フラット化タスクと折り畳みタスクにおいて、異なるシミュレーション訓練されたニューラルコントローラの信頼性の高い実世界比較を示す。
我々は、これらのニューラルコントローラの真の能力を確実に反映した、この包括的な研究を可能にするために、DRAPERフレームワークを導入する。
論文 参考訳(メタデータ) (2024-09-23T16:08:16Z) - Polaris: Open-ended Interactive Robotic Manipulation via Syn2Real Visual Grounding and Large Language Models [53.22792173053473]
我々はPolarisという対話型ロボット操作フレームワークを紹介した。
ポラリスはGPT-4と接地された視覚モデルを利用して知覚と相互作用を統合する。
本稿では,Syn2Real(Synthetic-to-Real)ポーズ推定パイプラインを提案する。
論文 参考訳(メタデータ) (2024-08-15T06:40:38Z) - Track2Act: Predicting Point Tracks from Internet Videos enables Generalizable Robot Manipulation [65.46610405509338]
我々は、ゼロショットロボット操作を可能にする汎用的な目標条件ポリシーを学習することを目指している。
私たちのフレームワークであるTrack2Actは、ゴールに基づいて将来のタイムステップで画像内のポイントがどのように動くかを予測する。
学習したトラック予測を残留ポリシーと組み合わせることで,多種多様な汎用ロボット操作が可能となることを示す。
論文 参考訳(メタデータ) (2024-05-02T17:56:55Z) - RoboScript: Code Generation for Free-Form Manipulation Tasks across Real
and Simulation [77.41969287400977]
本稿では,コード生成を利用したデプロイ可能なロボット操作パイプラインのためのプラットフォームである textbfRobotScript を提案する。
自由形自然言語におけるロボット操作タスクのためのコード生成ベンチマークも提案する。
我々は,Franka と UR5 のロボットアームを含む,複数のロボットエボディメントにまたがるコード生成フレームワークの適応性を実証した。
論文 参考訳(メタデータ) (2024-02-22T15:12:00Z) - Gazebo Plants: Simulating Plant-Robot Interaction with Cosserat Rods [11.379848739344814]
植物の動きをモデル化するために,コセラットロッドをベースとしたGazeboシミュレーションプラットフォーム用のプラグインを提案する。
筆者らは,このプラグインを用いて,果実を摘むロボットアームを模擬することにより,ガゼボで収穫シミュレーションを行うことができることを示した。
論文 参考訳(メタデータ) (2024-02-04T17:19:46Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Transferring Foundation Models for Generalizable Robotic Manipulation [82.12754319808197]
インターネット規模の基盤モデルによって生成された言語推論セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
提案手法は,オブジェクトのポーズを効果的かつ堅牢に知覚し,サンプル効率のよい一般化学習を可能にする。
デモは提出されたビデオで見ることができ、より包括的なデモはlink1またはlink2で見ることができます。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - DexTransfer: Real World Multi-fingered Dexterous Grasping with Minimal
Human Demonstrations [51.87067543670535]
本研究では,少数の人間によるデモンストレーションを行い,見えない物体のポーズを学習するロボット学習システムを提案する。
我々は,物体の点群を入力として捉え,物体を異なる初期ロボット状態から把握するための連続的な動作を予測する,厳密な把握ポリシーを訓練する。
我々のデータセットから学んだポリシーは、シミュレーションと現実世界の両方で見えないオブジェクトのポーズをうまく一般化することができる。
論文 参考訳(メタデータ) (2022-09-28T17:51:49Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - SAGCI-System: Towards Sample-Efficient, Generalizable, Compositional,
and Incremental Robot Learning [41.19148076789516]
上記の4つの要件を満たすために,SAGCIシステムと呼ばれる体系的な学習フレームワークを導入する。
本システムはまず,ロボットの手首に搭載されたカメラによって収集された生点雲を入力とし,URDFに代表される周囲環境の初期モデリングを生成する。
そのロボットは、対話的な知覚を利用して環境と対話し、URDFのオンライン検証と修正を行う。
論文 参考訳(メタデータ) (2021-11-29T16:53:49Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - DeepSym: Deep Symbol Generation and Rule Learning from Unsupervised
Continuous Robot Interaction for Planning [1.3854111346209868]
ロボットアームハンドシステムは、プッシュとスタックアクションから「ロータブル」、「インサータブル」、「ラーガー・サン」と解釈できるシンボルを学習する。
本システムは,ロボットアームハンドシステムにおいて,その動作から「回転可能」,「不可能」,「大きい」と解釈可能なシンボルを学習する物理に基づく3次元シミュレーション環境で検証する。
論文 参考訳(メタデータ) (2020-12-04T11:26:06Z) - Robust Constrained Reinforcement Learning for Continuous Control with
Model Misspecification [26.488582821511972]
現実世界のシステムは、非定常性、摩耗・摩耗、未校正センサーなどの影響を受けやすい。
このような効果は、システムダイナミクスを効果的に摂動させ、同じドメインの摂動バージョンにデプロイすると、あるドメインでトレーニングされたポリシーがうまく動作しないようにする。
これは、将来の報酬を最大化する政策の能力と、それが制約を満たす範囲に影響を与える可能性がある。
実世界強化学習(Real World Reinforcement Learning, RWRL)から, この形態の誤特定を軽減し, 実世界強化学習(Real World Reinforcement Learning, RWRL)から複数の模擬Mujocoタスクにその性能を示すアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-10-20T22:05:37Z) - SAPIEN: A SimulAted Part-based Interactive ENvironment [77.4739790629284]
SAPIENは現実的で物理に富んだシミュレートされた環境であり、音声オブジェクトのための大規模なセットをホストしている。
部品検出と動作特性認識のための最先端の視覚アルゴリズムの評価を行い,ロボットインタラクションタスクの実証を行った。
論文 参考訳(メタデータ) (2020-03-19T00:11:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。