論文の概要: Robotic Paper Wrapping by Learning Force Control
- arxiv url: http://arxiv.org/abs/2503.15685v1
- Date: Wed, 19 Mar 2025 20:45:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-21 22:27:03.712144
- Title: Robotic Paper Wrapping by Learning Force Control
- Title(参考訳): 学習力制御によるロボットペーパーラッピング
- Authors: Hiroki Hanai, Takuya Kiyokawa, Weiwei Wan, Kensuke Harada,
- Abstract要約: 本研究では,ロボットが包装工程の各ステップを効率的に実行できるように,模倣学習と強化学習を組み合わせた新しい枠組みを提案する。
提案法はアブレーション試験により, 断裂率, ひび割れ率を著しく低減し, 作業完了を実証した。
- 参考スコア(独自算出の注目度): 14.51446250309401
- License:
- Abstract: Robotic packaging using wrapping paper poses significant challenges due to the material's complex deformation properties. The packaging process itself involves multiple steps, primarily categorized as folding the paper or creating creases. Small deviations in the robot's arm trajectory or force vector can lead to tearing or wrinkling of the paper, exacerbated by the variability in material properties. This study introduces a novel framework that combines imitation learning and reinforcement learning to enable a robot to perform each step of the packaging process efficiently. The framework allows the robot to follow approximate trajectories of the tool-center point (TCP) based on human demonstrations while optimizing force control parameters to prevent tearing or wrinkling, even with variable wrapping paper materials. The proposed method was validated through ablation studies, which demonstrated successful task completion with a significant reduction in tear and wrinkle rates. Furthermore, the force control strategy proved to be adaptable across different wrapping paper materials and robust against variations in the size of the target object.
- Abstract(参考訳): 包装紙を用いたロボット包装は、材料の複雑な変形特性のために大きな課題を生んでいる。
包装プロセス自体は、主に紙を折り畳んだり、折り目を作るような複数の工程を含む。
ロボットの腕の軌道や力ベクトルの小さなずれは、材料特性の変化によって悪化する紙の裂け目やしわにつながる可能性がある。
本研究では,ロボットが包装工程の各ステップを効率的に実行できるように,模倣学習と強化学習を組み合わせた新しい枠組みを提案する。
このフレームワークにより、ロボットは人間のデモンストレーションに基づいて、ツールセンターポイント(TCP)の近似軌跡を追従でき、また、可変包装紙材料であっても、ひび割れやしわを防止するために、力制御パラメータを最適化することができる。
提案法はアブレーション試験により, 断裂率, ひび割れ率を著しく低減し, 作業完了を実証した。
さらに, 各種包装紙材に適用可能であり, 対象物の大きさの変動に対して頑健であることがわかった。
関連論文リスト
- From Ceilings to Walls: Universal Dynamic Perching of Small Aerial Robots on Surfaces with Variable Orientations [14.503234350698653]
この研究は、様々な大きさの四元数と異なる向きを持つ曲面に対する普遍的動的摂動能力を示す。
異なるロボットスケールで幾何比率を維持することは、一貫したパーチ動作を保証する。
ランディングギアの継手剛性と減衰が引抜き挙動および性能に及ぼす影響
論文 参考訳(メタデータ) (2024-12-27T17:53:01Z) - Unsupervised Learning of Effective Actions in Robotics [0.9374652839580183]
ロボット工学における現在の最先端のアクション表現は、ロボットのアクションに対する適切な効果駆動学習を欠いている。
連続運動空間の離散化と「アクションプロトタイプ」生成のための教師なしアルゴリズムを提案する。
シミュレーションされた階段登上補強学習課題について,本手法の評価を行った。
論文 参考訳(メタデータ) (2024-04-03T13:28:52Z) - Robotic Handling of Compliant Food Objects by Robust Learning from
Demonstration [79.76009817889397]
本稿では,食品に適合する物体をロボットで把握する上で,実証からの学習(LfD)に基づく頑健な学習方針を提案する。
教師の意図した方針を推定し,無矛盾な実演を自動的に除去するLfD学習ポリシーを提案する。
提案されたアプローチは、前述の業界セクターで幅広い応用が期待できる。
論文 参考訳(メタデータ) (2023-09-22T13:30:26Z) - Exploiting Symmetry and Heuristic Demonstrations in Off-policy
Reinforcement Learning for Robotic Manipulation [1.7901837062462316]
本稿では,物理ロボット環境に存在する自然対称性を定義し,組み込むことを目的とする。
提案手法は,産業用アームの2つのポイント・ツー・ポイント・リーチタスクによって,障害物を伴わずに検証される。
提案手法と従来の非政治強化学習アルゴリズムとの比較研究は,アプリケーションにおける学習性能と潜在的価値の優位性を示している。
論文 参考訳(メタデータ) (2023-04-12T11:38:01Z) - Co-learning Planning and Control Policies Constrained by Differentiable
Logic Specifications [4.12484724941528]
本稿では,高次元ロボットナビゲーションタスクを解くための新しい強化学習手法を提案する。
既存の強化学習アルゴリズムと比較して、より少ないサンプルで高品質なポリシーを訓練する。
提案手法は,高次元制御と政策アライメントによる準最適政策の回避にも有効である。
論文 参考訳(メタデータ) (2023-03-02T15:24:24Z) - Online Refinement of a Scene Recognition Model for Mobile Robots by
Observing Human's Interaction with Environments [2.127049691404299]
シーン認識システムでは、障害として認識される移動可能な植物のためにロボットが立ち往生してしまう可能性がある。
本研究では,ロボットの操作中に,フライ時に意味的セグメンテーションモデルを書き換えるフレームワークを提案する。
微調整を伴わないオンラインモデル改良のための重み付けインプリンティングに基づく数ショットセグメンテーションを提案する。
論文 参考訳(メタデータ) (2022-08-13T12:48:18Z) - Understanding Physical Effects for Effective Tool-use [91.55810923916454]
本稿では,最小の協力力で効果的なツール利用戦略を創出するロボット学習計画フレームワークを提案する。
FEM(Finite Element Method)をベースとしたシミュレータを用いて,観測ツール使用時の細粒度,連続的な視覚的,身体的効果を再現する。
シミュレーションでは,提案手法が2つのタスクで観測されたものとは大きく異なる,より効果的なツール利用戦略を実現できることを示す。
論文 参考訳(メタデータ) (2022-06-30T03:13:38Z) - DiSECt: A Differentiable Simulator for Parameter Inference and Control
in Robotic Cutting [71.50844437057555]
軟質材料を切断するための最初の微分可能シミュレータであるDiSECtについて述べる。
シミュレータは、符号付き距離場に基づく連続接触モデルにより有限要素法を増強する。
このシミュレータは, 最先端の商用解法を用いて, 結果の力やフィールドに適合するようにキャリブレーションできることを示す。
論文 参考訳(メタデータ) (2022-03-19T07:27:19Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - Tesseract: Tensorised Actors for Multi-Agent Reinforcement Learning [92.05556163518999]
MARLは、コミュニケーションと可観測性に様々な制約を課すことによって、問題を悪化させる。
値ベースの手法では、最適な値関数を正確に表現することが課題となる。
政策勾配法では、批判者の訓練を困難にし、遅れる批判者の問題を悪化させる。
学習理論の観点からは、関連するアクション値関数を正確に表現することで、両方の問題に対処できることが示される。
論文 参考訳(メタデータ) (2021-05-31T23:08:05Z) - Bayesian Meta-Learning for Few-Shot Policy Adaptation Across Robotic
Platforms [60.59764170868101]
強化学習手法は、重要な性能を達成できるが、同じロボットプラットフォームで収集される大量のトレーニングデータを必要とする。
私たちはそれを、さまざまなロボットプラットフォームで共有される共通の構造を捉えるモデルを見つけることを目標とする、数ショットのメタラーニング問題として定式化します。
我々は,400個のロボットを用いて,実ロボットピッキング作業とシミュレーションリーチの枠組みを実験的に評価した。
論文 参考訳(メタデータ) (2021-03-05T14:16:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。