論文の概要: Rainbow Deep Q-Learning with Kinematics-Aware Design for Cooperative Delta and 3-RRS Parallel Robot Insertion
- arxiv url: http://arxiv.org/abs/2605.11697v1
- Date: Tue, 12 May 2026 07:53:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.681604
- Title: Rainbow Deep Q-Learning with Kinematics-Aware Design for Cooperative Delta and 3-RRS Parallel Robot Insertion
- Title(参考訳): キネマティクスを用いたレインボー深部Q-ラーニング-協調デルタと3RRSパラレルロボットの設置を意識した設計
- Authors: Hassen Nigatu, Gaokun Shi, Jituo Li, Wang Jin, Lu Guodong,
- Abstract要約: 本稿では,デルタパラレルロボットと3RRSパラレルマニピュレータによる協調ペグ・イン・ホール操作のためのキネマティクス対応深部強化学習フレームワークを提案する。
重要な貢献は、学習に先立つ幾何学的設計最適化段階の統合である。
このフレームワークは高忠実度キネマティックシミュレータで検証される。
- 参考スコア(独自算出の注目度): 2.3923020933411983
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a kinematics-aware deep reinforcement learning framework based on Rainbow Deep Q-Networks (DQN) for cooperative peg-in-hole manipulation by a Delta parallel robot and a 3-RRS (Revolute--Revolute--Spherical) parallel manipulator. A key contribution is the integration of a geometric design-optimization stage that precedes learning: the 3-RRS geometry is tuned to maximize the singularity-free workspace and improve conditioning, which in turn enlarges the safe region in which the reinforcement learning policy can explore. Together the two manipulators expose a 6~degree-of-freedom (DoF) controllable subspace (three Delta translations, two 3-RRS rotations, and one 3-RRS vertical translation); the peg-in-hole task is invariant to rotation about the peg axis, so the task-relevant manifold is five dimensional. The cooperative insertion problem is cast as a Markov Decision Process with a 12-dimensional state vector and a discrete action set containing $6 \times 2 = 12$ incremental commands (one positive and one negative per controlled DoF). A shaped reward combines dense proximity guidance, penalties for kinematic and workspace violations, and sparse bonuses for successful insertions. The Rainbow DQN -- integrating double Q-learning, dueling architecture, prioritized replay, multi-step returns, noisy linear layers for exploration, and a distributional value head -- is trained with a two-stage curriculum. The co-designed framework is validated in a high-fidelity kinematic simulator, where it achieves stable policy convergence, reliable insertions, and reduced constraint violations compared against a vanilla DQN agent and a classical sampling-based planner.
- Abstract(参考訳): 本稿では,デルタ並列ロボットと3つのRRS(Revolute-Revolute-Spherical-Spherical)並列マニピュレータによる協調ペグ・イン・ホール操作のための,レインボー深部Q-Networks(DQN)に基づくキネマティクス対応深部強化学習フレームワークを提案する。
3RRS幾何は特異点のないワークスペースを最大化し、条件付けを改善するように調整され、それによって強化学習ポリシーが探索できる安全な領域が拡大される。
2つのマニピュレータは共に6〜自由度(DoF)制御可能な部分空間(3つのデルタ変換、2つの3-RRS回転、1つの3-RRS垂直変換)を露呈する。
協調挿入問題は、マルコフ決定過程として、12次元状態ベクトルと、6進数2 = 12$インクリメンタルコマンドを含む離散アクションセット(制御されたDoF毎に1つの正と1つの負の負)でキャストされる。
形状の報酬は、密集した近接誘導、キネマティックとワークスペースの違反に対する罰則、そして挿入の成功に対するスパースボーナスを組み合わせたものである。
Rainbow DQN - ダブルQラーニング、デュエルアーキテクチャ、優先順位付けされたリプレイ、マルチステップリターン、探索用のノイズの多い線形レイヤ、分散値ヘッドを統合する - は、2段階のカリキュラムでトレーニングされている。
協調設計されたフレームワークは、バニラDQNエージェントと古典的なサンプリングベースプランナーと比較して、安定したポリシー収束、信頼性のある挿入、制約違反を達成できる高忠実なキネマティックシミュレータで検証される。
関連論文リスト
- Beyond Heuristics: Learnable Density Control for 3D Gaussian Splatting [78.96382179408054]
強化学習(RL)により最適化されたパラメータ化ポリシネットワークとして密度制御を再構築するフレームワークであるbfLeGSを紹介する。
計算的トラクタビリティを維持するために、報酬計算の複雑さを$O(N2)$から$O(N)$に下げる閉形式解を導出する。
Mip-NeRF 360、Tants & Temples、Deep Blendingのデータセットの実験は、bfLeGSが最先端の手法を大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2026-05-01T05:04:49Z) - SpatialFly: Geometry-Guided Representation Alignment for UAV Vision-and-Language Navigation in Urban Environments [49.966170814478915]
UAV VLNのための幾何学誘導空間表現フレームワークを提案する。
明示的な3次元再構成を伴わないRGB観測において、SpatialFlyは幾何学誘導2次元表示アライメント機構を導入する。
実験結果から、SpatialFlyは現状のUAV VLNベースラインを目に見える環境と見えない環境の両方で一貫して上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2026-03-22T03:56:58Z) - RegFormer++: An Efficient Large-Scale 3D LiDAR Point Registration Network with Projection-Aware 2D Transformer [71.59462491691819]
本稿では,大規模クラウドアライメントを実現するために,RegFormer++と呼ばれる新しいエンド・ツー・エンド差動トランスフォーマネットワークを提案する。
元の3D座標を2次元投影位置に充填するため、設計したトランスフォーマーは2次元処理における高効率と3次元幾何情報からの精度の両面から恩恵を受けることができる。
KITTI、NuScenes、Argoverseのデータセットを用いた実験により、我々のモデルは精度と効率の両面で最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2026-03-15T09:03:10Z) - Beyond Flatlands: Unlocking Spatial Intelligence by Decoupling 3D Reasoning from Numerical Regression [12.590536117486257]
既存の視覚言語モデル(VLM)は、現実世界の空間知能を理解するのに苦労している。
GEODEは2つの特別なプラグアンドプレイモジュールでメインVLMを拡張している。
これらのモジュールの相乗効果により、1.5Bパラメータモデルは高レベルのセマンティックディスパッチとして機能します。
論文 参考訳(メタデータ) (2025-11-14T12:42:07Z) - SPAN: Spatial-Projection Alignment for Monocular 3D Object Detection [49.12928389918159]
既存の単分子3D検出器は典型的には、切り離された予測パラダイムを通じて、3D境界ボックスの顕著な非線形回帰をテームする。
本稿では2つの主成分を持つ新しい空間射影アライメント(SPAN)を提案する。
SPANは、予測された3次元境界ボックスと接地した3次元境界ボックスの間に明らかに大域的な空間的制約を課し、それによって非結合な特性回帰による空間的ドリフトを補正する。
3D-2Dプロジェクションアライメントは、投影された3Dボックスが、画像平面上の対応する2D検出バウンディングボックス内に密に整列していることを保証する。
論文 参考訳(メタデータ) (2025-11-10T04:48:48Z) - SeqAffordSplat: Scene-level Sequential Affordance Reasoning on 3D Gaussian Splatting [85.87902260102652]
本稿では, 連続3次元ガウシアン・アフラマンス推論の課題について紹介する。
次に,SeqSplatNetを提案する。SqSplatNetは,命令を直接3Dアベイランスマスクのシーケンスにマッピングするエンドツーエンドフレームワークである。
本手法は,1段階のインタラクションから,シーンレベルでの複雑なシーケンシャルなタスクへの可利用性推論を効果的に向上させる。
論文 参考訳(メタデータ) (2025-07-31T17:56:55Z) - ParaPoint: Learning Global Free-Boundary Surface Parameterization of 3D Point Clouds [52.03819676074455]
ParaPointは、グローバルな自由境界面パラメータ化を実現するための教師なしのニューラルネットワークパイプラインである。
この研究は、グローバルマッピングと自由境界の両方を追求するニューラルポイントクラウドパラメータ化を調査する最初の試みである。
論文 参考訳(メタデータ) (2024-03-15T14:35:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。