Fugu-MT 論文翻訳(概要): Dynamics-Guided Diffusion Model for Robot Manipulator Design

論文の概要: Dynamics-Guided Diffusion Model for Robot Manipulator Design

arxiv url: http://arxiv.org/abs/2402.15038v1
Date: Fri, 23 Feb 2024 01:19:30 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-26 15:59:53.406856
Title: Dynamics-Guided Diffusion Model for Robot Manipulator Design
Title（参考訳）: ロボットマニピュレータ設計のためのダイナミクス誘導拡散モデル
Authors: Xiaomeng Xu, Huy Ha, Shuran Song
Abstract要約: 本稿では,データ駆動型マニピュレータ幾何設計を所定の操作タスクのために生成するフレームワークを提案する。タスク毎に異なる設計モデルをトレーニングする代わりに、私たちのアプローチでは、タスク間で共有される学習された動的ネットワークを採用しています。
参考スコア（独自算出の注目度）: 24.703003555261482
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present Dynamics-Guided Diffusion Model, a data-driven framework for generating manipulator geometry designs for a given manipulation task. Instead of training different design models for each task, our approach employs a learned dynamics network shared across tasks. For a new manipulation task, we first decompose it into a collection of individual motion targets which we call target interaction profile, where each individual motion can be modeled by the shared dynamics network. The design objective constructed from the target and predicted interaction profiles provides a gradient to guide the refinement of finger geometry for the task. This refinement process is executed as a classifier-guided diffusion process, where the design objective acts as the classifier guidance. We evaluate our framework on various manipulation tasks, under the sensor-less setting using only an open-loop parallel jaw motion. Our generated designs outperform optimization-based and unguided diffusion baselines relatively by 31.5% and 45.3% on average manipulation success rate. With the ability to generate a design within 0.8 seconds, our framework could facilitate rapid design iteration and enhance the adoption of data-driven approaches for robotic mechanism design.
Abstract（参考訳）: 本研究では,データ駆動による操作操作のためのマニピュレータ形状設計生成フレームワークであるDynamics-Guided Diffusion Modelを提案する。タスク毎に異なる設計モデルをトレーニングするのではなく、タスク間で共有される学習ダイナミクスネットワークを採用しています。新たな操作タスクのために、まず個別の動作目標の集合に分解し、ターゲット間の相互作用プロファイルと呼び、各動作を共有動的ネットワークでモデル化する。ターゲットと予測される相互作用プロファイルから構築された設計目的は、タスクのための指形状の洗練を導くための勾配を提供する。この洗練処理は、設計目的が分類器ガイダンスとして機能する分類器誘導拡散プロセスとして実行される。開ループ平行顎運動のみを用いて,センサレス環境下での様々な操作作業の枠組みを評価する。生成した設計は,平均操作成功率の31.5%,45.3%と,最適化ベースラインと非誘導拡散ベースラインを上回った。 0.8秒以内に設計を生成する能力により、我々のフレームワークは迅速な設計のイテレーションを促進し、ロボット機構設計にデータ駆動アプローチを採用することができる。

関連論文リスト

G3Flow: Generative 3D Semantic Flow for Pose-aware and Generalizable Object Manipulation [65.86819811007157]
本稿では,基礎モデルを活用した動的オブジェクト中心の3D表現であるリアルタイムセマンティックフローを構築する新しいフレームワークG3Flowを提案する。提案手法は,デジタルツイン生成のための3次元生成モデル,セマンティック特徴抽出のための視覚基盤モデル,連続的なセマンティックフロー更新のためのロバストポーズ追跡を一意に組み合わせたものである。本研究は,ロボット操作ポリシーのリアルタイムな動的意味的特徴理解におけるG3Flowの有効性を実証するものである。
論文参考訳（メタデータ） (2024-11-27T14:17:43Z)
LaVin-DiT: Large Vision Diffusion Transformer [99.98106406059333]
LaVin-DiTは、20以上のコンピュータビジョンタスクを生成フレームワークで扱うために設計された、スケーラブルで統一された基盤モデルである。視覚タスクの生成性能を最適化するための重要なイノベーションを紹介する。このモデルは0.1Bから3.4Bのパラメータに拡張され、様々な視覚タスクにまたがる相当なスケーラビリティと最先端の性能を示す。
論文参考訳（メタデータ） (2024-11-18T12:05:27Z)
PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation [68.17081518640934]
ロボット操作のためのPrIrmitive-driVen waypOinT-aware world model(PIVOT-R)を提案する。 PIVOT-RはWAWM(Waypoint-aware World Model)と軽量アクション予測モジュールで構成される。私たちのPIVOT-RはSeaWaveベンチマークで最先端のオープンソースモデルより優れており、4段階の命令タスクで平均19.45%の相対的な改善を実現しています。
論文参考訳（メタデータ） (2024-10-14T11:30:18Z)
ManiCM: Real-time 3D Diffusion Policy via Consistency Model for Robotic Manipulation [16.272352213590313]
拡散モデルは自然画像から運動軌道への複雑な分布を生成するのに有効であることが確認されている。近年の手法では3次元ロボット操作作業において顕著な性能を示すが、複数のデノナイジングステップにより実行時の非効率が悪化している。拡散過程に一貫性の制約を課すリアルタイムロボット操作モデルManiCMを提案する。
論文参考訳（メタデータ） (2024-06-03T17:59:23Z)
SAM-E: Leveraging Visual Foundation Model with Sequence Imitation for Embodied Manipulation [62.58480650443393]
Segment Anything (SAM) は、一般化可能なシーン理解とシーケンス模倣のための視覚境界モデルである。我々は,単一パスにおけるアクションシーケンスの予測を可能にする,新しいマルチチャネルヒートマップを開発した。
論文参考訳（メタデータ） (2024-05-30T00:32:51Z)
Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。 N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文参考訳（メタデータ） (2024-01-24T01:33:39Z)
Learning visual-based deformable object rearrangement with local graph neural networks [4.333220038316982]
本稿では,変形可能なオブジェクト状態とキーポイントの集合とその相互作用を効率的にモデル化できる新しい表現戦略を提案する。また、変形可能な再配置ダイナミクスを共同でモデル化し、最適操作動作を推定するための光局所GNN学習を提案する。本手法は, 各種変形可能なアレンジメントタスク(平均96.3%)において, シミュレーション実験における最先端手法よりもはるかに高い成功率を達成する。
論文参考訳（メタデータ） (2023-10-16T11:42:54Z)
Surrogate Modeling of Car Drag Coefficient with Depth and Normal Renderings [4.868319717279586]
本稿では,3次元カードラッグの予測の有効性を検証するために,新しい2次元3次元形状表現法を提案する。我々はドラッグ係数でラベル付けされた9,070個の高品質な3Dカーメッシュの多様なデータセットを構築した。実験により,車種別0.84以上のR2$値のドラッグ係数を精度良く,効率的に評価できることを示した。
論文参考訳（メタデータ） (2023-05-26T09:33:12Z)
Deep Graph Reprogramming [112.34663053130073]
グラフニューラルネットワーク(GNN)に適したタスク再利用モデル「ディープグラフ再プログラミング」本稿では,モデル再プログラミングパラダイムと並行して,革新的なデータ再プログラミングパラダイムを提案する。
論文参考訳（メタデータ） (2023-04-28T02:04:29Z)
Deep Reinforcement Learning Based on Local GNN for Goal-conditioned Deformable Object Rearranging [1.807492010338763]
オブジェクトの再配置は、ロボットが変形可能なオブジェクトを目標設定に再構成する必要がある、最も一般的な変形可能な操作タスクの1つである。従来の研究は、モデルベースまたはデータ駆動アプローチによる各タスクのエキスパートシステムの設計に重点を置いていた。画像から検出されたキーポイントを2つの表現グラフを用いて符号化する局所GNN(Graph Neural Network)に基づく学習法を設計する。我々のフレームワークはシミュレーションにおける複数の1-D(ロープリング、ロープリング)と2-D(クロース)の再構成作業に有効であり、キーポイント検出器を微調整することで、実際のロボットに容易に移行できる。
論文参考訳（メタデータ） (2023-02-21T05:21:26Z)
Unifying Flow, Stereo and Depth Estimation [121.54066319299261]
本稿では3つの動作と3次元知覚タスクのための統一的な定式化とモデルを提案する。これら3つのタスクを、統一された高密度対応マッチング問題として定式化する。我々のモデルは、モデルアーキテクチャとパラメータがタスク間で共有されているため、自然にクロスタスク転送を可能にします。
論文参考訳（メタデータ） (2022-11-10T18:59:54Z)
Deep Generative Models on 3D Representations: A Survey [81.73385191402419]
生成モデルは、新しいインスタンスを生成することによって観測データの分布を学習することを目的としている。最近、研究者は焦点を2Dから3Dにシフトし始めた。 3Dデータの表現は、非常に大きな課題をもたらします。
論文参考訳（メタデータ） (2022-10-27T17:59:50Z)
Efficient Automatic Machine Learning via Design Graphs [72.85976749396745]
最適なモデル設計を探索する効率的なサンプルベース手法であるFALCONを提案する。 FALCONは,1)グラフニューラルネットワーク(GNN)を介してデザイングラフ上でメッセージパッシングを行うタスク非依存モジュール,2)既知のモデル性能情報のラベル伝搬を行うタスク固有モジュールを特徴とする。 FALCONは,30個の探索ノードのみを用いて,各タスクに対して良好な性能を持つ設計を効率的に得ることを実証的に示す。
論文参考訳（メタデータ） (2022-10-21T21:25:59Z)
SE(3)-DiffusionFields: Learning smooth cost functions for joint grasp and motion optimization through diffusion [34.25379651790627]
本研究では,データ駆動型SE(3)コスト関数を拡散モデルとして学習する手法を提案する。我々は6DoFグルーピングのためのSE(3)拡散モデルの学習に重点を置いており、関節グルーピングと運動最適化のための新しい枠組みを生み出している。
論文参考訳（メタデータ） (2022-09-08T14:50:23Z)
Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文参考訳（メタデータ） (2022-04-09T22:07:34Z)
Physical Design using Differentiable Learned Simulators [9.380022457753938]
逆設計では、学習したフォワードシミュレータは勾配に基づく設計最適化と組み合わせられる。この枠組みは数百歩の軌跡を伝播することで高品質な設計を行う。この結果から,機械学習をベースとしたシミュレータは,いくつかの課題があるにもかかわらず,汎用設計の最適化をサポートできる段階まで成熟していることが示唆された。
論文参考訳（メタデータ） (2022-02-01T19:56:39Z)
Fit2Form: 3D Generative Model for Robot Gripper Form Design [17.77153086504066]
ロボットのエンドエフェクターの3次元形状は、その機能と全体的な性能を決定する上で重要な役割を果たす。多くの産業アプリケーションは、システムの堅牢性と正確性を保証するためにタスク固有のグリッパー設計に依存している。この研究の目的は、機械学習アルゴリズムを使用してタスク固有のグリップパー指の設計を自動化することである。
論文参考訳（メタデータ） (2020-11-12T17:09:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。