論文の概要: Stability-Guided Exploration for Diverse Motion Generation
- arxiv url: http://arxiv.org/abs/2603.06773v1
- Date: Fri, 06 Mar 2026 17:53:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.006229
- Title: Stability-Guided Exploration for Diverse Motion Generation
- Title(参考訳): 水平運動生成のための安定誘導探索
- Authors: Eckart Cobo-Briesewitz, Tilman Burghoff, Denis Shcherba, Armand Jordana, Marc Toussaint,
- Abstract要約: データセットのスケールアップは、ディープラーニングモデルのパフォーマンス向上に非常に効果的です。
人間のデモの収集に依存するアプローチは、労働集約的で本質的に制限されている。
そこで本研究では,ブラックボックスシミュレーションにより,多種多様な長距離操作を検出できる新しい手法を提案する。
- 参考スコア(独自算出の注目度): 9.57948108713335
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scaling up datasets is highly effective in improving the performance of deep learning models, including in the field of robot learning. However, data collection still proves to be a bottleneck. Approaches relying on collecting human demonstrations are labor-intensive and inherently limited: they tend to be narrow, task-specific, and fail to adequately explore the full space of feasible states. Synthetic data generation could remedy this, but current techniques mostly rely on local trajectory optimization and fail to find diverse solutions. In this work, we propose a novel method capable of finding diverse long-horizon manipulations through black-box simulation. We achieve this by combining an RRT-style search with sampling-based MPC, together with a novel sampling scheme that guides the exploration toward stable configurations. Specifically, we sample from a manifold of stable states while growing a search tree directly through simulation, without restricting the planner to purely stable motions. We demonstrate the method's ability to discover diverse manipulation strategies, including pushing, grasping, pivoting, throwing, and tool use, across different robot morphologies, without task-specific guidance.
- Abstract(参考訳): データセットのスケールアップは、ロボット学習の分野を含むディープラーニングモデルのパフォーマンス向上に非常に効果的である。
しかし、データ収集は依然としてボトルネックであることが証明されている。
人間のデモンストレーションの収集に依存するアプローチは、労働集約的で本質的に限定的であり、狭く、タスク固有のものであり、実現可能な状態の全空間を適切に探索することができない。
合成データ生成はこれに対処するが、現在の手法は主に局所的な軌道最適化に依存しており、多様な解決策を見つけることができない。
そこで本研究では,ブラックボックスシミュレーションにより,多種多様な長距離操作を検出できる新しい手法を提案する。
我々は、RTスタイルの探索とサンプリングベースのMPCを組み合わせることで、安定した構成への探索を導く新しいサンプリングスキームを実現する。
具体的には、プラナーを純粋に安定な運動に制限することなく、シミュレーションを通して探索木を直接成長させながら、安定な状態の多様体からサンプリングする。
タスク固有のガイダンスを使わずに、異なるロボット形態をまたいで、プッシュ、グリップ、ピボット、投げ、ツール使用を含む多様な操作戦略を発見できる方法の能力を実証する。
関連論文リスト
- Ada3Drift: Adaptive Training-Time Drifting for One-Step 3D Visuomotor Robotic Manipulation [53.750389076941396]
拡散に基づくビジュモータポリシーは反復的認知を通じて多モーダルな動作分布をキャプチャするが、その高い推論遅延はリアルタイムロボット制御を制限する。
Ada3Driftは,専門家のデモモードに対して予測された行動を引き付ける訓練時間ドリフト場を学習する。
Ada3Driftは、拡散ベースの代替よりも10倍の関数評価を必要としながら、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-12T14:36:53Z) - Diversity You Can Actually Measure: A Fast, Model-Free Diversity Metric for Robotics Datasets [12.45101201787042]
ロボット模倣学習におけるデータセットの多様性が一般化性能に与える影響について検討する。
本稿では、エントロピーを最大化するデモのサブセットを選択するデータキュレーションアルゴリズムであるFAKTUALを紹介する。
FAKTUALは,ロボット模倣学習において,データセットの多様性を理解し,改善するための実用的なツールであることが示唆された。
論文 参考訳(メタデータ) (2026-03-12T07:54:43Z) - Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Iterative Tool Usage Exploration for Multimodal Agents via Step-wise Preference Tuning [68.00304954972232]
コントローラ、例えば視覚言語モデルと外部ツールを統合するマルチモーダルエージェントは、複雑なマルチモーダルタスクに対処する際、顕著な能力を示した。
これらのエージェントを訓練するための既存のアプローチは、広範囲なヒューマン・アノテートされたタスク・アンサー・ペアとツール・トラジェクトリに依存している。
本研究では,事前に収集したデータのないマルチモーダルエージェント,すなわち SPORT の反復ツール利用探索手法を提案する。
Sportには、タスク合成、ステップサンプリング、ステップ検証、優先度調整の4つの反復的なコンポーネントがある。
論文 参考訳(メタデータ) (2025-04-30T12:01:27Z) - E2R: a Hierarchical-Learning inspired Novelty-Search method to generate diverse repertoires of grasping trajectories [0.0]
プラットフォームに依存しない方法で軌道を把握できる大規模なデータセットを生成できるNSベースの新しい手法を提案する。
階層的な学習パラダイムにインスパイアされた我々の手法は、行動空間をより滑らかにするためにアプローチと理解を分離する。
3つの異なるロボットグルーパーのセットアップといくつかの標準オブジェクトによる実験により,本手法は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-10-14T15:13:10Z) - Multitask Adaptation by Retrospective Exploration with Learned World
Models [77.34726150561087]
本稿では,タスク非依存ストレージから取得したMBRLエージェントのトレーニングサンプルを提供するRAMaというメタ学習型アドレッシングモデルを提案する。
このモデルは、期待されるエージェントのパフォーマンスを最大化するために、ストレージから事前のタスクを解く有望な軌道を選択することで訓練される。
論文 参考訳(メタデータ) (2021-10-25T20:02:57Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Autonomous UAV Exploration of Dynamic Environments via Incremental
Sampling and Probabilistic Roadmap [0.3867363075280543]
インクリメンタルサンプリングと確率的ロードマップ(PRM)を用いた未知環境探索のための新しい動的探索プランナ(DEP)を提案する。
本手法は, 動的環境を安全に探索し, 探索時間, 経路長, 計算時間でベンチマークプランナーより優れている。
論文 参考訳(メタデータ) (2020-10-14T22:52:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。