論文の概要: Towards Space-Based Environmentally-Adaptive Grasping
- arxiv url: http://arxiv.org/abs/2601.21394v1
- Date: Thu, 29 Jan 2026 08:31:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.001642
- Title: Towards Space-Based Environmentally-Adaptive Grasping
- Title(参考訳): 空間型環境適応型グラスピングを目指して
- Authors: Leonidas Askianakis, Aleksandr Artemov,
- Abstract要約: 宇宙環境における把握の例を通して,限界について検討する。
我々は、複数のモダリティを、ポリシー決定のための構造化された表現に融合(文法化)する学習された潜在多様体において、制御ポリシーを直接学習する。
- 参考スコア(独自算出の注目度): 45.88028371034407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic manipulation in unstructured environments requires reliable execution under diverse conditions, yet many state-of-the-art systems still struggle with high-dimensional action spaces, sparse rewards, and slow generalization beyond carefully curated training scenarios. We study these limitations through the example of grasping in space environments. We learn control policies directly in a learned latent manifold that fuses (grammarizes) multiple modalities into a structured representation for policy decision-making. Building on GPU-accelerated physics simulation, we instantiate a set of single-shot manipulation tasks and achieve over 95% task success with Soft Actor-Critic (SAC)-based reinforcement learning in less than 1M environment steps, under continuously varying grasping conditions from step 1. This empirically shows faster convergence than representative state-of-the-art visual baselines under the same open-loop single-shot conditions. Our analysis indicates that explicitly reasoning in latent space yields more sample-efficient learning and improved robustness to novel object and gripper geometries, environmental clutter, and sensor configurations compared to standard baselines. We identify remaining limitations and outline directions toward fully adaptive and generalizable grasping in the extreme conditions of space.
- Abstract(参考訳): 構造化されていない環境でのロボット操作は、様々な条件下での信頼性の高い実行を必要とするが、多くの最先端システムは、高次元のアクション空間、スパース報酬、そして慎重にキュレートされたトレーニングシナリオを超えて緩やかな一般化に苦慮している。
宇宙環境における把握の例を通して,これらの制限について検討する。
我々は、複数のモダリティを、ポリシー決定のための構造化された表現に融合(文法化)する学習された潜在多様体において、制御ポリシーを直接学習する。
GPU加速物理シミュレーションに基づいて、単発操作タスクのセットをインスタンス化し、ステップ1から連続的に把握された条件の下で、ソフトアクタ・クリティカル(SAC)ベースの強化学習を100万以下の環境ステップで95%以上のタスク成功を達成する。
これは、同じオープンループ単発条件下で、最先端の視覚ベースラインよりも高速な収束を示す。
解析の結果,潜時空間における明示的に推論することで,サンプル効率のよい学習が可能となり,新しい物体やグリップ・ジオメトリ,環境クラッタ,センサ構成が標準基準よりも堅牢になった。
空間の極端な条件下で、残りの制限を識別し、完全に適応的で一般化可能な把握に向けた方向性を概説する。
関連論文リスト
- Learning Object-Centric Spatial Reasoning for Sequential Manipulation in Cluttered Environments [0.0]
我々は,低レベルの行動実行から高レベルの空間的推論を分離するフレームワークUnveilerを提案する。
この分離されたアーキテクチャは、パラメータ数と推論時間の観点からより計算的に効率的であることを示す。
シミュレーションでは,97.6%の成功率,90.0%の完全閉塞シナリオを達成し,複雑な操作タスクにおけるオブジェクト中心推論の能力について考察した。
論文 参考訳(メタデータ) (2026-03-03T01:45:53Z) - A New Dataset and Framework for Robust Road Surface Classification via Camera-IMU Fusion [3.571515153090507]
道路表面分類(RSC)は、環境に配慮した予測保守システムにおいて重要な実現法である。
既存のRCC技術は、狭い運用条件を超えた一般化に失敗することが多い。
この研究は、画像と慣性測定を融合するマルチモーダルフレームワークを導入している。
論文 参考訳(メタデータ) (2026-01-28T18:46:29Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - RISE: Robust Imitation through Stochastic Encoding [0.764671395172401]
本稿では,環境パラメータの誤った測定をポリシー学習に明示的に対応させる,新しい模倣学習フレームワークを提案する。
我々のフレームワークは、障害状態、向き、速度などのパラメータを潜在空間にエンコードし、テスト時間を改善する。
我々は,2つのロボットプラットフォームに対するアプローチを検証するとともに,目標達成性能をベースライン法と比較し,安全性の向上を図っている。
論文 参考訳(メタデータ) (2025-03-15T19:52:16Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Composable Learning with Sparse Kernel Representations [110.19179439773578]
再生カーネルヒルベルト空間におけるスパース非パラメトリック制御系を学習するための強化学習アルゴリズムを提案する。
正規化アドバンテージ関数を通じてステートアクション関数の構造を付与することにより、このアプローチのサンプル複雑さを改善します。
2次元環境下を走行しながらレーザースキャナーを搭載したロボットの複数シミュレーションにおける障害物回避政策の学習に関するアルゴリズムの性能を実証する。
論文 参考訳(メタデータ) (2021-03-26T13:58:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。