論文の概要: Heuristic-free Optimization of Force-Controlled Robot Search Strategies
in Stochastic Environments
- arxiv url: http://arxiv.org/abs/2207.07524v1
- Date: Fri, 15 Jul 2022 15:16:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-18 17:05:38.619242
- Title: Heuristic-free Optimization of Force-Controlled Robot Search Strategies
in Stochastic Environments
- Title(参考訳): 確率環境における力制御型ロボット探索戦略のヒューリスティックフリー最適化
- Authors: Benjamin Alt, Darko Katic, Rainer J\"akel and Michael Beetz
- Abstract要約: 比較的単純なペグ・イン・ホールのタスクであっても、通常、穴のような関連する特徴を見つけるために探索動作を必要とする。
本稿では,検索戦略を最適化するための自動,データ駆動型,条件付フリーな手法を提案する。
我々は、THT電子部品のスパイラルとプローブ探索の文脈において、2つの異なる産業用ロボットに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 13.622757453459748
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In both industrial and service domains, a central benefit of the use of
robots is their ability to quickly and reliably execute repetitive tasks.
However, even relatively simple peg-in-hole tasks are typically subject to
stochastic variations, requiring search motions to find relevant features such
as holes. While search improves robustness, it comes at the cost of increased
runtime: More exhaustive search will maximize the probability of successfully
executing a given task, but will significantly delay any downstream tasks. This
trade-off is typically resolved by human experts according to simple
heuristics, which are rarely optimal. This paper introduces an automatic,
data-driven and heuristic-free approach to optimize robot search strategies. By
training a neural model of the search strategy on a large set of simulated
stochastic environments, conditioning it on few real-world examples and
inverting the model, we can infer search strategies which adapt to the
time-variant characteristics of the underlying probability distributions, while
requiring very few real-world measurements. We evaluate our approach on two
different industrial robots in the context of spiral and probe search for THT
electronics assembly.
- Abstract(参考訳): 産業とサービスの両方において、ロボットの使用の主な利点は、反復的なタスクを迅速かつ確実に実行できることである。
しかし、比較的単純なペグ・イン・ホールのタスクは、通常、確率的な変化を伴い、穴のような関連する特徴を見つけるために探索運動を必要とする。
より徹底的な検索は、与えられたタスクを正常に実行する確率を最大化するが、ダウンストリームタスクを著しく遅らせる。
このトレードオフは通常、単純なヒューリスティックスによって人間の専門家によって解決される。
本稿では,ロボット検索戦略を最適化するための,自動的,データ駆動型,ヒューリスティックなアプローチを提案する。
シミュレーションされた確率環境上で探索戦略のニューラルモデルをトレーニングし、実世界の例をほとんど残さず、モデルを逆転させることにより、基礎となる確率分布の時間変化特性に適応する探索戦略を推測できるが、実世界の測定は極めて少ない。
tht電子部品のスパイラルおよびプローブ探索の文脈における2つの異なる産業用ロボットのアプローチを評価した。
関連論文リスト
- Fully Automated Correlated Time Series Forecasting in Minutes [31.198713853170375]
本稿では,完全に自動化された高効率な時系列予測フレームワークを提案する。
これには、データ駆動の反復戦略が含まれており、大きな検索スペースを自動でプーンし、新しい予測タスクのための高品質な検索スペースを得る。
7つのベンチマークデータセットの実験は、このフレームワークが最先端の精度を持ち、既存の方法よりもはるかに効率的であることを示す。
論文 参考訳(メタデータ) (2024-11-06T09:02:13Z) - Sparse Diffusion Policy: A Sparse, Reusable, and Flexible Policy for Robot Learning [61.294110816231886]
我々はスパース・リユース・フレキシブル・ポリシー、スパース・ディフュージョン・ポリシー(SDP)を導入する。
SDPは、エキスパートとスキルを選択的に活性化し、モデル全体をトレーニングすることなく、効率的でタスク固有の学習を可能にする。
デモとコードはhttps://forrest-110.io/sparse_diffusion_policy/にある。
論文 参考訳(メタデータ) (2024-07-01T17:59:56Z) - Comparing Active Learning Performance Driven by Gaussian Processes or
Bayesian Neural Networks for Constrained Trajectory Exploration [0.0]
現在、人間は科学的な目的を達成するためにロボットを駆動しているが、ロボットの位置によっては、情報交換と駆動コマンドがミッション遂行に不適切な遅延を引き起こす可能性がある。
科学的目的と探索戦略で符号化された自律ロボットは、通信遅延を発生させず、ミッションをより迅速に達成することができる。
能動学習アルゴリズムは知的探索の能力を提供するが、その基盤となるモデル構造は、環境の理解を正確に形成する際に、能動学習アルゴリズムの性能を変化させる。
論文 参考訳(メタデータ) (2023-09-28T02:45:14Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - GUTS: Generalized Uncertainty-Aware Thompson Sampling for Multi-Agent
Active Search [5.861092453610268]
一般化された不確実性認識型トンプソンサンプリング (GUTS) アルゴリズムは, 大規模非構造環境における能動探索のための異種マルチロボットシステムへの展開に適したアルゴリズムである。
探索面積が75,000 sq.mの非構造環境におけるマルチロボットシステムを用いたフィールドテストを行った。
論文 参考訳(メタデータ) (2023-04-04T18:58:16Z) - Domain Randomization for Robust, Affordable and Effective Closed-loop
Control of Soft Robots [10.977130974626668]
ソフトロボットは、コンタクトや適応性に対する本質的な安全性によって人気を集めている。
本稿では、ソフトロボットのRLポリシーを強化することにより、ドメインランダム化(DR)がこの問題を解決する方法を示す。
本稿では,変形可能なオブジェクトに対する動的パラメータの自動推論のための,従来の適応的領域ランダム化手法に対する新しいアルゴリズム拡張を提案する。
論文 参考訳(メタデータ) (2023-03-07T18:50:00Z) - TransPath: Learning Heuristics For Grid-Based Pathfinding via
Transformers [64.88759709443819]
探索の効率を顕著に向上させると考えられる,インスタンス依存のプロキシを学習することを提案する。
私たちが最初に学ぶことを提案するプロキシは、補正係数、すなわち、インスタンスに依存しないコスト・ツー・ゴの見積もりと完璧な見積もりの比率である。
第2のプロキシはパス確率であり、グリッドセルが最も短いパスに横たわっている可能性を示している。
論文 参考訳(メタデータ) (2022-12-22T14:26:11Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Robotic Brain Storm Optimization: A Multi-target Collaborative Searching
Paradigm for Swarm Robotics [24.38312890501329]
本稿では,ロボットBSOと呼ばれる群ロボットのためのBSOベースの協調探索フレームワークを提案する。
提案手法はBSOの誘導探索特性をシミュレートし,Swarm Robotics のマルチターゲット探索問題に優れた可能性を持つ。
論文 参考訳(メタデータ) (2021-05-27T13:05:48Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。