論文の概要: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual
Manipulation
- arxiv url: http://arxiv.org/abs/2303.15262v1
- Date: Mon, 27 Mar 2023 14:51:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 14:56:11.255067
- Title: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual
Manipulation
- Title(参考訳): 対称バイマニュアルマニピュレーションのための学習型適応コンプライアンス手法
- Authors: Yuxue Cao and Shengjie Wang and Xiang Zheng and Wenke Ma and Tao Zhang
- Abstract要約: 本稿では,対称的双方向操作の効率性とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(LAC)を提案する。
LSTMネットワークを用いたActor-Criticフレームワークを導入し、双方向操作の同期性を向上させる。
両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。
- 参考スコア(独自算出の注目度): 12.1653210014464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symmetric bi-manual manipulation is essential for various on-orbit operations
due to its potent load capacity. As a result, there exists an emerging research
interest in the problem of achieving high operation accuracy while enhancing
adaptability and compliance. However, previous works relied on an inefficient
algorithm framework that separates motion planning from compliant control.
Additionally, the compliant controller lacks robustness due to manually
adjusted parameters. This paper proposes a novel Learning-based Adaptive
Compliance algorithm (LAC) that improves the efficiency and robustness of
symmetric bi-manual manipulation. Specifically, first, the algorithm framework
combines desired trajectory generation with impedance-parameter adjustment to
improve efficiency and robustness. Second, we introduce a centralized
Actor-Critic framework with LSTM networks, enhancing the synchronization of
bi-manual manipulation. LSTM networks pre-process the force states obtained by
the agents, further ameliorating the performance of compliance operations. When
evaluated in the dual-arm cooperative handling and peg-in-hole assembly
experiments, our method outperforms baseline algorithms in terms of optimality
and robustness.
- Abstract(参考訳): シンメトリバイマニュアル操作は、その強力な負荷容量のため、様々な軌道上の操作に不可欠である。
その結果,適応性とコンプライアンスを向上しつつ,高い操作精度を実現するという課題に注目が集まっている。
しかし、以前の作業では、動作計画とコンプライアンス制御を分離する非効率なアルゴリズムフレームワークに依存していた。
さらに、コンプライアンスコントローラは、手動でパラメータを調整するため、堅牢性に欠ける。
本稿では,対称双方向操作の効率とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(lac)を提案する。
具体的には、まず、所望の軌道生成とインピーダンスパラメータ調整を組み合わせて効率と堅牢性を向上させる。
第2に,LSTMネットワークを用いたActor-Criticフレームワークを導入し,双方向操作の同期性を向上させる。
LSTMネットワークはエージェントによって得られる力状態を前処理し、コンプライアンス操作の性能をさらに改善する。
両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。
関連論文リスト
- Neural Projected Quantum Dynamics: a systematic study [0.0]
ニューラル量子状態を用いた大規模システムにおけるユニタリ量子力学のシミュレーションの課題に対処する。
この研究は、予測時間依存変分モンテカルロ法(p-tVMC)の包括的な形式化を提供する。
論文 参考訳(メタデータ) (2024-10-14T17:01:33Z) - Regularized Adaptive Momentum Dual Averaging with an Efficient Inexact Subproblem Solver for Training Structured Neural Network [9.48424754175943]
本稿では、構造化ニューラルネットワークのトレーニングのための正規化適応モーメントデュアル平均化(RAMDA)を提案する。
定常収束点における正則化器によって誘導される理想構造が得られることを示す。
大規模コンピュータビジョン、言語モデリング、音声タスクの実験では、提案されたRAMDAは効率的であり、構造化ニューラルネットワークのトレーニングのための技術よりも一貫して優れていることが示されている。
論文 参考訳(メタデータ) (2024-03-21T13:43:49Z) - Towards Continual Learning Desiderata via HSIC-Bottleneck
Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。
提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文 参考訳(メタデータ) (2024-01-17T09:01:29Z) - Stochastic Optimal Control Matching [53.156277491861985]
最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。
この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。
実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文 参考訳(メタデータ) (2023-12-04T16:49:43Z) - Actively Learning Reinforcement Learning: A Stochastic Optimal Control Approach [3.453622106101339]
本研究では,2つの相互に結びついた目的を達成するための枠組みを提案する。 (i) 積極的な探索と意図的な情報収集を伴う強化学習と, (ii) 最適制御法の計算的難易度を克服する枠組みである。
我々は、強化学習を用いて最適制御則を計算することにより、両方の目的にアプローチする。
一定の探索と搾取バランスとは異なり、学習プロセスが終了しても、警告と探索はリアルタイムでコントローラによって自動的に行われる。
論文 参考訳(メタデータ) (2023-09-18T18:05:35Z) - Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。
我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文 参考訳(メタデータ) (2023-07-05T13:52:10Z) - Tree ensemble kernels for Bayesian optimization with known constraints
over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。
ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。
我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-02T16:59:37Z) - Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。
この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文 参考訳(メタデータ) (2022-02-23T18:11:19Z) - Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in
Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。
本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。
実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文 参考訳(メタデータ) (2021-06-30T16:49:07Z) - Data-Driven Optimized Tracking Control Heuristic for MIMO Structures: A
Balance System Case Study [8.035375408614776]
PIDは2入力の2アウトプットバランスシステムで示される。
自己調整型非線形しきい値とニューラルネットワークを統合し、所望の過渡特性と定常特性を妥協する。
ニューラルネットワークは、客観的コスト関数のような重み付き導関数の最適化を訓練する。
論文 参考訳(メタデータ) (2021-04-01T02:00:20Z) - Preference-Based Learning for User-Guided HZD Gait Generation on Bipedal
Walking Robots [31.994815173888806]
本稿では,制御理論と機械学習を併用して,安定かつ頑健な二足歩行を実現する枠組みを提案する。
その結果、このフレームワークは、シミュレーション環境に依存することなく、50回未満のイテレーションで安定で、堅牢で、効率的で、そして、自然な歩行を実現することがわかった。
論文 参考訳(メタデータ) (2020-11-10T22:15:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。