論文の概要: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual
Manipulation
- arxiv url: http://arxiv.org/abs/2303.15262v1
- Date: Mon, 27 Mar 2023 14:51:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 14:56:11.255067
- Title: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual
Manipulation
- Title(参考訳): 対称バイマニュアルマニピュレーションのための学習型適応コンプライアンス手法
- Authors: Yuxue Cao and Shengjie Wang and Xiang Zheng and Wenke Ma and Tao Zhang
- Abstract要約: 本稿では,対称的双方向操作の効率性とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(LAC)を提案する。
LSTMネットワークを用いたActor-Criticフレームワークを導入し、双方向操作の同期性を向上させる。
両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。
- 参考スコア(独自算出の注目度): 12.1653210014464
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Symmetric bi-manual manipulation is essential for various on-orbit operations
due to its potent load capacity. As a result, there exists an emerging research
interest in the problem of achieving high operation accuracy while enhancing
adaptability and compliance. However, previous works relied on an inefficient
algorithm framework that separates motion planning from compliant control.
Additionally, the compliant controller lacks robustness due to manually
adjusted parameters. This paper proposes a novel Learning-based Adaptive
Compliance algorithm (LAC) that improves the efficiency and robustness of
symmetric bi-manual manipulation. Specifically, first, the algorithm framework
combines desired trajectory generation with impedance-parameter adjustment to
improve efficiency and robustness. Second, we introduce a centralized
Actor-Critic framework with LSTM networks, enhancing the synchronization of
bi-manual manipulation. LSTM networks pre-process the force states obtained by
the agents, further ameliorating the performance of compliance operations. When
evaluated in the dual-arm cooperative handling and peg-in-hole assembly
experiments, our method outperforms baseline algorithms in terms of optimality
and robustness.
- Abstract(参考訳): シンメトリバイマニュアル操作は、その強力な負荷容量のため、様々な軌道上の操作に不可欠である。
その結果,適応性とコンプライアンスを向上しつつ,高い操作精度を実現するという課題に注目が集まっている。
しかし、以前の作業では、動作計画とコンプライアンス制御を分離する非効率なアルゴリズムフレームワークに依存していた。
さらに、コンプライアンスコントローラは、手動でパラメータを調整するため、堅牢性に欠ける。
本稿では,対称双方向操作の効率とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(lac)を提案する。
具体的には、まず、所望の軌道生成とインピーダンスパラメータ調整を組み合わせて効率と堅牢性を向上させる。
第2に,LSTMネットワークを用いたActor-Criticフレームワークを導入し,双方向操作の同期性を向上させる。
LSTMネットワークはエージェントによって得られる力状態を前処理し、コンプライアンス操作の性能をさらに改善する。
両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。
関連論文リスト
- Adaptive Bayesian Optimization for High-Precision Motion Systems [2.073673208115137]
低レベル制御パラメータをオンラインチューニングすることで、適応制御のためのリアルタイム純粋データ駆動モデルフリーアプローチを提案する。
我々は安全かつサンプル効率のよいベイズ最適化アルゴリズムであるGoOSEをベースとした。
半導体産業に応用した実精度運動システムにおけるアルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2024-04-22T21:58:23Z) - Regularized Adaptive Momentum Dual Averaging with an Efficient Inexact Subproblem Solver for Training Structured Neural Network [9.48424754175943]
本稿では、構造化ニューラルネットワークのトレーニングのための正規化適応モーメントデュアル平均化(RAMDA)を提案する。
定常収束点における正則化器によって誘導される理想構造が得られることを示す。
大規模コンピュータビジョン、言語モデリング、音声タスクの実験では、提案されたRAMDAは効率的であり、構造化ニューラルネットワークのトレーニングのための技術よりも一貫して優れていることが示されている。
論文 参考訳(メタデータ) (2024-03-21T13:43:49Z) - Federated Conditional Stochastic Optimization [110.513884892319]
条件付き最適化は、不変学習タスク、AUPRC、AMLなど、幅広い機械学習タスクで見られる。
本稿では,分散フェデレーション学習のためのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-10-04T01:47:37Z) - Active RIS-aided EH-NOMA Networks: A Deep Reinforcement Learning
Approach [66.53364438507208]
アクティブな再構成可能なインテリジェントサーフェス(RIS)支援マルチユーザダウンリンク通信システムについて検討した。
非直交多重アクセス(NOMA)はスペクトル効率を向上させるために使用され、活性RISはエネルギー回収(EH)によって駆動される。
ユーザの動的通信状態を予測するために,高度なLSTMベースのアルゴリズムを開発した。
増幅行列と位相シフト行列RISを結合制御するためにDDPGに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-04-11T13:16:28Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Tree ensemble kernels for Bayesian optimization with known constraints
over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。
ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。
我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-02T16:59:37Z) - Meta-Regularization: An Approach to Adaptive Choice of the Learning Rate
in Gradient Descent [20.47598828422897]
第一次下降法における学習率の適応的選択のための新しいアプローチであるtextit-Meta-Regularizationを提案する。
本手法は,正規化項を追加して目的関数を修正し,共同処理パラメータをキャストする。
論文 参考訳(メタデータ) (2021-04-12T13:13:34Z) - Batch Sequential Adaptive Designs for Global Optimization [5.825138898746968]
効率的なグローバル最適化(EGO)は、高価なブラックボックス最適化問題に対する最も一般的なSAD手法の1つである。
これらの複数点のEGO法では、重い計算とポイントのクラスタリングが障害となる。
本研究では, 改良されたサンプリング/インポータンス・リサンプリング(SIR)法を用いて, 「加速EGO」と呼ばれる新しいバッチSAD法を転送する。
提案したSADの効率は,次元が2~12の9つの古典的テスト関数によって検証される。
論文 参考訳(メタデータ) (2020-10-21T01:11:35Z) - Bilevel Optimization: Convergence Analysis and Enhanced Design [63.64636047748605]
バイレベル最適化は多くの機械学習問題に対するツールである。
Stoc-BiO という新しい確率効率勾配推定器を提案する。
論文 参考訳(メタデータ) (2020-10-15T18:09:48Z) - Compositionality of Linearly Solvable Optimal Control in Networked
Multi-Agent Systems [27.544923751902807]
マルチエージェントシステム(MAS)における学習されたコンポーネントタスクから未学習の複合タスクへの最適制御則の一般化手法について議論する。
提案手法は, 離散時間と連続時間の両方において, 協調MASフレームワーク内で同時に制御動作の構成性と最適性を実現する。
論文 参考訳(メタデータ) (2020-09-28T20:21:48Z) - Adaptivity of Stochastic Gradient Methods for Nonconvex Optimization [71.03797261151605]
適応性は現代最適化理論において重要であるが、研究されていない性質である。
提案アルゴリズムは,PL目標に対して既存のアルゴリズムよりも優れた性能を保ちながら,PL目標に対して最適な収束性を実現することを実証した。
論文 参考訳(メタデータ) (2020-02-13T05:42:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。