Fugu-MT 論文翻訳(概要): A Learning-based Adaptive Compliance Method for Symmetric Bi-manual Manipulation

論文の概要: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual Manipulation

arxiv url: http://arxiv.org/abs/2303.15262v1
Date: Mon, 27 Mar 2023 14:51:29 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-28 14:56:11.255067
Title: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual Manipulation
Title（参考訳）: 対称バイマニュアルマニピュレーションのための学習型適応コンプライアンス手法
Authors: Yuxue Cao and Shengjie Wang and Xiang Zheng and Wenke Ma and Tao Zhang
Abstract要約: 本稿では,対称的双方向操作の効率性とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(LAC)を提案する。 LSTMネットワークを用いたActor-Criticフレームワークを導入し、双方向操作の同期性を向上させる。両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。
参考スコア（独自算出の注目度）: 12.1653210014464
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Symmetric bi-manual manipulation is essential for various on-orbit operations due to its potent load capacity. As a result, there exists an emerging research interest in the problem of achieving high operation accuracy while enhancing adaptability and compliance. However, previous works relied on an inefficient algorithm framework that separates motion planning from compliant control. Additionally, the compliant controller lacks robustness due to manually adjusted parameters. This paper proposes a novel Learning-based Adaptive Compliance algorithm (LAC) that improves the efficiency and robustness of symmetric bi-manual manipulation. Specifically, first, the algorithm framework combines desired trajectory generation with impedance-parameter adjustment to improve efficiency and robustness. Second, we introduce a centralized Actor-Critic framework with LSTM networks, enhancing the synchronization of bi-manual manipulation. LSTM networks pre-process the force states obtained by the agents, further ameliorating the performance of compliance operations. When evaluated in the dual-arm cooperative handling and peg-in-hole assembly experiments, our method outperforms baseline algorithms in terms of optimality and robustness.
Abstract（参考訳）: シンメトリバイマニュアル操作は、その強力な負荷容量のため、様々な軌道上の操作に不可欠である。その結果,適応性とコンプライアンスを向上しつつ,高い操作精度を実現するという課題に注目が集まっている。しかし、以前の作業では、動作計画とコンプライアンス制御を分離する非効率なアルゴリズムフレームワークに依存していた。さらに、コンプライアンスコントローラは、手動でパラメータを調整するため、堅牢性に欠ける。本稿では,対称双方向操作の効率とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(lac)を提案する。具体的には、まず、所望の軌道生成とインピーダンスパラメータ調整を組み合わせて効率と堅牢性を向上させる。第2に,LSTMネットワークを用いたActor-Criticフレームワークを導入し,双方向操作の同期性を向上させる。 LSTMネットワークはエージェントによって得られる力状態を前処理し、コンプライアンス操作の性能をさらに改善する。両腕協調処理およびペグ・イン・ホール組立実験で評価すると,本手法は最適性とロバスト性の観点からベースラインアルゴリズムより優れている。

関連論文リスト

Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文参考訳（メタデータ） (2025-07-12T17:11:06Z)
Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [56.805574957824135]
2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。 TPAUC最適化のための既存のアルゴリズムは未探索のままである。 TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文参考訳（メタデータ） (2025-05-28T03:55:05Z)
Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。 PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文参考訳（メタデータ） (2025-02-12T18:54:10Z)
GainAdaptor: Learning Quadrupedal Locomotion with Dual Actors for Adaptable and Energy-Efficient Walking on Various Terrains [0.8739101659113157]
深部強化学習(DRL)は、課題のある環境で脚のあるロボットを制御する革新的なソリューションとして登場した。本稿では、地形適応性とエネルギー効率を向上させるために、共同PDゲインを自律的に調整する適応利得制御フレームワークGainAdaptorを提案する。本手法の有効性を,Unitree Go1ロボットを用いた実験により検証し,様々な地形における移動性能の向上を実証した。
論文参考訳（メタデータ） (2024-12-12T18:06:22Z)
Neural Projected Quantum Dynamics: a systematic study [0.0]
ニューラル量子状態を用いた大規模システムにおけるユニタリ量子力学のシミュレーションの課題に対処する。この研究は、予測時間依存変分モンテカルロ法(p-tVMC)の包括的な形式化を提供する。
論文参考訳（メタデータ） (2024-10-14T17:01:33Z)
Regularized Adaptive Momentum Dual Averaging with an Efficient Inexact Subproblem Solver for Training Structured Neural Network [9.48424754175943]
本稿では、構造化ニューラルネットワークのトレーニングのための正規化適応モーメントデュアル平均化(RAMDA)を提案する。定常収束点における正則化器によって誘導される理想構造が得られることを示す。大規模コンピュータビジョン、言語モデリング、音声タスクの実験では、提案されたRAMDAは効率的であり、構造化ニューラルネットワークのトレーニングのための技術よりも一貫して優れていることが示されている。
論文参考訳（メタデータ） (2024-03-21T13:43:49Z)
Towards Continual Learning Desiderata via HSIC-Bottleneck Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文参考訳（メタデータ） (2024-01-17T09:01:29Z)
Stochastic Optimal Control Matching [53.156277491861985]
最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文参考訳（メタデータ） (2023-12-04T16:49:43Z)
Actively Learning Reinforcement Learning: A Stochastic Optimal Control Approach [3.453622106101339]
本研究では,2つの相互に結びついた目的を達成するための枠組みを提案する。 (i) 積極的な探索と意図的な情報収集を伴う強化学習と, (ii) 最適制御法の計算的難易度を克服する枠組みである。我々は、強化学習を用いて最適制御則を計算することにより、両方の目的にアプローチする。一定の探索と搾取バランスとは異なり、学習プロセスが終了しても、警告と探索はリアルタイムでコントローラによって自動的に行われる。
論文参考訳（メタデータ） (2023-09-18T18:05:35Z)
Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文参考訳（メタデータ） (2023-07-05T13:52:10Z)
Tree ensemble kernels for Bayesian optimization with known constraints over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文参考訳（メタデータ） (2022-07-02T16:59:37Z)
Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文参考訳（メタデータ） (2022-02-23T18:11:19Z)
Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文参考訳（メタデータ） (2021-06-30T16:49:07Z)
Data-Driven Optimized Tracking Control Heuristic for MIMO Structures: A Balance System Case Study [8.035375408614776]
PIDは2入力の2アウトプットバランスシステムで示される。自己調整型非線形しきい値とニューラルネットワークを統合し、所望の過渡特性と定常特性を妥協する。ニューラルネットワークは、客観的コスト関数のような重み付き導関数の最適化を訓練する。
論文参考訳（メタデータ） (2021-04-01T02:00:20Z)
Preference-Based Learning for User-Guided HZD Gait Generation on Bipedal Walking Robots [31.994815173888806]
本稿では,制御理論と機械学習を併用して,安定かつ頑健な二足歩行を実現する枠組みを提案する。その結果、このフレームワークは、シミュレーション環境に依存することなく、50回未満のイテレーションで安定で、堅牢で、効率的で、そして、自然な歩行を実現することがわかった。
論文参考訳（メタデータ） (2020-11-10T22:15:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。