Fugu-MT 論文翻訳(概要): A Learning-based Adaptive Compliance Method for Symmetric Bi-manual Manipulation

論文の概要: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual Manipulation

arxiv url: http://arxiv.org/abs/2303.15262v2
Date: Fri, 19 Jul 2024 12:53:52 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-23 00:35:58.397658
Title: A Learning-based Adaptive Compliance Method for Symmetric Bi-manual Manipulation
Title（参考訳）: シンメトリバイマニュアルマニピュレーションのための学習型適応コンプライアンス手法
Authors: Yuxue Cao, Wenbo Zhao, Shengjie Wang, Xiang Zheng, Wenke Ma, Zhaolei Wang, Tao Zhang,
Abstract要約: シンメトリバイマニュアル操作は、軌道上での操作において必須のスキルである。従来の手法では、モーションプランニングとコンプライアンスコントロールは2つの別々のモジュールと見なされてきた。本稿では,対称的双方向操作の効率性とロバスト性を向上させる学習型適応コンプライアンスアルゴリズム(LAC)を提案する。
参考スコア（独自算出の注目度）: 13.061684545690882
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Symmetric bi-manual manipulation is an essential skill in on-orbit operations due to its potent load capacity. Previous works have applied compliant control to maintain the stability of manipulations. However, traditional methods have viewed motion planning and compliant control as two separate modules, which can lead to conflicts with the simultaneous change of the desired trajectory and impedance parameters in the presence of external forces and disturbances. Additionally, the joint usage of these two modules requires experts to manually adjust parameters. To achieve high efficiency while enhancing adaptability, we propose a novel Learning-based Adaptive Compliance algorithm (LAC) that improves the efficiency and robustness of symmetric bi-manual manipulation. Specifically, the algorithm framework integrates desired trajectory generation and impedance-parameter adjustment under a unified framework to mitigate contradictions and improve efficiency. Second, we introduce a centralized Actor-Critic framework with LSTM networks preprocessing the force states, enhancing the synchronization of bi-manual manipulation. When evaluated in dual-arm peg-in-hole assembly experiments, our method outperforms baseline algorithms in terms of optimality and robustness.
Abstract（参考訳）: シンメトリバイマニュアル操作は、その強力な負荷容量のため、軌道上での操作において必須のスキルである。従来の作業では、操作の安定性を維持するためにコンプライアンス制御を適用していた。しかし、従来の手法では、運動計画とコンプライアンス制御を2つの別々のモジュールと見なしており、これは、外力や乱れの存在下での所望の軌道とインピーダンスパラメータの同時変化と矛盾する可能性がある。さらに、これら2つのモジュールの併用には、専門家がパラメータを手動で調整する必要がある。適応性を高めつつ高い効率性を実現するために,対称的双方向操作の効率性と堅牢性を向上させる学習ベース適応コンプライアンスアルゴリズム(LAC)を提案する。具体的には、所望の軌道生成とインピーダンスパラメータ調整を統合し、矛盾を緩和し効率を向上させる。第2に、LSTMネットワークを用いた集中型アクター・クライブフレームワークを導入し、力状態の事前処理を行い、バイマニュアル操作の同期性を向上させる。両腕ペグ・イン・ホール組立実験において,本手法は最適性とロバスト性の観点から,ベースラインアルゴリズムよりも優れていた。

関連論文リスト

Merging Beyond: Streaming LLM Updates via Activation-Guided Rotations [55.047454145941366]
Streaming Mergingは、反復最適化プロセスとしてマージを概念化する革新的なモデル更新パラダイムである。 ARMは勾配勾配勾配のダイナミクスを近似するために設計された戦略である。 ARMは初期のSFTチェックポイントしか必要とせず、反復的なマージによって完全に収束したSFTモデルを上回る。
論文参考訳（メタデータ） (2026-02-03T08:15:57Z)
Problem-Parameter-Free Decentralized Bilevel Optimization [31.15538292038612]
分散型の双方向最適化は、大規模な機械学習問題を解決する上で重要な役割を担っているため、大きな注目を集めている。本稿では,AdaSDBOを提案する。AdaSDBOは単一ループ構造を持つ分散二段階最適化のための完全問題フリーアルゴリズムである。厳密な理論解析により、AdaSDBO が$widetildemathcalOleft(frac1Tright)$ の収束率を達成できることを確認した。
論文参考訳（メタデータ） (2025-10-28T10:50:04Z)
Backscatter Device-aided Integrated Sensing and Communication: A Pareto Optimization Framework [59.30060797118097]
統合センシング・通信(ISAC)システムは、密集した都市非視線シナリオにおいて大きな性能劣化に遭遇する可能性がある。本稿では,自然環境に分散した受動的BDを利用した後方散乱近似(BD)支援ISACシステムを提案する。
論文参考訳（メタデータ） (2025-07-12T17:11:06Z)
Stochastic Primal-Dual Double Block-Coordinate for Two-way Partial AUC Maximization [56.805574957824135]
2方向部分AUCAUCは、不均衡なデータを持つバイナリ分類における重要な性能指標である。 TPAUC最適化のための既存のアルゴリズムは未探索のままである。 TPAUC最適化のための2つの革新的な二重座標ブロック座標アルゴリズムを導入する。
論文参考訳（メタデータ） (2025-05-28T03:55:05Z)
Joint Transmit and Pinching Beamforming for Pinching Antenna Systems (PASS): Optimization-Based or Learning-Based? [89.05848771674773]
MISO (Multiple-input Single-output) フレームワークを提案する。それは複数の導波路で構成されており、多数の低コストアンテナ(PA)を備えている。 PAの位置は、大規模パスと空間の両方にまたがるように再構成することができる。
論文参考訳（メタデータ） (2025-02-12T18:54:10Z)
GainAdaptor: Learning Quadrupedal Locomotion with Dual Actors for Adaptable and Energy-Efficient Walking on Various Terrains [0.8739101659113157]
深部強化学習(DRL)は、課題のある環境で脚のあるロボットを制御する革新的なソリューションとして登場した。本稿では、地形適応性とエネルギー効率を向上させるために、共同PDゲインを自律的に調整する適応利得制御フレームワークGainAdaptorを提案する。本手法の有効性を,Unitree Go1ロボットを用いた実験により検証し,様々な地形における移動性能の向上を実証した。
論文参考訳（メタデータ） (2024-12-12T18:06:22Z)
Neural Projected Quantum Dynamics: a systematic study [0.0]
ニューラル量子状態を用いた大規模システムにおけるユニタリ量子力学のシミュレーションの課題に対処する。この研究は、予測時間依存変分モンテカルロ法(p-tVMC)の包括的な形式化を提供する。
論文参考訳（メタデータ） (2024-10-14T17:01:33Z)
Regularized Adaptive Momentum Dual Averaging with an Efficient Inexact Subproblem Solver for Training Structured Neural Network [9.48424754175943]
本稿では、構造化ニューラルネットワークのトレーニングのための正規化適応モーメントデュアル平均化(RAMDA)を提案する。定常収束点における正則化器によって誘導される理想構造が得られることを示す。大規模コンピュータビジョン、言語モデリング、音声タスクの実験では、提案されたRAMDAは効率的であり、構造化ニューラルネットワークのトレーニングのための技術よりも一貫して優れていることが示されている。
論文参考訳（メタデータ） (2024-03-21T13:43:49Z)
Towards Continual Learning Desiderata via HSIC-Bottleneck Orthogonalization and Equiangular Embedding [55.107555305760954]
本稿では,レイヤワイドパラメータのオーバーライトや決定境界の歪みに起因する,概念的にシンプルで効果的な手法を提案する。提案手法は,ゼロの指数バッファと1.02倍の差が絶対的に優れていても,競争精度が向上する。
論文参考訳（メタデータ） (2024-01-17T09:01:29Z)
Stochastic Optimal Control Matching [53.156277491861985]
最適制御のための新しい反復拡散最適化(IDO)技術である最適制御マッチング(SOCM)を導入する。この制御は、一致するベクトル場に適合しようとすることで、最小二乗問題を通じて学習される。実験により,本アルゴリズムは最適制御のための既存のすべての IDO 手法よりも低い誤差を実現する。
論文参考訳（メタデータ） (2023-12-04T16:49:43Z)
Actively Learning Reinforcement Learning: A Stochastic Optimal Control Approach [3.453622106101339]
本研究では,2つの相互に結びついた目的を達成するための枠組みを提案する。 (i) 積極的な探索と意図的な情報収集を伴う強化学習と, (ii) 最適制御法の計算的難易度を克服する枠組みである。我々は、強化学習を用いて最適制御則を計算することにより、両方の目的にアプローチする。一定の探索と搾取バランスとは異なり、学習プロセスが終了しても、警告と探索はリアルタイムでコントローラによって自動的に行われる。
論文参考訳（メタデータ） (2023-09-18T18:05:35Z)
Meta-Learning Adversarial Bandit Algorithms [55.72892209124227]
我々は,バンディットフィードバックを用いたオンラインメタラーニングについて研究する。我々は自己協和障壁正規化器を用いてオンラインミラー降下一般化(OMD)をチューニングすることを学ぶ。
論文参考訳（メタデータ） (2023-07-05T13:52:10Z)
Tree ensemble kernels for Bayesian optimization with known constraints over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文参考訳（メタデータ） (2022-07-02T16:59:37Z)
Comparative analysis of machine learning methods for active flow control [60.53767050487434]
遺伝的プログラミング(GP)と強化学習(RL)はフロー制御において人気を集めている。この研究は2つの比較分析を行い、地球規模の最適化手法に対して最も代表的なアルゴリズムのいくつかをベンチマークする。
論文参考訳（メタデータ） (2022-02-23T18:11:19Z)
Adaptive Stochastic ADMM for Decentralized Reinforcement Learning in Edge Industrial IoT [106.83952081124195]
強化学習 (Reinforcement Learning, RL) は, 意思決定および最適制御プロセスのための有望な解法として広く研究されている。本稿では,Adaptive ADMM (asI-ADMM)アルゴリズムを提案する。実験の結果,提案アルゴリズムは通信コストやスケーラビリティの観点から技術状況よりも優れており,複雑なIoT環境に適応できることがわかった。
論文参考訳（メタデータ） (2021-06-30T16:49:07Z)
Data-Driven Optimized Tracking Control Heuristic for MIMO Structures: A Balance System Case Study [8.035375408614776]
PIDは2入力の2アウトプットバランスシステムで示される。自己調整型非線形しきい値とニューラルネットワークを統合し、所望の過渡特性と定常特性を妥協する。ニューラルネットワークは、客観的コスト関数のような重み付き導関数の最適化を訓練する。
論文参考訳（メタデータ） (2021-04-01T02:00:20Z)
Preference-Based Learning for User-Guided HZD Gait Generation on Bipedal Walking Robots [31.994815173888806]
本稿では,制御理論と機械学習を併用して,安定かつ頑健な二足歩行を実現する枠組みを提案する。その結果、このフレームワークは、シミュレーション環境に依存することなく、50回未満のイテレーションで安定で、堅牢で、効率的で、そして、自然な歩行を実現することがわかった。
論文参考訳（メタデータ） (2020-11-10T22:15:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。