論文の概要: Provably Safe Tolerance Estimation for Robot Arms via Sum-of-Squares
Programming
- arxiv url: http://arxiv.org/abs/2104.08896v1
- Date: Sun, 18 Apr 2021 16:32:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 13:30:49.792527
- Title: Provably Safe Tolerance Estimation for Robot Arms via Sum-of-Squares
Programming
- Title(参考訳): sum-of-squaresプログラミングによるロボットアームの安全許容度推定
- Authors: Weiye Zhao, Suqin He, and Changliu Liu
- Abstract要約: 本稿では,2乗計画法を用いて結合耐性を推定する効率的なアルゴリズムを提案する。
このアルゴリズムがジョイントトレランスの厳密な下限を与えることが理論的に証明されている。
- 参考スコア(独自算出の注目度): 1.2043574473965317
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tolerance estimation problems are prevailing in engineering applications. For
example, in modern robotics, it remains challenging to efficiently estimate
joint tolerance, \ie the maximal allowable deviation from a reference robot
state such that safety constraints are still satisfied. This paper presented an
efficient algorithm to estimate the joint tolerance using sum-of-squares
programming. It is theoretically proved that the algorithm provides a tight
lower bound of the joint tolerance. Extensive numerical studies demonstrate
that the proposed method is computationally efficient and near optimal. The
algorithm is implemented in the JTE toolbox and is available at
\url{https://github.com/intelligent-control-lab/Sum-of-Square-Safety-Optimization}.
- Abstract(参考訳): 耐性推定問題は工学的応用において一般的である。
例えば、現代のロボット工学では、安全上の制約が満たされているような基準ロボット状態からの最大許容範囲の偏差を効率的に推定することは依然として困難である。
本稿では,2乗計画法を用いて結合耐性を推定する効率的なアルゴリズムを提案する。
このアルゴリズムがジョイントトレランスの厳密な下限を与えることが理論的に証明されている。
広範な数値研究により,提案手法は計算効率が高く,ほぼ最適であることが証明された。
このアルゴリズムはJTEツールボックスで実装されており、 \url{https://github.com/intelligent-control-lab/Sum-of-Square-Safety-Optimization}で利用できる。
関連論文リスト
- Best Arm Identification with Fixed Budget: A Large Deviation Perspective [54.305323903582845]
我々は、様々な武器の報酬間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
特に、様々な武器の報酬の間の経験的ギャップに基づいて、あらゆるラウンドで腕を拒絶できる真に適応的なアルゴリズムであるsredを提示する。
論文 参考訳(メタデータ) (2023-12-19T13:17:43Z) - Efficient Computation of Sparse and Robust Maximum Association
Estimators [0.5156484100374059]
高次元経験例は、この手順の有用性を裏付けるものである。
ラグランジアンアルゴリズムとスパース降下の組み合わせはスパース空間の誘導に適した制約を含むように実装されている。
論文 参考訳(メタデータ) (2023-11-29T11:57:50Z) - Structural Estimation of Markov Decision Processes in High-Dimensional
State Space with Finite-Time Guarantees [39.287388288477096]
本研究では,実施行動と訪問状態の観測可能な履歴に基づいて,人間エージェントによる動的決定の構造モデルの推定作業を検討する。
この問題には固有のネスト構造があり、内部問題では与えられた報酬関数に対する最適ポリシーが特定され、外部問題では適合度の測定が最大化される。
本研究では,高次元状態空間を扱うための有限時間保証付き単一ループ推定アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-10-04T00:11:38Z) - Log Barriers for Safe Black-box Optimization with Application to Safe
Reinforcement Learning [72.97229770329214]
本稿では,学習時の安全性維持が不可欠である高次元非線形最適化問題に対する一般的なアプローチを提案する。
LBSGDと呼ばれるアプローチは、慎重に選択されたステップサイズで対数障壁近似を適用することに基づいている。
安全強化学習における政策課題の違反を最小限に抑えるためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-07-21T11:14:47Z) - Quantum Goemans-Williamson Algorithm with the Hadamard Test and
Approximate Amplitude Constraints [62.72309460291971]
本稿では,n+1$ qubitsしか使用しないGoemans-Williamsonアルゴリズムの変分量子アルゴリズムを提案する。
補助量子ビット上で適切にパラメータ化されたユニタリ条件として目的行列を符号化することにより、効率的な最適化を実現する。
各種NPハード問題に対して,Goemans-Williamsonアルゴリズムの量子的効率的な実装を考案し,提案プロトコルの有効性を実証する。
論文 参考訳(メタデータ) (2022-06-30T03:15:23Z) - Quantum constraint learning for quantum approximate optimization
algorithm [0.0]
本稿では,探索部分空間を厳しく制約するミキサーハミルトンを学習するための量子機械学習手法を提案する。
学習したユニタリを直接適応可能なアンサッツを使用してQAOAフレームワークにプラグインすることができる。
また,Wasserstein距離を用いた近似最適化アルゴリズムの性能を,制約なしで評価する直感的計量法を開発した。
論文 参考訳(メタデータ) (2021-05-14T11:31:14Z) - Constrained Model-Free Reinforcement Learning for Process Optimization [0.0]
強化学習(Reinforcement Learning, RL)は、非線形最適制御問題を扱うための制御手法である。
展示された約束にもかかわらず、RLは産業的な実践への顕著な翻訳をまだ見ていない。
確率の高い共同確率制約の満足度を保証できる「オークル」支援型制約付きQ-ラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-16T13:16:22Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - Combining Deep Learning and Optimization for Security-Constrained
Optimal Power Flow [94.24763814458686]
セキュリティに制約のある最適電力フロー(SCOPF)は、電力システムの基本である。
SCOPF問題におけるAPRのモデル化は、複雑な大規模混合整数プログラムをもたらす。
本稿では,ディープラーニングとロバスト最適化を組み合わせた新しい手法を提案する。
論文 参考訳(メタデータ) (2020-07-14T12:38:21Z) - Robust Reinforcement Learning with Wasserstein Constraint [49.86490922809473]
最適なロバストなポリシーの存在を示し、摂動に対する感度分析を行い、新しいロバストな学習アルゴリズムを設計する。
提案アルゴリズムの有効性はCart-Pole環境で検証する。
論文 参考訳(メタデータ) (2020-06-01T13:48:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。