論文の概要: Tactile Grasp Refinement using Deep Reinforcement Learning and Analytic
Grasp Stability Metrics
- arxiv url: http://arxiv.org/abs/2109.11234v1
- Date: Thu, 23 Sep 2021 09:20:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-24 15:07:52.921045
- Title: Tactile Grasp Refinement using Deep Reinforcement Learning and Analytic
Grasp Stability Metrics
- Title(参考訳): 深部強化学習と解析的把持安定性指標を用いた触覚把握
- Authors: Alexander Koenig, Zixi Liu, Lucas Janson, Robert Howe
- Abstract要約: 解析的把握安定性指標が強化学習アルゴリズムの強力な最適化目標であることを示す。
幾何的および力量に依存しないグリップ安定性の指標を組み合わせることで、カブイドの平均成功率は95.4%となることを示す。
第2の実験では,触覚情報を持たないベースラインよりも,接触フィードバックで訓練したグリップリファインメントアルゴリズムが最大6.6%向上することを示した。
- 参考スコア(独自算出の注目度): 70.65363356763598
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Reward functions are at the heart of every reinforcement learning (RL)
algorithm. In robotic grasping, rewards are often complex and manually
engineered functions that do not rely on well-justified physical models from
grasp analysis. This work demonstrates that analytic grasp stability metrics
constitute powerful optimization objectives for RL algorithms that refine
grasps on a three-fingered hand using only tactile and joint position
information. We outperform a binary-reward baseline by 42.9% and find that a
combination of geometric and force-agnostic grasp stability metrics yields the
highest average success rates of 95.4% for cuboids, 93.1% for cylinders, and
62.3% for spheres across wrist position errors between 0 and 7 centimeters and
rotational errors between 0 and 14 degrees. In a second experiment, we show
that grasp refinement algorithms trained with contact feedback (contact
positions, normals, and forces) perform up to 6.6% better than a baseline that
receives no tactile information.
- Abstract(参考訳): リワード関数は、強化学習(RL)アルゴリズムの中心にある。
ロボットグルーピングでは、報酬はしばしば複雑で手動で操作される機能であり、グルーピング分析から適切な物理モデルに依存しない。
本研究は, 触覚情報と関節位置情報のみを用いて三指ハンドのグリップを精密化するRLアルゴリズムにおいて, 解析的グリップ安定度が強力な最適化目標となることを示す。
我々は2進法ベースラインを42.9%上回り、幾何的・非力的グリップ安定性の指標を組み合わせると、キュービイドの平均成功率は95.4%、シリンダー93.1%、手首位置誤差0~7cm、回転誤差0~14度となる62.3%となる。
第2の実験では、接触フィードバック(接触位置、正常値、力)で訓練されたグラブリファインメントアルゴリズムが、触覚情報を受け付けないベースラインよりも最大6.6%優れていることを示した。
関連論文リスト
- SLYKLatent: A Learning Framework for Gaze Estimation Using Deep Facial Feature Learning [0.0]
SLYKLatentは、データセットの外観不安定性問題に対処することで、視線推定を向上するための新しいアプローチである。
SLYKLatentは、自己教師付き学習を使用して、表情データセットでの初期トレーニングを行い、その後、パッチベースのトリブランチネットワークで改善する。
ベンチマークデータセットの評価では、Gaze360が10.9%改善され、トップMPIIFaceGazeの3.8%に取って代わられ、ETH-XGazeのサブセットが11.6%向上した。
論文 参考訳(メタデータ) (2024-02-02T16:47:18Z) - Tool-Augmented Reward Modeling [58.381678612409]
本稿では,外部環境へのアクセスによるRMの強化により,制約に対処するツール拡張された嗜好モデリング手法であるThemisを提案する。
我々の研究は、外部ツールをRMに統合し、様々な外部ソースとの相互作用を可能にすることを目的としている。
人間の評価では、テミスで訓練されたRLHFはベースラインと比較して平均32%の勝利率を得る。
論文 参考訳(メタデータ) (2023-10-02T09:47:40Z) - Improving Machine Learning Robustness via Adversarial Training [3.7942983866014073]
本研究では,中央集権・分散環境における対人訓練によるMLの堅牢性について検討する。
中央集権環境では,敵の例を分類すると65.41%,83.0%の検査精度が得られる。
分散環境下では,独立・同一分散(IID)と非IIDデータを用いた対人訓練を用いて,フェデレートラーニング(FL)の堅牢性について検討する。
論文 参考訳(メタデータ) (2023-09-22T02:43:04Z) - A Lightweight and Accurate Face Detection Algorithm Based on Retinaface [0.5076419064097734]
Retinaface に基づく軽量かつ高精度な顔検出アルゴリズム LAFD (Light and accurate face detection) を提案する。
アルゴリズムのバックボーンネットワークは、畳み込みカーネルのサイズを調整する修正されたMobileNetV3ネットワークである。
入力画像が前処理され、長さが1560px、幅が1200pxとなると、平均精度は86.2%となる。
論文 参考訳(メタデータ) (2023-08-08T15:36:57Z) - Robust Learning with Progressive Data Expansion Against Spurious
Correlation [65.83104529677234]
本研究では,2層非線形畳み込みニューラルネットワークの学習過程について検討した。
分析の結果,不均衡なデータ群と学習容易なスプリアス特徴が学習過程におけるスプリアス特徴の優位性に繋がる可能性が示唆された。
本稿では,PDEと呼ばれる新たなトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-06-08T05:44:06Z) - Improving Few-Shot Generalization by Exploring and Exploiting Auxiliary
Data [100.33096338195723]
補助データを用いたFew-shot Learning(FLAD)に焦点を当てる。
FLADは、一般化を改善するために、数ショットの学習中に補助データへのアクセスを前提としている。
提案するアルゴリズムは EXP3-FLAD と UCB1-FLAD の2つである。
論文 参考訳(メタデータ) (2023-02-01T18:59:36Z) - 3D Pose Based Feedback for Physical Exercises [87.35086507661227]
ユーザが犯した誤りを識別する学習ベースのフレームワークを導入する。
私たちのフレームワークはハードコードされたルールに頼るのではなく、データからそれらを学ぶのです。
提案手法は90.9%の誤り識別精度を示し,94.2%の誤り訂正に成功した。
論文 参考訳(メタデータ) (2022-08-05T16:15:02Z) - Robust Learning via Persistency of Excitation [4.674053902991301]
勾配勾配勾配を用いたネットワークトレーニングは力学系パラメータ推定問題と等価であることを示す。
極値理論を用いて対応するリプシッツ定数を推定する効率的な手法を提案する。
我々の手法は、様々な最先端の対数訓練モデルにおいて、対数精度を0.1%から0.3%に普遍的に向上させる。
論文 参考訳(メタデータ) (2021-06-03T18:49:05Z) - Harnessing Geometric Constraints from Auxiliary Labels to Improve
Embedding Functions for One-Shot Learning [21.445455835823626]
本稿では,手動で注釈付きまたは自動検出された補助ラベルを用いて深層モデルで学習した埋め込み空間に新しい幾何学的制約を導入する。
提案されたTL+PDP+FBV損失(97.5, 72.6, 93.1, 70.5%)では, 99.7, 86.2, 99.4, 79.3%の検証精度が向上した。
論文 参考訳(メタデータ) (2021-03-05T18:27:38Z) - Fast Uncertainty Quantification for Deep Object Pose Estimation [91.09217713805337]
深層学習に基づくオブジェクトポーズ推定は、しばしば信頼できない、自信過剰である。
本研究では,6-DoFオブジェクトのポーズ推定のための,シンプルで効率的かつプラグアンドプレイなUQ手法を提案する。
論文 参考訳(メタデータ) (2020-11-16T06:51:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。