論文の概要: Multi-FinGAN: Generative Coarse-To-Fine Sampling of Multi-Finger Grasps
- arxiv url: http://arxiv.org/abs/2012.09696v2
- Date: Mon, 15 Mar 2021 08:50:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:13:47.437521
- Title: Multi-FinGAN: Generative Coarse-To-Fine Sampling of Multi-Finger Grasps
- Title(参考訳): Multi-FinGAN:Multi-Finger Graspsの粗結合サンプリング
- Authors: Jens Lundell, Enric Corona, Tran Nguyen Le, Francesco Verdoja,
Philippe Weinzaepfel, Gregory Rogez, Francesc Moreno-Noguer, Ville Kyrki
- Abstract要約: 本稿では,rgb-d画像から直接高画質把握を合成する高速生成型多指把持サンプリング手法であるmulti-finganを提案する。
シミュレーションにおける790の把握と実際のフランカ・エミカ・パンダの20の把握に対する標準的な把握方法に対して,本手法を実験的に検証し,ベンチマークした。
驚くべきことに、私たちのアプローチはベースラインよりも最大20〜30倍速く、フィードバックベースの把握再計画とタスク情報把握への扉を開く重要な改善です。
- 参考スコア(独自算出の注目度): 46.316638161863025
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While there exists many methods for manipulating rigid objects with
parallel-jaw grippers, grasping with multi-finger robotic hands remains a quite
unexplored research topic. Reasoning and planning collision-free trajectories
on the additional degrees of freedom of several fingers represents an important
challenge that, so far, involves computationally costly and slow processes. In
this work, we present Multi-FinGAN, a fast generative multi-finger grasp
sampling method that synthesizes high quality grasps directly from RGB-D images
in about a second. We achieve this by training in an end-to-end fashion a
coarse-to-fine model composed of a classification network that distinguishes
grasp types according to a specific taxonomy and a refinement network that
produces refined grasp poses and joint angles. We experimentally validate and
benchmark our method against a standard grasp-sampling method on 790 grasps in
simulation and 20 grasps on a real Franka Emika Panda. All experimental results
using our method show consistent improvements both in terms of grasp quality
metrics and grasp success rate. Remarkably, our approach is up to 20-30 times
faster than the baseline, a significant improvement that opens the door to
feedback-based grasp re-planning and task informative grasping. Code is
available at https://irobotics.aalto.fi/multi-fingan/.
- Abstract(参考訳): パラレルジャウグリップで剛体物体を操作する方法は数多く存在するが、多指ロボットハンドでつかむことは、まだ未解明の研究トピックである。
数本の指の自由度の追加による衝突のない軌道の推論と計画は、これまでのところ計算コストのかかる低速なプロセスを伴う重要な課題である。
本研究では,rgb-d画像から直接高画質把握を合成する高速生成型多指把持サンプリング手法であるmulti-finganを提案する。
特定の分類法に従って把握タイプを区別する分類ネットワークと、洗練された把持ポーズと関節角度を生成する改良ネットワークとからなる粗・細かなモデルを用いて、エンドツーエンドのトレーニングを行うことにより、これを実現する。
本手法を790把持法,20把持法を実フランカ・エミカ・パンダで実験的に検証し,ベンチマークを行った。
本手法を用いた実験はすべて, 把握品質指標と把握成功率の両面で一貫した改善を示した。
注目すべきは,我々のアプローチがベースラインよりも最大20~30倍高速であることだ。
コードはhttps://irobotics.aalto.fi/multi-fingan/で入手できる。
関連論文リスト
- Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Model-free Grasping with Multi-Suction Cup Grippers for Robotic Bin
Picking [63.15595970667581]
複数の吸引カップを有する吸引グリップパのグリップポーズのモデルフリー予測法を提案する。
本手法はグリッパーの設計に非依存であり,グリッパー固有のトレーニングデータを必要としない。
論文 参考訳(メタデータ) (2023-07-31T08:33:23Z) - Accelerating Guided Diffusion Sampling with Splitting Numerical Methods [8.689906452450938]
近年の手法は, サンプリングプロセスに高次数値法を適用することにより, 無誘導サンプリングを高速化することができる。
本稿では,この問題の原因を考察し,演算子分割法に基づく解を提供する。
提案手法は,高次サンプリング手法を再利用し,250ステップのDDIMベースラインと同じ画質の画像を生成できる。
論文 参考訳(メタデータ) (2023-01-27T06:48:29Z) - ScoreMix: A Scalable Augmentation Strategy for Training GANs with
Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。
ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文 参考訳(メタデータ) (2022-10-27T02:55:15Z) - Progressive Multi-stage Interactive Training in Mobile Network for
Fine-grained Recognition [8.727216421226814]
再帰型モザイク発電機(RMG-PMSI)を用いたプログレッシブ多段階インタラクティブトレーニング手法を提案する。
まず、異なる位相の異なる画像を生成する再帰モザイク発生器(RMG)を提案する。
次に、異なるステージの特徴は、異なるステージの対応する特徴を強化し補完するマルチステージインタラクション(MSI)モジュールを通過する。
RMG-PMSIは高い堅牢性と伝達性で性能を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-12-08T10:50:03Z) - Gated recurrent units and temporal convolutional network for multilabel
classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。
提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文 参考訳(メタデータ) (2021-10-09T00:00:16Z) - SuctionNet-1Billion: A Large-Scale Benchmark for Suction Grasping [47.221326169627666]
吸引つかみのシール形成とレンチ抵抗を解析的に評価する新しい物理モデルを提案する。
現実世界の混乱したシナリオで収集された大規模データセットにアノテーションを生成するために、2段階の手法が採用されている。
連続運転空間における吸入ポーズを評価するための標準オンライン評価システムを提案する。
論文 参考訳(メタデータ) (2021-03-23T05:02:52Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。