Fugu-MT 論文翻訳(概要): Multi-FinGAN: Generative Coarse-To-Fine Sampling of Multi-Finger Grasps

論文の概要: Multi-FinGAN: Generative Coarse-To-Fine Sampling of Multi-Finger Grasps

arxiv url: http://arxiv.org/abs/2012.09696v2
Date: Mon, 15 Mar 2021 08:50:39 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-02 07:13:47.437521
Title: Multi-FinGAN: Generative Coarse-To-Fine Sampling of Multi-Finger Grasps
Title（参考訳）: Multi-FinGAN:Multi-Finger Graspsの粗結合サンプリング
Authors: Jens Lundell, Enric Corona, Tran Nguyen Le, Francesco Verdoja, Philippe Weinzaepfel, Gregory Rogez, Francesc Moreno-Noguer, Ville Kyrki
Abstract要約: 本稿では,rgb-d画像から直接高画質把握を合成する高速生成型多指把持サンプリング手法であるmulti-finganを提案する。シミュレーションにおける790の把握と実際のフランカ・エミカ・パンダの20の把握に対する標準的な把握方法に対して,本手法を実験的に検証し,ベンチマークした。驚くべきことに、私たちのアプローチはベースラインよりも最大20〜30倍速く、フィードバックベースの把握再計画とタスク情報把握への扉を開く重要な改善です。
参考スコア（独自算出の注目度）: 46.316638161863025
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: While there exists many methods for manipulating rigid objects with parallel-jaw grippers, grasping with multi-finger robotic hands remains a quite unexplored research topic. Reasoning and planning collision-free trajectories on the additional degrees of freedom of several fingers represents an important challenge that, so far, involves computationally costly and slow processes. In this work, we present Multi-FinGAN, a fast generative multi-finger grasp sampling method that synthesizes high quality grasps directly from RGB-D images in about a second. We achieve this by training in an end-to-end fashion a coarse-to-fine model composed of a classification network that distinguishes grasp types according to a specific taxonomy and a refinement network that produces refined grasp poses and joint angles. We experimentally validate and benchmark our method against a standard grasp-sampling method on 790 grasps in simulation and 20 grasps on a real Franka Emika Panda. All experimental results using our method show consistent improvements both in terms of grasp quality metrics and grasp success rate. Remarkably, our approach is up to 20-30 times faster than the baseline, a significant improvement that opens the door to feedback-based grasp re-planning and task informative grasping. Code is available at https://irobotics.aalto.fi/multi-fingan/.
Abstract（参考訳）: パラレルジャウグリップで剛体物体を操作する方法は数多く存在するが、多指ロボットハンドでつかむことは、まだ未解明の研究トピックである。数本の指の自由度の追加による衝突のない軌道の推論と計画は、これまでのところ計算コストのかかる低速なプロセスを伴う重要な課題である。本研究では,rgb-d画像から直接高画質把握を合成する高速生成型多指把持サンプリング手法であるmulti-finganを提案する。特定の分類法に従って把握タイプを区別する分類ネットワークと、洗練された把持ポーズと関節角度を生成する改良ネットワークとからなる粗・細かなモデルを用いて、エンドツーエンドのトレーニングを行うことにより、これを実現する。本手法を790把持法,20把持法を実フランカ・エミカ・パンダで実験的に検証し,ベンチマークを行った。本手法を用いた実験はすべて, 把握品質指標と把握成功率の両面で一貫した改善を示した。注目すべきは,我々のアプローチがベースラインよりも最大20～30倍高速であることだ。コードはhttps://irobotics.aalto.fi/multi-fingan/で入手できる。

関連論文リスト

Multiple Stochastic Prompt Tuning for Practical Cross-Domain Few Shot Learning [14.85375816073596]
本稿では、CLIPのような大規模事前学習モデルを簡単にターゲットデータセットにデプロイできるクロスドメイン・数ショット学習タスクを提案する。ゴールは、クラスごとにラベル付けされたサンプルだけを利用することで、極端なドメインシフトの下で、すべての見えないクラスを同時に分類することである。本稿では,MIST(MultIple STochastic Prompt tuning)と呼ばれる新しいフレームワークを提案する。
論文参考訳（メタデータ） (2025-06-04T13:18:04Z)
Grasp Diffusion Network: Learning Grasp Generators from Partial Point Clouds with Diffusion Models in SO(3)xR3 [15.011589108235702]
シミュレーションを利用して、オブジェクトのペアのデータセットを作成し、ポーズを把握します。次に、デプロイ中に素早く起動できる条件生成モデルを学びます。シミュレーションと実世界の実験で、我々は90%以上の成功率でいくつかのオブジェクトを把握できることを示した。
論文参考訳（メタデータ） (2024-12-11T14:17:17Z)
Graspness Discovery in Clutters for Fast and Accurate Grasp Detection [57.81325062171676]
グレープネス(graspness)とは、散らばった場面で把握可能な領域を区別する幾何学的手がかりに基づく品質である。本研究では,探索過程を近似するカスケード把握モデルを構築した。大規模なベンチマークであるGraspNet-1Billionの実験では,提案手法が従来の手法よりも大きなマージンで優れていたことが示されている。
論文参考訳（メタデータ） (2024-06-17T02:06:47Z)
Multi-fingered Robotic Hand Grasping in Cluttered Environments through Hand-object Contact Semantic Mapping [14.674925349389179]
接触セマンティックマップを用いて, 乱雑な環境下でのマルチフィンガーハンドグリップサンプルを生成する手法を開発した。また,マルチモーダルなマルチフィンガーグリップデータセット生成手法を提案する。
論文参考訳（メタデータ） (2024-04-12T23:11:36Z)
Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文参考訳（メタデータ） (2023-07-31T10:22:33Z)
ScoreMix: A Scalable Augmentation Strategy for Training GANs with Limited Data [93.06336507035486]
GAN(Generative Adversarial Networks)は通常、限られたトレーニングデータが利用できる場合、過度に適合する。 ScoreMixは、様々な画像合成タスクのための、新しくスケーラブルなデータ拡張手法である。
論文参考訳（メタデータ） (2022-10-27T02:55:15Z)
Gated recurrent units and temporal convolutional network for multilabel classification [122.84638446560663]
本研究は,マルチラベル分類を管理するための新しいアンサンブル手法を提案する。提案手法のコアは,Adamグラデーション最適化アプローチの変種で訓練された,ゲート再帰単位と時間畳み込みニューラルネットワークの組み合わせである。
論文参考訳（メタデータ） (2021-10-09T00:00:16Z)
SuctionNet-1Billion: A Large-Scale Benchmark for Suction Grasping [47.221326169627666]
吸引つかみのシール形成とレンチ抵抗を解析的に評価する新しい物理モデルを提案する。現実世界の混乱したシナリオで収集された大規模データセットにアノテーションを生成するために、2段階の手法が採用されている。連続運転空間における吸入ポーズを評価するための標準オンライン評価システムを提案する。
論文参考訳（メタデータ） (2021-03-23T05:02:52Z)
Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。 FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。 MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文参考訳（メタデータ） (2020-07-18T09:48:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。