論文の概要: Improving the Successful Robotic Grasp Detection Using Convolutional
Neural Networks
- arxiv url: http://arxiv.org/abs/2403.05211v1
- Date: Fri, 8 Mar 2024 10:55:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 20:05:26.781770
- Title: Improving the Successful Robotic Grasp Detection Using Convolutional
Neural Networks
- Title(参考訳): 畳み込みニューラルネットワークを用いたロボット把持検出の改善
- Authors: Hamed Hosseini, Mehdi Tale Masouleh, Ahmad Kalhor
- Abstract要約: 本稿では,異なる物体や見えない物体に対する矩形表現としてグリップを検出しようとする改良されたパイプラインモデルを提案する。
主なアイデアは、前処理、出力正規化、データ拡張によって、システムが遅くなることなく精度を4.3%向上させることである。
- 参考スコア(独自算出の注目度): 3.4530027457862
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotic grasp should be carried out in a real-time manner by proper accuracy.
Perception is the first and significant step in this procedure. This paper
proposes an improved pipeline model trying to detect grasp as a rectangle
representation for different seen or unseen objects. It helps the robot to
start control procedures from nearer to the proper part of the object. The main
idea consists in pre-processing, output normalization, and data augmentation to
improve accuracy by 4.3 percent without making the system slow. Also, a
comparison has been conducted over different pre-trained models like AlexNet,
ResNet, Vgg19, which are the most famous feature extractors for image
processing in object detection. Although AlexNet has less complexity than other
ones, it outperformed them, which helps the real-time property.
- Abstract(参考訳): ロボットの把握は適切な精度でリアルタイムに行うべきである。
知覚は、この手順の最初の、そして重要なステップである。
本稿では,異なる物体や見えない物体の矩形表現として把握するパイプラインモデルを提案する。
ロボットは、オブジェクトの適切な部分に近いところから、コントロール手順を開始するのに役立つ。
主なアイデアは前処理、出力正規化、データ拡張であり、システムの動作を遅くすることなく、精度を4.3%向上させる。
また、AlexNet、ResNet、Vgg19といった、オブジェクト検出におけるイメージ処理の最も有名な特徴抽出器に対して、事前訓練されたモデルの比較が行われた。
AlexNetは、他のものよりも複雑さが少ないが、それらよりも優れており、リアルタイムプロパティに役立つ。
関連論文リスト
- Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - Rethinking Voxelization and Classification for 3D Object Detection [68.8204255655161]
LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。
本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。
さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
論文 参考訳(メタデータ) (2023-01-10T16:22:04Z) - CNN-transformer mixed model for object detection [3.5897534810405403]
本稿では,トランスを用いた畳み込みモジュールを提案する。
CNNが抽出した詳細特徴と変換器が抽出したグローバル特徴とを融合させることにより、モデルの認識精度を向上させることを目的とする。
Pascal VOCデータセットでの100ラウンドのトレーニングの後、結果の精度は81%に達し、resnet101[5]をバックボーンとして使用したRCNN[4]よりも4.6向上した。
論文 参考訳(メタデータ) (2022-12-13T16:35:35Z) - Embracing Single Stride 3D Object Detector with Sparse Transformer [63.179720817019096]
自律走行のためのLiDARを用いた3次元物体検出では、物体サイズと入力シーンサイズとの比が2次元検出の場合に比べて有意に小さい。
多くの3D検出器は2D検出器の一般的な慣習に従っており、点雲の定量化後も特徴マップを分解する。
本稿では,SST(Single-stride Sparse Transformer)を提案する。
論文 参考訳(メタデータ) (2021-12-13T02:12:02Z) - Learning to Fit Morphable Models [12.469605679847085]
学習最適化の最近の進歩の上に構築し、古典的なレバンス・マルカルトアルゴリズムに触発された更新ルールを提案する。
本稿では,頭部装着装置による3次元体表面推定問題と2次元ランドマークによる顔の嵌合性に対するニューラルネットワークの有効性を示す。
論文 参考訳(メタデータ) (2021-11-29T18:59:53Z) - CNN-based Omnidirectional Object Detection for HermesBot Autonomous
Delivery Robot with Preliminary Frame Classification [53.56290185900837]
予備的バイナリフレーム分類を用いた物体検出のためのニューラルネットワークの最適化アルゴリズムを提案する。
周囲に6台のローリングシャッターカメラを備えた自律移動ロボットを360度視野として実験装置として使用した。
論文 参考訳(メタデータ) (2021-10-22T15:05:37Z) - EfficientPhys: Enabling Simple, Fast and Accurate Camera-Based Vitals
Measurement [5.435325323159416]
EfficientPhysと呼ばれるカメラによる生理的計測のための2つの新しいニューラルモデルを提案する。
我々のモデルは3つの公開データセットで最先端の精度を達成する。
論文 参考訳(メタデータ) (2021-10-09T03:51:26Z) - Deep Feedback Inverse Problem Solver [141.26041463617963]
逆問題に対する効率的で効果的で汎用的なアプローチを提案する。
我々は、フォワードプロセスが提供するフィードバック信号を活用し、反復的な更新モデルを学ぶ。
私たちのアプローチは前もってのプロセスに制限がなく、事前の知識も必要ありません。
論文 参考訳(メタデータ) (2021-01-19T16:49:06Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z) - APQ: Joint Search for Network Architecture, Pruning and Quantization
Policy [49.3037538647714]
本稿では,リソース制約のあるハードウェア上での効率的なディープラーニング推論のためのAPQを提案する。
ニューラルアーキテクチャ、プルーニングポリシー、量子化ポリシーを別々に検索する従来の方法とは異なり、我々はそれらを共同で最適化する。
同じ精度で、APQはMobileNetV2+HAQよりもレイテンシ/エネルギーを2倍/1.3倍削減する。
論文 参考訳(メタデータ) (2020-06-15T16:09:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。