論文の概要: Grasp-type Recognition Leveraging Object Affordance
- arxiv url: http://arxiv.org/abs/2009.09813v1
- Date: Wed, 26 Aug 2020 08:40:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 22:14:00.437733
- Title: Grasp-type Recognition Leveraging Object Affordance
- Title(参考訳): オブジェクトアクダクタンスを利用したグラフ型認識
- Authors: Naoki Wake, Kazuhiro Sasabuchi, Katsushi Ikeuchi
- Abstract要約: ロボット教育における鍵となる課題は、単一のRGB画像とターゲットオブジェクト名を持つグリップ型認識である。
本稿では,各対象に対して事前の把握型分布を活用することで,学習に基づく認識を向上させるための,シンプルで効果的なパイプラインを提案する。
- 参考スコア(独自算出の注目度): 7.227058013536165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A key challenge in robot teaching is grasp-type recognition with a single RGB
image and a target object name. Here, we propose a simple yet effective
pipeline to enhance learning-based recognition by leveraging a prior
distribution of grasp types for each object. In the pipeline, a convolutional
neural network (CNN) recognizes the grasp type from an RGB image. The
recognition result is further corrected using the prior distribution (i.e.,
affordance), which is associated with the target object name. Experimental
results showed that the proposed method outperforms both a CNN-only and an
affordance-only method. The results highlight the effectiveness of
linguistically-driven object affordance for enhancing grasp-type recognition in
robot teaching.
- Abstract(参考訳): ロボット教育における重要な課題は、単一のRGB画像とターゲットオブジェクト名を持つグリップ型認識である。
本稿では,各対象に対する把握型の事前分布を活用し,学習に基づく認識を促進するための簡易かつ効果的なパイプラインを提案する。
パイプラインでは、畳み込みニューラルネットワーク(CNN)がRGB画像からグリップタイプを認識する。
認識結果は、対象オブジェクト名に関連付けられた事前分布(即ち、余裕)を用いてさらに補正される。
実験の結果,提案手法はcnnのみの手法とアプライアンスのみの手法を上回った。
その結果,ロボット教育における把持型認識の強化に言語駆動型オブジェクトアフォーアンスの有効性が強調された。
関連論文リスト
- SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - Deep Homography Estimation for Visual Place Recognition [51.70437924779968]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - ALSO: Automotive Lidar Self-supervision by Occupancy estimation [70.70557577874155]
本稿では,ポイントクラウド上で動作している深層知覚モデルのバックボーンを事前学習するための自己教師型手法を提案する。
中心となる考え方は、3Dポイントがサンプリングされる表面の再構成であるプリテキストタスクでモデルをトレーニングすることである。
直感的には、もしネットワークがわずかな入力ポイントのみを考慮し、シーン表面を再構築できるなら、おそらく意味情報の断片をキャプチャする。
論文 参考訳(メタデータ) (2022-12-12T13:10:19Z) - DcnnGrasp: Towards Accurate Grasp Pattern Recognition with Adaptive
Regularizer Learning [13.08779945306727]
現在の最先端手法は、パターン認識に不可欠なオブジェクトのカテゴリ情報を無視している。
本稿では,物体分類と把握パターン認識の連成学習を実現するために,二分岐畳み込みニューラルネットワーク(DcnnGrasp)を提案する。
論文 参考訳(メタデータ) (2022-05-11T00:34:27Z) - Learning Consistency from High-quality Pseudo-labels for Weakly
Supervised Object Localization [7.602783618330373]
より一貫したローカライゼーションを学習するための2段階のアプローチを提案する。
まず,マスクを用いた擬似ラベル生成アルゴリズムを提案し,擬似教師付き学習手法を用いてオブジェクトの局所化ネットワークを初期化する。
第2段階では,分類識別に基づく疑似ラベルの信頼度を簡易かつ効果的に評価する手法を提案する。
論文 参考訳(メタデータ) (2022-03-18T09:05:51Z) - Aligning Pretraining for Detection via Object-Level Contrastive Learning [57.845286545603415]
画像レベルのコントラスト表現学習は、伝達学習の汎用モデルとして非常に有効であることが証明されている。
我々は、これは準最適である可能性があり、従って、自己教師付きプレテキストタスクと下流タスクのアライメントを促進する設計原則を提唱する。
Selective Object Contrastive Learning (SoCo) と呼ばれる本手法は,COCO検出における伝達性能の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-04T17:59:52Z) - Object Localization Through a Single Multiple-Model Convolutional Neural
Network with a Specific Training Approach [0.0]
光畳み込みニューラルネットワーク(cnn)に対して,画像に対する関心領域を決定するための特別訓練手法を提案する。
ほぼ全てのCNNベースの検出器は、固定された入力サイズ画像を使用し、様々なオブジェクトサイズを扱う場合、性能が低下する可能性がある。
論文 参考訳(メタデータ) (2021-03-24T16:52:01Z) - Lightweight Convolutional Neural Network with Gaussian-based Grasping
Representation for Robotic Grasping Detection [4.683939045230724]
現在の物体検出器は、高い精度と高速な推論速度のバランスを取るのが難しい。
ロボットつかみポーズ推定を行うための効率的かつ堅牢な完全畳み込みニューラルネットワークモデルを提案する。
ネットワークは、他の優れたアルゴリズムよりも桁違いに小さい順序です。
論文 参考訳(メタデータ) (2021-01-25T16:36:53Z) - Micro-Facial Expression Recognition in Video Based on Optimal
Convolutional Neural Network (MFEOCNN) Algorithm [0.0]
ビデオシーケンスにおけるマイクロファサール表現の認識が,提案手法の主な目的である。
提案手法の新規性は,修正ライオン最適化(MLO)アルゴリズムを用いて,抽出した特徴量から最適な特徴量を選択することである。
提案手法は最小平均絶対誤差(MAE)値で99.2%の認識精度を実現する。
論文 参考訳(メタデータ) (2020-09-29T05:56:26Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。