論文の概要: DcnnGrasp: Towards Accurate Grasp Pattern Recognition with Adaptive
Regularizer Learning
- arxiv url: http://arxiv.org/abs/2205.05218v1
- Date: Wed, 11 May 2022 00:34:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 19:36:37.355919
- Title: DcnnGrasp: Towards Accurate Grasp Pattern Recognition with Adaptive
Regularizer Learning
- Title(参考訳): DcnnGrasp:適応正規化学習による正確なGraspパターン認識を目指して
- Authors: Xiaoqin Zhang, Ziwei Huang, Jingjing Zheng, Shuo Wang, and Xianta
Jiang
- Abstract要約: 現在の最先端手法は、パターン認識に不可欠なオブジェクトのカテゴリ情報を無視している。
本稿では,物体分類と把握パターン認識の連成学習を実現するために,二分岐畳み込みニューラルネットワーク(DcnnGrasp)を提案する。
- 参考スコア(独自算出の注目度): 13.08779945306727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The task of grasp pattern recognition aims to derive the applicable grasp
types of an object according to the visual information. Current
state-of-the-art methods ignore category information of objects which is
crucial for grasp pattern recognition. This paper presents a novel dual-branch
convolutional neural network (DcnnGrasp) to achieve joint learning of object
category classification and grasp pattern recognition. DcnnGrasp takes object
category classification as an auxiliary task to improve the effectiveness of
grasp pattern recognition. Meanwhile, a new loss function called joint
cross-entropy with an adaptive regularizer is derived through maximizing a
posterior, which significantly improves the model performance. Besides, based
on the new loss function, a training strategy is proposed to maximize the
collaborative learning of the two tasks. The experiment was performed on five
household objects datasets including the RGB-D Object dataset, Hit-GPRec
dataset, Amsterdam library of object images (ALOI), Columbia University Image
Library (COIL-100), and MeganePro dataset 1. The experimental results
demonstrated that the proposed method can achieve competitive performance on
grasp pattern recognition with several state-of-the-art methods. Specifically,
our method even outperformed the second-best one by nearly 15% in terms of
global accuracy for the case of testing a novel object on the RGB-D Object
dataset.
- Abstract(参考訳): パターン認識のタスクは、視覚情報に応じて対象物の適切な把握タイプを導出することを目的としている。
現在の最先端手法は、パターン認識に不可欠なオブジェクトのカテゴリ情報を無視している。
本稿では,物体分類と把握パターン認識の連成学習を実現するために,二分岐畳み込みニューラルネットワーク(DcnnGrasp)を提案する。
DcnnGraspは、パターン認識の有効性を向上させるために、オブジェクトカテゴリ分類を補助タスクとして利用する。
一方、適応正則化器を用いたジョイントクロスエントロピーと呼ばれる新たな損失関数は、後方を最大化し、モデル性能を大幅に向上させる。
さらに,新たな損失関数に基づいて,2つのタスクの協調学習を最大化するためのトレーニング戦略を提案する。
実験はrgb-d object dataset, hit-gprec dataset, amsterdam library of object images (aloi), columbia university image library (coil-100), meganepro dataset 1を含む5つの家庭用オブジェクトデータセットで実施された。
実験の結果,提案手法はいくつかの最先端手法を用いて,パターン認識における競合性能を実現することができた。
特に、rgb-dオブジェクトデータセットで新しいオブジェクトをテストする場合、この手法は世界的精度の点で、第2位を15%近く上回っていた。
関連論文リスト
- CoDo: Contrastive Learning with Downstream Background Invariance for
Detection [10.608660802917214]
下流背景不変性(CoDo)を用いたコントラスト学習という,オブジェクトレベルの自己教師型学習手法を提案する。
プリテキストタスクは、さまざまなバックグラウンド、特に下流データセットのインスタンス位置モデリングに集中するように変換される。
MSCOCOの実験では、共通のバックボーンを持つCoDoであるResNet50-FPNが、オブジェクト検出に強力な転送学習結果をもたらすことを示した。
論文 参考訳(メタデータ) (2022-05-10T01:26:15Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Recent Trends in 2D Object Detection and Applications in Video Event
Recognition [0.76146285961466]
物体検出における先駆的な研究について論じるとともに,近年のディープラーニングを活用したブレークスルーも取り上げている。
本稿では、画像とビデオの両方で2次元物体検出のための最近のデータセットを強調し、様々な最先端物体検出技術の比較性能の概要を示す。
論文 参考訳(メタデータ) (2022-02-07T14:15:11Z) - Generalized One-Class Learning Using Pairs of Complementary Classifiers [41.64645294104883]
1クラス学習は、単一のクラスでのみアノテーションが利用できるデータにモデルを適合させる古典的な問題である。
本稿では,一級学習の新たな目的を探求し,これを一般化一級識別サブスペース(GODS)と呼ぶ。
論文 参考訳(メタデータ) (2021-06-24T18:52:05Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Consistency-based Active Learning for Object Detection [10.794744492493262]
アクティブラーニングは、限られた予算で最も情報に富んだサンプルを選択することで、タスクモデルの性能を向上させることを目的としている。
本研究では,オリジナルデータと拡張データとの一貫性を十分に探究する,オブジェクト検出のための効果的な一貫性に基づくアクティブラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T17:00:34Z) - Context Decoupling Augmentation for Weakly Supervised Semantic
Segmentation [53.49821324597837]
微調整されたセマンティックセグメンテーションは、近年深く研究されている困難な問題です。
本稿では、オブジェクトが現れる固有のコンテキストを変更する Context Decoupling Augmentation (CDA) メソッドを紹介します。
提案手法の有効性を検証するため, PASCAL VOC 2012データセットにいくつかの代替ネットワークアーキテクチャを用いた広範な実験を行い, CDAが様々なWSSS手法を新たな最先端技術に拡張できることを実証した。
論文 参考訳(メタデータ) (2021-03-02T15:05:09Z) - Meta-learning One-class Classifiers with Eigenvalue Solvers for
Supervised Anomaly Detection [55.888835686183995]
教師付き異常検出のためのニューラルネットワークに基づくメタラーニング手法を提案する。
提案手法は,既存の異常検出法や少数ショット学習法よりも優れた性能を実現することを実験的に実証した。
論文 参考訳(メタデータ) (2021-03-01T01:43:04Z) - Object affordance as a guide for grasp-type recognition [15.702918492410388]
本研究では,各オブジェクトオン畳み込みニューラルネットワーク(CNN)に基づく把握型認識に対するオブジェクトアレイランスの効果を解析した。
その結果,対象物価はCNNを双方のシナリオでガイドし,その精度を 1) 候補の不可避な把握型を除外し,2) 有意な把握型を増強した。
論文 参考訳(メタデータ) (2021-02-27T17:03:32Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。