論文の概要: Squeezed Deep 6DoF Object Detection Using Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2003.13586v3
- Date: Fri, 29 May 2020 22:41:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-18 07:28:19.839262
- Title: Squeezed Deep 6DoF Object Detection Using Knowledge Distillation
- Title(参考訳): 知識蒸留を用いた深部6DoF物体検出
- Authors: Heitor Felix, Walber M. Rodrigues, David Mac\^edo, Francisco Sim\~oes,
Adriano L. I. Oliveira, Veronica Teichrieb and Cleber Zanchettin
- Abstract要約: 精度を維持しながら6DoF検出ネットワークの複雑さを低減する手法を提案する。
提案手法では,RGB画像のみを用いたリアルタイムアプリケーションを実現するとともに,ハードウェア要件の低減を実現している。
- 参考スコア(独自算出の注目度): 7.903220756689467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The detection of objects considering a 6DoF pose is a common requirement to
build virtual and augmented reality applications. It is usually a complex task
which requires real-time processing and high precision results for adequate
user experience. Recently, different deep learning techniques have been
proposed to detect objects in 6DoF in RGB images. However, they rely on high
complexity networks, requiring a computational power that prevents them from
working on mobile devices. In this paper, we propose an approach to reduce the
complexity of 6DoF detection networks while maintaining accuracy. We used
Knowledge Distillation to teach portables Convolutional Neural Networks (CNN)
to learn from a real-time 6DoF detection CNN. The proposed method allows
real-time applications using only RGB images while decreasing the hardware
requirements. We used the LINEMOD dataset to evaluate the proposed method, and
the experimental results show that the proposed method reduces the memory
requirement by almost 99\% in comparison to the original architecture with the
cost of reducing half the accuracy in one of the metrics. Code is available at
https://github.com/heitorcfelix/singleshot6Dpose.
- Abstract(参考訳): 6dofポーズを考慮したオブジェクトの検出は、バーチャルおよび拡張現実アプリケーションを構築するための一般的な要件である。
通常、リアルタイム処理と適切なユーザエクスペリエンスのための高精度な結果を必要とする複雑なタスクである。
近年,RGB画像中の6DoFの物体を検出するディープラーニング技術が提案されている。
しかし、それらは複雑なネットワークに依存しており、モバイルデバイスでの動作を妨げる計算能力を必要としている。
本稿では,精度を維持しながら6DoF検出ネットワークの複雑さを低減する手法を提案する。
我々は、Knowledge Distillationを用いて、リアルタイム6DoF検出CNNから学ぶために、ポータブルな畳み込みニューラルネットワーク(CNN)を教えた。
提案手法により,RGB画像のみを用いたリアルタイムアプリケーションを実現する。
提案手法は,linemodデータセットを用いて提案手法の評価を行い,実験結果から,本手法では,従来のアーキテクチャに比べてメモリ要求量を約99\%削減し,その半分の精度を削減できることを確認した。
コードはhttps://github.com/heitorcfelix/singleshot6Dposeで入手できる。
関連論文リスト
- Deep Homography Estimation for Visual Place Recognition [49.235432979736395]
本稿では,変換器を用いたディープホモグラフィー推定(DHE)ネットワークを提案する。
バックボーンネットワークによって抽出された濃密な特徴写像を入力とし、高速で学習可能な幾何的検証のためにホモグラフィーに適合する。
ベンチマークデータセットを用いた実験により,本手法はいくつかの最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2024-02-25T13:22:17Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - RGB-D based Stair Detection using Deep Learning for Autonomous Stair
Climbing [6.362951673024623]
本稿では,RGBマップと深度マップの両方の入力を持つニューラルネットワークアーキテクチャを提案する。
具体的には,RGBマップと深度マップの相補関係をネットワークが学習できるように,選択モジュールを設計する。
提案手法は,従来の最先端深層学習法と比較して精度の向上とリコールが可能であることを示す。
論文 参考訳(メタデータ) (2022-12-02T11:22:52Z) - GraspNeRF: Multiview-based 6-DoF Grasp Detection for Transparent and
Specular Objects Using Generalizable NeRF [7.47805672405939]
本稿では,マルチビューRGBベースの6-DoFグリップ検出ネットワークGraspNeRFを提案する。
既存のNeRFベースの3-DoFグリップ検出手法と比較して,RGB入力の少ないゼロショットNeRF構成を実現し,リアルタイムに6-DoFグリップを確実に検出できる。
学習データには, 散らばったテーブルトップシーンで把握する大規模フォトリアリスティックなドメインランダム化合成データセットを生成する。
論文 参考訳(メタデータ) (2022-10-12T20:31:23Z) - Deep Camera Pose Regression Using Pseudo-LiDAR [1.5959408994101303]
我々は、奥行きマップを擬似LiDAR信号に変換することが、カメラのローカライゼーションタスクのより良い表現であることを示す。
擬似LiDARを用いて6DOFカメラのポーズを復元する新しいアーキテクチャであるFusionLocを提案する。
論文 参考訳(メタデータ) (2022-02-28T20:30:37Z) - NAS-FCOS: Efficient Search for Object Detection Architectures [113.47766862146389]
簡易なアンカーフリー物体検出器の特徴ピラミッドネットワーク (FPN) と予測ヘッドを探索し, より効率的な物体検出手法を提案する。
慎重に設計された検索空間、検索アルゴリズム、ネットワーク品質を評価するための戦略により、8つのV100 GPUを使用して、4日以内に最高のパフォーマンスの検知アーキテクチャを見つけることができる。
論文 参考訳(メタデータ) (2021-10-24T12:20:04Z) - MobileSal: Extremely Efficient RGB-D Salient Object Detection [62.04876251927581]
本稿では,効率的なRGB-Dサルエント物体検出(SOD)に焦点を当てた新しいネットワーク,メソッド名を提案する。
RGB-D SODのためのモバイルネットワークの特徴表現能力を強化するために,暗黙的深度復元(IDR)手法を提案する。
IDRとCPRを組み込むことで、7つの挑戦的なRGB-D SODデータセット上のsArtメソッドに対してメソッド名が好ましい。
論文 参考訳(メタデータ) (2020-12-24T04:36:42Z) - ALF: Autoencoder-based Low-rank Filter-sharing for Efficient
Convolutional Neural Networks [63.91384986073851]
オートエンコーダを用いた低ランクフィルタ共有技術(ALF)を提案する。
ALFは、ネットワークパラメータの70%、オペレーションの61%、実行時間の41%を削減し、精度の低下を最小限にしている。
論文 参考訳(メタデータ) (2020-07-27T09:01:22Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。