論文の概要: HRPose: Real-Time High-Resolution 6D Pose Estimation Network Using
Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2204.09429v1
- Date: Wed, 20 Apr 2022 12:43:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-21 14:18:41.685545
- Title: HRPose: Real-Time High-Resolution 6D Pose Estimation Network Using
Knowledge Distillation
- Title(参考訳): HRPose:知識蒸留を用いたリアルタイム高分解能6Dポーズ推定ネットワーク
- Authors: Qi Guan, Zihao Sheng, and Shibei Xue
- Abstract要約: 本稿では,高分解能6D Pose Estimation Network (HRPose) の有効かつ軽量なモデルを提案する。
モデルサイズと計算コストの33%しかありませんが、HRPoseは最先端モデルと比較して同等のパフォーマンスを実現しています。
広範に使用されているベンチマーク LINEMOD の数値実験により,提案した HRPose の最先端手法に対する優位性を実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-time 6D object pose estimation is essential for many real-world
applications, such as robotic grasping and augmented reality. To achieve an
accurate object pose estimation from RGB images in real-time, we propose an
effective and lightweight model, namely High-Resolution 6D Pose Estimation
Network (HRPose). We adopt the efficient and small HRNetV2-W18 as a feature
extractor to reduce computational burdens while generating accurate 6D poses.
With only 33\% of the model size and lower computational costs, our HRPose
achieves comparable performance compared with state-of-the-art models.
Moreover, by transferring knowledge from a large model to our proposed HRPose
through output and feature-similarity distillations, the performance of our
HRPose is improved in effectiveness and efficiency. Numerical experiments on
the widely-used benchmark LINEMOD demonstrate the superiority of our proposed
HRPose against state-of-the-art methods.
- Abstract(参考訳): リアルタイムの6dオブジェクトポーズ推定は、ロボットの把持や拡張現実など、多くの現実世界のアプリケーションにとって不可欠である。
リアルタイムにRGB画像から正確なオブジェクトポーズ推定を実現するため,高分解能6D Pose Estimation Network (HRPose) という,効果的で軽量なモデルを提案する。
我々は,高効率で小型なhrnetv2-w18を特徴抽出器として採用し,正確な6次元ポーズを生成する。
モデルサイズと計算コストの33倍に過ぎず、我々のHRPoseは最先端モデルと比較して同等のパフォーマンスを実現している。
さらに, 提案したHRPoseに大規模モデルからの知識を出力, 特徴相似蒸留を通じて伝達することにより, HRPoseの有効性と効率性を向上した。
ベンチマークラインモッドを用いた数値実験により,提案手法の有効性が実証された。
関連論文リスト
- FAST GDRNPP: Improving the Speed of State-of-the-Art 6D Object Pose Estimation [0.0]
6Dオブジェクトのポーズ推定では、シーン内のオブジェクトの3次元の変換と回転を決定する。
現在のモデルでは、古典的モデルとディープラーニングベースのモデルの両方が、精度とレイテンシのトレードオフに悩まされることが多い。
モデルのサイズを減らし、推論時間を改善するために、いくつかの手法を用いる。
論文 参考訳(メタデータ) (2024-09-18T12:30:02Z) - Advancing 6D Pose Estimation in Augmented Reality -- Overcoming Projection Ambiguity with Uncontrolled Imagery [0.0]
本研究では,拡張現実(AR)における正確な6次元ポーズ推定の課題に対処する。
本稿では,z軸変換と焦点長の推定を戦略的に分解する手法を提案する。
この手法は6次元ポーズ推定プロセスの合理化だけでなく、AR設定における3次元オブジェクトのオーバーレイの精度を大幅に向上させる。
論文 参考訳(メタデータ) (2024-03-20T09:22:22Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - EfficientPose: Efficient Human Pose Estimation with Neural Architecture
Search [47.30243595690131]
効率的なバックボーンと効率的なヘッドの2つの部分を含む、人間のポーズ推定を目的とした効率的なフレームワークを提案します。
我々の最小モデルは、MPIIで88.1%のPCKh@0.5の0.65 GFLOPしか持たず、我々の大モデルは2 GFLOPしか持たないが、その精度は最先端の大型モデルと競合する。
論文 参考訳(メタデータ) (2020-12-13T15:38:38Z) - EfficientHRNet: Efficient Scaling for Lightweight High-Resolution
Multi-Person Pose Estimation [2.924868086534434]
EfficientHRNetは、リソース制約のあるデバイス上でリアルタイムに動作可能な、軽量な多人数ポーズ推定装置のファミリーである。
最大のモデルは現在の最先端の4.4%の精度で、モデルのサイズは1/3、出力は1/6である。
最上位のリアルタイムアプローチと比較して、EfficientHRNetは22%の精度向上を実現し、1/3のパワーで同様のFPSを実現している。
論文 参考訳(メタデータ) (2020-07-16T03:27:26Z) - Towards Practical Lipreading with Distilled and Efficient Models [57.41253104365274]
ニューラルネットワークの復活により、リリーディングは多くの進歩を目の当たりにした。
最近の研究は、最適なアーキテクチャを見つけるか、一般化を改善することで、パフォーマンスを改善するといった側面に重点を置いている。
現在の方法論と、実践的なシナリオにおける効果的なリップリーディングのデプロイ要件との間には、依然として大きなギャップがあります。
まず, LRW と LRW-1000 をそれぞれ 88.5% と 46.6% に比例して, 最先端の性能を高めることを提案する。
論文 参考訳(メタデータ) (2020-07-13T16:56:27Z) - PaMIR: Parametric Model-Conditioned Implicit Representation for
Image-based Human Reconstruction [67.08350202974434]
本研究では,パラメトリックボディモデルと自由形深部暗黙関数を組み合わせたパラメトリックモデル記述型暗黙表現(PaMIR)を提案する。
本手法は, 挑戦的なポーズや衣料品のタイプにおいて, 画像に基づく3次元再構築のための最先端性能を実現する。
論文 参考訳(メタデータ) (2020-07-08T02:26:19Z) - Inference Stage Optimization for Cross-scenario 3D Human Pose Estimation [97.93687743378106]
既存の3Dポーズ推定モデルは、目に見えないポーズを持つ新しいシナリオに適用する場合、パフォーマンス低下を被る。
本稿では、3次元ポーズモデルの一般化性を改善するための新しいフレームワークである推論段階最適化(ISO)を提案する。
注目すべきは、MPI-INF-3DHPで83.6%の最先端の3D PCKが得られることだ。
論文 参考訳(メタデータ) (2020-07-04T09:45:18Z) - EfficientPose: Scalable single-person pose estimation [3.325625311163864]
一人称ポーズ推定のための新しい畳み込みニューラルネットワークアーキテクチャであるEfficientPoseを提案する。
我々のトップパフォーマンスモデルは、低複雑さのConvNetを用いて、シングルパーソンMPIIにおける最先端の精度を実現する。
複雑さと効率が低いため、EfficientPoseはメモリフットプリントと計算コストを制限し、エッジデバイス上の現実世界のアプリケーションを可能にする。
論文 参考訳(メタデータ) (2020-04-25T16:50:46Z) - Self6D: Self-Supervised Monocular 6D Object Pose Estimation [114.18496727590481]
自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案する。
ニューラルレンダリングの最近の進歩を活用して、注釈のない実RGB-Dデータのモデルをさらに自己監督する。
論文 参考訳(メタデータ) (2020-04-14T13:16:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。