論文の概要: Uncertainty-Aware Knowledge Distillation for Compact and Efficient 6DoF Pose Estimation
- arxiv url: http://arxiv.org/abs/2503.13053v1
- Date: Mon, 17 Mar 2025 10:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:30:22.787329
- Title: Uncertainty-Aware Knowledge Distillation for Compact and Efficient 6DoF Pose Estimation
- Title(参考訳): コンパクトで効率的な6DoFパルス推定のための不確実性を考慮した知識蒸留
- Authors: Nassim Ali Ousalah, Anis Kacem, Enjie Ghorbel, Emmanuel Koumandakis, Djamila Aouada,
- Abstract要約: 本稿では,キーポイントに基づく6DoFポーズ推定に着目した,新しい不確実性を考慮したエンド・ツー・エンド知識蒸留(KD)フレームワークを提案する。
本稿では,教師のキーポイント予測に関連する不確実性に基づいて知識伝達を調整することで,学生と教師の予測を整合させる蒸留戦略を提案する。
広範に使用されているLINEMODベンチマーク実験により,本手法の有効性を実証し,軽量モデルによる優れた6DoFオブジェクトポーズ推定を実現した。
- 参考スコア(独自算出の注目度): 9.742944501209656
- License:
- Abstract: Compact and efficient 6DoF object pose estimation is crucial in applications such as robotics, augmented reality, and space autonomous navigation systems, where lightweight models are critical for real-time accurate performance. This paper introduces a novel uncertainty-aware end-to-end Knowledge Distillation (KD) framework focused on keypoint-based 6DoF pose estimation. Keypoints predicted by a large teacher model exhibit varying levels of uncertainty that can be exploited within the distillation process to enhance the accuracy of the student model while ensuring its compactness. To this end, we propose a distillation strategy that aligns the student and teacher predictions by adjusting the knowledge transfer based on the uncertainty associated with each teacher keypoint prediction. Additionally, the proposed KD leverages this uncertainty-aware alignment of keypoints to transfer the knowledge at key locations of their respective feature maps. Experiments on the widely-used LINEMOD benchmark demonstrate the effectiveness of our method, achieving superior 6DoF object pose estimation with lightweight models compared to state-of-the-art approaches. Further validation on the SPEED+ dataset for spacecraft pose estimation highlights the robustness of our approach under diverse 6DoF pose estimation scenarios.
- Abstract(参考訳): 小型で効率的な6DoFオブジェクトのポーズ推定は、ロボット工学、拡張現実、宇宙自律航法システムといった、軽量モデルがリアルタイムの正確なパフォーマンスに不可欠であるアプリケーションにおいて不可欠である。
本稿では,キーポイントに基づく6DoFポーズ推定に着目した,新しい不確実性を考慮したエンド・ツー・エンド知識蒸留(KD)フレームワークを提案する。
大規模な教師モデルによって予測されるキーポイントは、蒸留プロセス内で活用できる様々な不確実性を示し、そのコンパクト性を確保しつつ、生徒モデルの精度を高める。
そこで本研究では,教師のキーポイント予測に関連する不確実性に基づいて知識伝達を調整することで,学生と教師の予測を整合させる蒸留戦略を提案する。
さらに、提案したKDは、キーポイントの不確実性を考慮したアライメントを利用して、各特徴マップのキー位置で知識を伝達する。
広範に使用されているLINEMODベンチマーク実験により,提案手法の有効性を実証し,最先端の手法と比較して,軽量モデルによる優れた6DoFオブジェクトポーズ推定を実現した。
SPEED+データセットのさらなる検証は、多様な6DoFポーズ推定シナリオ下での我々のアプローチの堅牢性を強調している。
関連論文リスト
- A Critical Synthesis of Uncertainty Quantification and Foundation Models in Monocular Depth Estimation [13.062551984263031]
絶対距離の予測を伴う計量深度推定は、特定の課題を提起する。
我々は、現在最先端のDepthAnythingV2基盤モデルを用いて、5つの異なる不確実性定量化手法を融合する。
ガウス陰性対数損失(GNLL)による微調整は特に有望なアプローチである。
論文 参考訳(メタデータ) (2025-01-14T15:13:00Z) - Knowledge Distillation with Adapted Weight [6.0635849782457925]
大規模モデルは、計算とエネルギーの制約により、リアルタイムシステムにデプロイするのは難しい。
Teacher-Student アーキテクチャによる知識蒸留は、大きなモデルの知識を圧縮するための持続可能な経路を提供する。
学習データに重みを割り当てるために影響関数を利用するtextbfKnowledge Distillation with Adaptive Influence Weight (KD-AIF) フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-06T01:16:07Z) - Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding [55.32861154245772]
Calib3Dは3Dシーン理解モデルの信頼性をベンチマークし精査する先駆的な試みである。
10の異なる3Dデータセットにまたがる28の最先端モデルを総合的に評価する。
本稿では,3次元モデルのキャリブレーション向上を目的とした,深度対応のスケーリング手法であるDeptSを紹介する。
論文 参考訳(メタデータ) (2024-03-25T17:59:59Z) - Learn from the Past: A Proxy Guided Adversarial Defense Framework with
Self Distillation Regularization [53.04697800214848]
敵対的訓練(AT)は、ディープラーニングモデルの堅牢性を固める上で重要な要素である。
AT方式は、目標モデルの防御のために直接反復的な更新を頼りにしており、不安定な訓練や破滅的なオーバーフィッティングといった障害に頻繁に遭遇する。
汎用プロキシガイド型防衛フレームワークLAST(bf Pbf astから学ぶ)を提案する。
論文 参考訳(メタデータ) (2023-10-19T13:13:41Z) - Manifold-Aware Self-Training for Unsupervised Domain Adaptation on
Regressing 6D Object Pose [69.14556386954325]
視覚的回帰における合成データと実データとのドメインギャップは,グローバルな特徴アライメントと局所的な改善によって橋渡しされる。
提案手法は明示的な自己教師付き多様体正規化を取り入れ,領域間の一貫した累積的対象依存性を明らかにする。
暗黙的ニューラルファンクションを学習して、最も近いクラスビンへの相対的な方向と目標の距離を推定し、ターゲット分類予測を洗練することを目的としている。
論文 参考訳(メタデータ) (2023-05-18T08:42:41Z) - EvCenterNet: Uncertainty Estimation for Object Detection using
Evidential Learning [26.535329379980094]
EvCenterNetは、新しい不確実性を認識した2Dオブジェクト検出フレームワークである。
分類と回帰の不確実性の両方を推定するために、顕在的学習を用いる。
我々は、KITTIデータセット上でモデルをトレーニングし、配布外のデータセットに挑戦して評価する。
論文 参考訳(メタデータ) (2023-03-06T11:07:11Z) - PCKRF: Point Cloud Completion and Keypoint Refinement With Fusion Data for 6D Pose Estimation [33.226033672697795]
そこで本研究では,6次元ポーズ推定のための新しいポーズ改善パイプラインであるPoint Cloud Completion and Keypoint Refinement with Fusion Data (PCKRF)を提案する。
PCKRFパイプラインは、フルフロー双方向融合ネットワークのような、既存の一般的な6Dポーズ推定手法と統合することができる。
提案手法は,初期ポーズを比較的高精度に最適化する場合に,既存手法と比較して優れた安定性を示す。
論文 参考訳(メタデータ) (2022-10-07T10:13:30Z) - Knowledge Distillation for 6D Pose Estimation by Keypoint Distribution
Alignment [77.70208382044355]
6次元ポーズ推定のための最初の知識蒸留法を提案する。
我々は,コンパクトな学生ネットワークを観察し,正確な2次元キーポイント位置の予測に苦慮する。
いくつかのベンチマーク実験により, 蒸留法が得られた結果が得られた。
論文 参考訳(メタデータ) (2022-05-30T10:17:17Z) - Spatial Attention Improves Iterative 6D Object Pose Estimation [52.365075652976735]
本稿では,RGB画像を用いた6次元ポーズ推定の改良手法を提案する。
私たちの主な洞察力は、最初のポーズ推定の後、オブジェクトの異なる空間的特徴に注意を払うことが重要です。
実験により,このアプローチが空間的特徴に順応することを学び,被写体の一部を無視することを学び,データセット間でのポーズ推定を改善することを実証した。
論文 参考訳(メタデータ) (2021-01-05T17:18:52Z) - Self6D: Self-Supervised Monocular 6D Object Pose Estimation [114.18496727590481]
自己教師付き学習による単眼6次元ポーズ推定のアイデアを提案する。
ニューラルレンダリングの最近の進歩を活用して、注釈のない実RGB-Dデータのモデルをさらに自己監督する。
論文 参考訳(メタデータ) (2020-04-14T13:16:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。