論文の概要: CleanPose: Category-Level Object Pose Estimation via Causal Learning and Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2502.01312v1
- Date: Mon, 03 Feb 2025 12:41:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-05 14:59:22.101088
- Title: CleanPose: Category-Level Object Pose Estimation via Causal Learning and Knowledge Distillation
- Title(参考訳): クリーンパス:因果学習と知識蒸留によるカテゴリーレベルオブジェクトポス推定
- Authors: Xiao Lin, Yun Peng, Liuyi Wang, Xianyou Zhong, Minghao Zhu, Jingwei Yang, Chengju Liu, Qijun Chen,
- Abstract要約: カテゴリーレベルのオブジェクトポーズ推定は、事前に定義されたカテゴリ内の未確認インスタンスの回転、翻訳、サイズを復元することを目的としている。
ディープニューラルネットワークベースの手法は、優れたパフォーマンスを示しているが、"非クリーン"な共同設立者によって引き起こされた急激な相関に悩まされている。
因果学習と知識蒸留を統合してカテゴリーレベルのポーズ推定を強化する新しいアプローチであるCleanPoseを提案する。
- 参考スコア(独自算出の注目度): 18.453617417061245
- License:
- Abstract: Category-level object pose estimation aims to recover the rotation, translation and size of unseen instances within predefined categories. In this task, deep neural network-based methods have demonstrated remarkable performance. However, previous studies show they suffer from spurious correlations raised by "unclean" confounders in models, hindering their performance on novel instances with significant variations. To address this issue, we propose CleanPose, a novel approach integrating causal learning and knowledge distillation to enhance category-level pose estimation. To mitigate the negative effect of unobserved confounders, we develop a causal inference module based on front-door adjustment, which promotes unbiased estimation by reducing potential spurious correlations. Additionally, to further improve generalization ability, we devise a residual-based knowledge distillation method that has proven effective in providing comprehensive category information guidance. Extensive experiments across multiple benchmarks (REAL275, CAMERA25 and HouseCat6D) hightlight the superiority of proposed CleanPose over state-of-the-art methods. Code will be released.
- Abstract(参考訳): カテゴリーレベルのオブジェクトポーズ推定は、事前に定義されたカテゴリ内の未確認インスタンスの回転、翻訳、サイズを復元することを目的としている。
この課題では、ディープニューラルネットワークベースの手法が顕著な性能を示した。
しかし、以前の研究では、モデルにおける"非クリーン"な共同設立者によって引き起こされた急激な相関に悩まされ、大きなバリエーションを持つ新規インスタンスのパフォーマンスを妨げることが示されている。
そこで本研究では,カテゴリレベルのポーズ推定を強化するために,因果学習と知識蒸留を統合した新しいアプローチであるCleanPoseを提案する。
本研究では, 前方調整に基づく因果推論モジュールを開発し, 潜在的な突発的相関を低減し, 不偏推定を促進する。
さらに, 総合化能力の向上を図るため, 包括的カテゴリ情報提供に有効な残留知識蒸留法を考案した。
複数のベンチマーク(REAL275、CAMERA25、HouseCat6D)にわたる大規模な実験は、最先端の手法よりも提案されたCleanPoseの優位性を強調している。
コードはリリースされる。
関連論文リスト
- When resampling/reweighting improves feature learning in imbalanced classification?: A toy-model study [5.5730368125641405]
クラス不均衡の存在下での特徴学習性能に対するクラスワイドリサンプリング/リウェイト効果を明らかにすることを目的とした二分分類のおもちゃモデルについて検討した。
その結果,再サンプリング/再重み付けの状況が,損失や分類器の選択に関係なく,最高の特徴学習性能を与えるケースが存在することがわかった。
論文 参考訳(メタデータ) (2024-09-09T13:31:00Z) - Classifier Guidance Enhances Diffusion-based Adversarial Purification by Preserving Predictive Information [75.36597470578724]
敵の浄化は、敵の攻撃からニューラルネットワークを守るための有望なアプローチの1つである。
分類器決定境界から遠ざかって, 清浄するgUided Purification (COUP)アルゴリズムを提案する。
実験結果から, COUPは強力な攻撃法でより優れた対向的堅牢性が得られることが示された。
論文 参考訳(メタデータ) (2024-08-12T02:48:00Z) - Anti-Collapse Loss for Deep Metric Learning Based on Coding Rate Metric [99.19559537966538]
DMLは、分類、クラスタリング、検索といった下流タスクのための識別可能な高次元埋め込み空間を学習することを目的としている。
埋め込み空間の構造を維持し,特徴の崩壊を避けるために,反崩壊損失と呼ばれる新しい損失関数を提案する。
ベンチマークデータセットの総合実験により,提案手法が既存の最先端手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-07-03T13:44:20Z) - GenPose: Generative Category-level Object Pose Estimation via Diffusion
Models [5.1998359768382905]
カテゴリーレベルのオブジェクトポーズ推定を条件付き生成モデルとして再検討することで,新しい解を提案する。
提案手法は,厳密な5d2cmおよび5d5cmの計測値に対して50%と60%を越え,REAL275データセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-18T11:45:42Z) - Adaptive Base-class Suppression and Prior Guidance Network for One-Shot
Object Detection [9.44806128120871]
ワンショットオブジェクト検出(OSOD)は、クエリイメージによって指定された所定のカテゴリに対して、すべてのオブジェクトインスタンスを検出することを目的としている。
本稿では,BSPG(Base-class Suppression and Prior Guidance)ネットワークという新しいフレームワークを提案する。
具体的には,ベースクラス予測器を用いて,ベースクラスのオブジェクトを明示的に検出し,ベースクラス抑制モジュールによって適応的に除去する。
事前誘導モジュールは、非パラメトリックな方法で高レベルの特徴の相関を計算し、クラスに依存しない事前マップを生成し、目的の特徴にリッチなセマンティックな手がかりを与え、その後の検出プロセスを導くように設計されている。
論文 参考訳(メタデータ) (2023-03-24T19:04:30Z) - Fast Hierarchical Learning for Few-Shot Object Detection [57.024072600597464]
転送学習アプローチは、最近、数ショット検出タスクで有望な結果を得た。
これらのアプローチは、ベース検出器の微調整による破滅的な忘れ込みの問題に悩まされる。
この作業における上記の問題に対処する。
論文 参考訳(メタデータ) (2022-10-10T20:31:19Z) - CATRE: Iterative Point Clouds Alignment for Category-level Object Pose
Refinement [52.41884119329864]
カテゴリーレベルのオブジェクトポーズとサイズ精細化器 CATRE は、点雲からのポーズ推定を反復的に強化し、正確な結果が得られる。
提案手法は,REAL275,CAMERA25,LMのベンチマークを85.32Hzまで高速化する。
論文 参考訳(メタデータ) (2022-07-17T05:55:00Z) - A Deep Convolutional Neural Networks Based Multi-Task Ensemble Model for
Aspect and Polarity Classification in Persian Reviews [0.0]
畳み込みニューラルネットワーク(CNN)に基づくマルチタスク学習モデルを提案する。
モデルのみを作成することは、最高の予測を提供しておらず、バイアスや高い分散のようなエラーにつながる可能性がある。
本稿では、ペルシャ語レビューにおける感情分析を強化するために、マルチタスク深層畳み込みニューラルネットワークのアンサンブルに基づくモデルを作成する。
論文 参考訳(メタデータ) (2022-01-17T09:54:35Z) - Improving Music Performance Assessment with Contrastive Learning [78.8942067357231]
本研究では,既存のMPAシステムを改善するための潜在的手法として,コントラスト学習について検討する。
畳み込みニューラルネットワークに適用された回帰タスクに適した重み付きコントラスト損失を導入する。
この結果から,MPA回帰タスクにおいて,コントラッシブ・ベースの手法がSoTA性能に適合し,超越できることが示唆された。
論文 参考訳(メタデータ) (2021-08-03T19:24:25Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。