論文の概要: LMPNet for Weakly-supervised Keypoint Discovery
- arxiv url: http://arxiv.org/abs/2507.02308v1
- Date: Thu, 03 Jul 2025 04:36:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:15.59137
- Title: LMPNet for Weakly-supervised Keypoint Discovery
- Title(参考訳): 弱教師付きキーポイント発見のためのLMPNet
- Authors: Pei Guo, Ryan Farrell,
- Abstract要約: カテゴリラベルのみによって弱制御されたセマンティックオブジェクトキーポイント発見の課題について検討する。
これは、識別的に訓練された中間層フィルタをキーポイント検出器に変換することで達成される。
実験により、LMPNetはオブジェクトのポーズに頑健なセマンティックキーポイントを自動的に発見でき、(ii)教師付きポーズ推定モデルに匹敵する高い予測精度が得られることが示された。
- 参考スコア(独自算出の注目度): 2.033434950296318
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we explore the task of semantic object keypoint discovery weakly-supervised by only category labels. This is achieved by transforming discriminatively-trained intermediate layer filters into keypoint detectors. We begin by identifying three preferred characteristics of keypoint detectors: (i) spatially sparse activations, (ii) consistency and (iii) diversity. Instead of relying on hand-crafted loss terms, a novel computationally-efficient leaky max pooling (LMP) layer is proposed to explicitly encourage final conv-layer filters to learn "non-repeatable local patterns" that are well aligned with object keypoints. Informed by visualizations, a simple yet effective selection strategy is proposed to ensure consistent filter activations and attention mask-out is then applied to force the network to distribute its attention to the whole object instead of just the most discriminative region. For the final keypoint prediction, a learnable clustering layer is proposed to group keypoint proposals into keypoint predictions. The final model, named LMPNet, is highly interpretable in that it directly manipulates network filters to detect predefined concepts. Our experiments show that LMPNet can (i) automatically discover semantic keypoints that are robust to object pose and (ii) achieves strong prediction accuracy comparable to a supervised pose estimation model.
- Abstract(参考訳): 本研究では,カテゴリラベルのみによって弱制御されたセマンティックオブジェクトキーポイント発見の課題について検討する。
これは、識別的に訓練された中間層フィルタをキーポイント検出器に変換することで達成される。
まず、キーポイント検出器の3つの望ましい特徴を識別する。
(i)空間的に疎い活性化
(二)一貫性及び整合性
(三)多様性。
手作りの損失項に頼る代わりに、新しい計算効率の高いリーク極大プーリング(LMP)層が提案され、最終凸層フィルタがオブジェクトキーポイントとよく整合した「非繰り返し局所パターン」を学習することを明示的に促す。
ビジュアライゼーションにより、一貫したフィルタのアクティベーションとアテンションマスクアウトを確実にするために、単純で効果的な選択戦略が提案される。
最終的なキーポイント予測には、キーポイントの提案をキーポイント予測にグループ化する学習可能なクラスタリング層が提案されている。
最終モデルはLMPNetと呼ばれ、事前に定義された概念を検出するためにネットワークフィルタを直接操作するという点で非常に解釈可能である。
我々の実験はLMPNetが可能であることを示している。
i)オブジェクトのポーズに頑丈なセマンティックキーポイントを自動的に発見し、
(ii)教師付きポーズ推定モデルに匹敵する高い予測精度を達成する。
関連論文リスト
- Purifying, Labeling, and Utilizing: A High-Quality Pipeline for Small Object Detection [83.90563802153707]
PLUSNetは高品質のSmallオブジェクト検出フレームワークである。
上流の特徴を浄化するための階層的特徴(HFP)フレームワーク、中流トレーニングサンプルの品質を改善するための多重基準ラベル割り当て(MCLA)、下流タスクを達成するためにより効果的に情報を活用するための周波数分離ヘッド(FDHead)の3つのコンポーネントで構成されている。
論文 参考訳(メタデータ) (2025-04-29T10:11:03Z) - CS-Net:Contribution-based Sampling Network for Point Cloud Simplification [50.55658910053004]
ポイントクラウドサンプリングは、様々なビジョンタスクの計算コストとストレージ要求を減らす上で重要な役割を果たす。
最遠点サンプリングのような従来のサンプリング手法では、タスク固有の情報が欠落している。
提案手法では, サンプル処理をTop-k操作として定式化したCS-Netを提案する。
論文 参考訳(メタデータ) (2025-01-18T14:56:09Z) - Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - SC3K: Self-supervised and Coherent 3D Keypoints Estimation from Rotated,
Noisy, and Decimated Point Cloud Data [17.471342278936365]
そこで本研究では,任意のオブジェクトカテゴリからキーポイントを推定する手法を提案する。
我々は,キーポイント推定のための自己指導型トレーニング戦略を提案することで,これらのデシダータを実現する。
提案手法によって推定されるキーポイントと最先端の教師なしアプローチのキーポイントを比較した。
論文 参考訳(メタデータ) (2023-08-10T08:10:01Z) - Monte Carlo Linear Clustering with Single-Point Supervision is Enough
for Infrared Small Target Detection [48.707233614642796]
SIRST(Single-frame infrared small target)検出は、赤外線画像上の乱雑な背景から小さなターゲットを分離することを目的としている。
ディープラーニングに基づく手法は、SIRST検出において有望な性能を達成したが、大量のトレーニングデータを犠牲にしている。
単一点監視を用いたSIRST検出のための最初の手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T08:04:05Z) - Stochastic Deep Networks with Linear Competing Units for Model-Agnostic
Meta-Learning [4.97235247328373]
本研究は,LWTA(Local winner-takes-all)アクティベーションを伴うディープネットワークを考慮したメタラーニング(ML)に対処する。
このタイプのネットワークユニットは、ユニットが1つのユニットだけがゼロでない出力を生成するブロックに編成されるため、各モデルレイヤからスパース表現が生成される。
提案手法は,数ショット画像の分類と回帰実験における最先端の予測精度と,アクティブな学習環境における予測誤差の低減を実現する。
論文 参考訳(メタデータ) (2022-08-02T16:19:54Z) - GKNet: grasp keypoint network for grasp candidates detection [15.214390498300101]
本稿では、キーポイント検出として扱うことにより、検出を把握するための異なるアプローチを提案する。
ディープネットワークは、各グリップ候補を一対のキーポイントとして検出し、コーナーポイントの三重項や四重項ではなく、グリップ表現g = x, y, w,thetaTに変換する。
論文 参考訳(メタデータ) (2021-06-16T00:34:55Z) - Aligning Pretraining for Detection via Object-Level Contrastive Learning [57.845286545603415]
画像レベルのコントラスト表現学習は、伝達学習の汎用モデルとして非常に有効であることが証明されている。
我々は、これは準最適である可能性があり、従って、自己教師付きプレテキストタスクと下流タスクのアライメントを促進する設計原則を提唱する。
Selective Object Contrastive Learning (SoCo) と呼ばれる本手法は,COCO検出における伝達性能の最先端化を実現する。
論文 参考訳(メタデータ) (2021-06-04T17:59:52Z) - Conditional Link Prediction of Category-Implicit Keypoint Detection [26.400925420154245]
エンドツーエンドなキーポイントとリンク予測ネットワーク(KLPNet)を提案する。
KLPNetでは、予め定義されたカテゴリに付随するキーポイント間のリンク予測のために、新しい条件付きリンク予測グラフが提案されている。
3つの公開ベンチマークで実施された実験は、我々のKLPNetが他の最先端のアプローチを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2020-11-29T23:00:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。