論文の概要: Semi-supervised Keypoint Localization
- arxiv url: http://arxiv.org/abs/2101.07988v1
- Date: Wed, 20 Jan 2021 06:23:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-22 08:07:24.252863
- Title: Semi-supervised Keypoint Localization
- Title(参考訳): 半教師付きキーポイントローカライゼーション
- Authors: Olga Moskvyak, Frederic Maire, Feras Dayoub, Mahsa Baktashmotlagh
- Abstract要約: キーポイントのヒートマップを同時に学習し、不変なキーポイント表現を半監督的に提示することを提案する。
提案手法は,ヒトおよび動物の身体ランドマークの定位に関するいくつかのベンチマークにおいて,従来の手法を著しく上回っている。
- 参考スコア(独自算出の注目度): 12.37129078618206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Knowledge about the locations of keypoints of an object in an image can
assist in fine-grained classification and identification tasks, particularly
for the case of objects that exhibit large variations in poses that greatly
influence their visual appearance, such as wild animals. However, supervised
training of a keypoint detection network requires annotating a large image
dataset for each animal species, which is a labor-intensive task. To reduce the
need for labeled data, we propose to learn simultaneously keypoint heatmaps and
pose invariant keypoint representations in a semi-supervised manner using a
small set of labeled images along with a larger set of unlabeled images.
Keypoint representations are learnt with a semantic keypoint consistency
constraint that forces the keypoint detection network to learn similar features
for the same keypoint across the dataset. Pose invariance is achieved by making
keypoint representations for the image and its augmented copies closer together
in feature space. Our semi-supervised approach significantly outperforms
previous methods on several benchmarks for human and animal body landmark
localization.
- Abstract(参考訳): 画像中の物体のキーポイントの位置に関する知識は、特に野生動物のような視覚的な外観に大きな影響を与えるポーズに大きなバリエーションを示す物体の場合において、きめ細かい分類と識別作業を支援することができる。
しかし、キーポイント検出ネットワークの教師付きトレーニングでは、動物種ごとに大きな画像データセットをアノテートする必要がある。
ラベル付きデータの必要性を低減するため,ラベル付き画像の小さなセットとラベル付き画像のより大きなセットを用いて,キーポイントのヒートマップと不変キーポイント表現を半教師付きで同時に学習することを提案する。
キーポイント表現は、キーポイント検出ネットワークがデータセット全体で同じキーポイントについて同様の機能を学ぶことを強制する、セマンティックなキーポイント一貫性制約で学習される。
ポーズ不変性は、画像とその拡張コピーのキーポイント表現を特徴空間に近づけることで達成される。
半教師付きアプローチは,人間および動物の身体のランドマークの定位に関するいくつかのベンチマークにおいて,これまでの手法を大きく上回っている。
- 全文 参考訳へのリンク
関連論文リスト
- Self-Supervised Equivariant Learning for Oriented Keypoint Detection [35.94215211409985]
我々は、回転同変CNNを用いた自己教師付き学習フレームワークを導入し、ロバスト指向キーポイントの検出を学習する。
ヒストグラムに基づく配向マップのトレーニングのために,合成変換により生成した画像対による高密度配向損失を提案する。
提案手法は,画像マッチングベンチマークとカメラポーズ推定ベンチマークにおいて,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2022-04-19T02:26:07Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Few-Shot Keypoint Detection as Task Adaptation via Latent Embeddings [17.04471874483516]
既存のアプローチでは、1つのフォワードパスに密なキーポイントの埋め込みを計算するか、その全容量をスパースポイントのセットに割り当てる。
本稿では,ある時点における関連点数が典型的には少ないという観測に基づいて,中間点を探索する。
私たちの主な貢献は、キーポイント埋め込みでスパーススタイルのネットワークを条件付けることができる、少数ショットタスク適応にインスパイアされた、新しいアーキテクチャです。
論文 参考訳(メタデータ) (2021-12-09T13:25:42Z) - Weakly Supervised Keypoint Discovery [27.750244813890262]
画像レベルの監視を用いた2次元画像からのキーポイント発見手法を提案する。
本手法は,弱い教師付き学習アプローチに動機付けられ,画像レベルの監視を利用して識別部品を識別する。
本手法は,限られた監督シナリオにおけるキーポイント推定タスクの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-09-28T01:26:53Z) - A Novel Dataset for Keypoint Detection of quadruped Animals from Images [9.820186342227252]
AwA Poseは、画像から四足動物をキーポイントで検出するための新しいデータセットである。
我々は、異なるキーポイント検出タスクのための最先端のディープラーニングモデルでデータセットをベンチマークした。
論文 参考訳(メタデータ) (2021-08-31T16:40:09Z) - Rectifying the Shortcut Learning of Background: Shared Object
Concentration for Few-Shot Image Recognition [101.59989523028264]
Few-Shot画像分類は、大規模なデータセットから学んだ事前学習された知識を利用して、一連の下流分類タスクに取り組むことを目的としている。
本研究では,Few-Shot LearningフレームワークであるCOSOCを提案する。
論文 参考訳(メタデータ) (2021-07-16T07:46:41Z) - End-to-End Learning of Keypoint Representations for Continuous Control
from Images [84.8536730437934]
教師なしの事前学習、デコーダ、追加の損失を必要とせずに、エンドツーエンドで効率的なキーポイント表現を学習できることが示される。
提案アーキテクチャは,ソフトアクター・クリティカルエージェントに直接座標を供給するキーポイント抽出器で構成されている。
論文 参考訳(メタデータ) (2021-06-15T09:17:06Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Bottom-Up Human Pose Estimation Via Disentangled Keypoint Regression [81.05772887221333]
従来のキーポイント検出およびグループ化フレームワークに劣る密度の高いキーポイント回帰フレームワークについて検討する。
我々は,dekr(disentangled keypoint regression)という,単純かつ効果的な手法を提案する。
提案手法はキーポイント検出法やグループ化法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-04-06T05:54:46Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。