論文の概要: Pretrained equivariant features improve unsupervised landmark discovery
- arxiv url: http://arxiv.org/abs/2104.02925v1
- Date: Wed, 7 Apr 2021 05:42:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-08 22:25:29.874911
- Title: Pretrained equivariant features improve unsupervised landmark discovery
- Title(参考訳): 事前訓練された同変機能は教師なしのランドマーク発見を改善する
- Authors: Rahul Rahaman, Atin Ghosh and Alexandre H. Thiery
- Abstract要約: 我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
- 参考スコア(独自算出の注目度): 69.02115180674885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Locating semantically meaningful landmark points is a crucial component of a
large number of computer vision pipelines. Because of the small number of
available datasets with ground truth landmark annotations, it is important to
design robust unsupervised and semi-supervised methods for landmark detection.
Many of the recent unsupervised learning methods rely on the equivariance
properties of landmarks to synthetic image deformations. Our work focuses on
such widely used methods and sheds light on its core problem, its inability to
produce equivariant intermediate convolutional features. This finding leads us
to formulate a two-step unsupervised approach that overcomes this challenge by
first learning powerful pixel-based features and then use the pre-trained
features to learn a landmark detector by the traditional equivariance method.
Our method produces state-of-the-art results in several challenging landmark
detection datasets such as the BBC Pose dataset and the Cat-Head dataset. It
performs comparably on a range of other benchmarks.
- Abstract(参考訳): 意味的に意味のあるランドマークポイントの配置は多くのコンピュータビジョンパイプラインの重要な構成要素である。
地上の真実のランドマークアノテーションを持つデータセットは少ないため、ランドマーク検出のための堅牢で半教師なしな手法を設計することが重要である。
最近の教師なし学習の多くは、ランドマークの等分散特性と合成画像の変形に依存する。
本研究は,このような広範に使用される手法に焦点をあて,その核となる問題,同変中間畳み込み的特徴を発生できないことに光を当てる。
この発見により、2段階の教師なしアプローチでこの課題を克服し、まず強力なピクセルベースの特徴を学習し、次に事前訓練された特徴を用いて従来の等分散法でランドマーク検出器を学習する。
本手法は,bbcのポーズデータセットやcat-headデータセットなど,いくつかの難易度の高いランドマーク検出データセットを生成する。
他のベンチマークで比較可能。
関連論文リスト
- FM-OSD: Foundation Model-Enabled One-Shot Detection of Anatomical Landmarks [44.54301473673582]
医用画像のランドマーク検出を高精度に行うための,最初の基礎モデル付きワンショットランドマーク検出(FM-OSD)フレームワークを提案する。
本手法は,単一のテンプレート画像のみを用いることで,最先端のワンショットランドマーク検出法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-07-07T15:37:02Z) - Unsupervised learning based object detection using Contrastive Learning [6.912349403119665]
本研究では,教師なし・自己教師型学習を通じて,単段階物体検出装置を訓練するための画期的な手法を提案する。
我々の最先端のアプローチはラベリングプロセスに革命をもたらす可能性を秘めており、手動アノテーションに関連する時間とコストを大幅に削減する。
我々は、画像間のコントラスト学習という概念を創始し、重要な位置情報の取得を可能にした。
論文 参考訳(メタデータ) (2024-02-21T01:44:15Z) - Towards Multi-domain Face Landmark Detection with Synthetic Data from
Diffusion model [27.307563102526192]
深層学習に基づく眼球内顔の顔のランドマーク検出は、大幅な改善が達成された。
他の領域(漫画、似顔絵など)では、顔のランドマーク検出にはまだ課題がある。
限られたデータセットと事前学習拡散モデルを効果的に活用する2段階のトレーニング手法を設計する。
提案手法は,マルチドメイン顔ランドマーク検出における既存手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-01-24T02:35:32Z) - Weakly-supervised deepfake localization in diffusion-generated images [4.548755617115687]
本稿では,Xception ネットワークをバックボーンアーキテクチャとして用いた弱教師付きローカライズ問題を提案する。
本研究では,(局所スコアに基づく)最良動作検出法は,データセットやジェネレータのミスマッチよりも,より緩やかな監視に敏感であることを示す。
論文 参考訳(メタデータ) (2023-11-08T10:27:36Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Weakly-supervised 3D Pose Transfer with Keypoints [57.66991032263699]
3Dポーズ転送の主な課題は、1) 異なる文字で同じポーズを行うペアトレーニングデータの欠如、2) ターゲットメッシュからポーズと形状情報を分離すること、3) 異なるトポロジを持つメッシュに適用することの難しさである。
本稿では,これらの課題を克服するためのキーポイントベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T12:40:24Z) - From Keypoints to Object Landmarks via Self-Training Correspondence: A
novel approach to Unsupervised Landmark Discovery [37.78933209094847]
本稿ではオブジェクトランドマーク検出器の教師なし学習のための新しいパラダイムを提案する。
我々はLS3D、BBCPose、Human3.6M、PennActionなどの難解なデータセットに対して本手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-05-31T15:44:29Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。