論文の概要: Generative Landmarks
- arxiv url: http://arxiv.org/abs/2104.04055v1
- Date: Thu, 8 Apr 2021 20:59:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-12 14:11:31.406896
- Title: Generative Landmarks
- Title(参考訳): 生成的ランドマーク
- Authors: David Ferman, Gaurav Bharaj
- Abstract要約: ほとんどの粗末なランドマーク検出手法は、手作業でラベル付きランドマークに依存する。
画像翻訳問題としてランドマーク検出を提案する。
生成的対向ネットワークと循環的整合性を用いてランドマークテンプレートの変形を予測する。
- 参考スコア(独自算出の注目度): 1.6286844497313562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a general purpose approach to detect landmarks with improved
temporal consistency, and personalization. Most sparse landmark detection
methods rely on laborious, manually labelled landmarks, where inconsistency in
annotations over a temporal volume leads to sub-optimal landmark learning.
Further, high-quality landmarks with personalization is often hard to achieve.
We pose landmark detection as an image translation problem. We capture two sets
of unpaired marked (with paint) and unmarked videos. We then use a generative
adversarial network and cyclic consistency to predict deformations of landmark
templates that simulate markers on unmarked images until these images are
indistinguishable from ground-truth marked images. Our novel method does not
rely on manually labelled priors, is temporally consistent, and image class
agnostic -- face, and hand landmarks detection examples are shown.
- Abstract(参考訳): 時間的一貫性とパーソナライゼーションを改善したランドマーク検出のための汎用的アプローチを提案する。
わずかなランドマーク検出手法のほとんどは、時間的ボリューム上のアノテーションの不整合が最適なランドマーク学習につながる、手作業でラベル付けされたランドマークに依存している。
さらに、パーソナライズされた高品質なランドマークは達成が難しいことが多い。
画像翻訳問題としてランドマーク検出を提案する。
2セットの未表示のマーク(ペイント付き)と未マークの動画を撮影した。
次に,生成的逆ネットワークと周期的一貫性を用いて,非マーク画像のマーカーをシミュレートするランドマークテンプレートの変形を予測した。
我々の新しい手法は手動でラベル付けされた先行情報に頼らず、時間的に一貫性があり、画像クラスに依存しない顔と手動ランドマークの検出例を示す。
関連論文リスト
- FM-OSD: Foundation Model-Enabled One-Shot Detection of Anatomical Landmarks [44.54301473673582]
医用画像のランドマーク検出を高精度に行うための,最初の基礎モデル付きワンショットランドマーク検出(FM-OSD)フレームワークを提案する。
本手法は,単一のテンプレート画像のみを用いることで,最先端のワンショットランドマーク検出法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-07-07T15:37:02Z) - The Treasure Beneath Multiple Annotations: An Uncertainty-aware Edge
Detector [70.43599299422813]
既存のメソッドは、単純な投票プロセスを使用して複数のアノテーションを融合し、エッジ固有の曖昧さを無視し、アノテータのラベル付けバイアスを無視する。
多様なアノテーションの主観性とあいまいさを調査するために不確実性を利用した新しい不確実性認識エッジ検出器(UAED)を提案する。
UAEDは複数のエッジ検出ベンチマークで一貫したパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-03-21T13:14:36Z) - Towards Accurate Facial Landmark Detection via Cascaded Transformers [14.74021483826222]
本稿では,カスケードトランスを用いた正確な顔のランドマーク検出手法を提案する。
トランスにおける自己注意によって、我々のモデルは本質的にランドマーク間の構造化された関係を活用できる。
このモデルでは, 目標ランドマークの周囲に最も関連性の高い画像の特徴を抽出し, 座標予測を行う。
論文 参考訳(メタデータ) (2022-08-23T08:42:13Z) - From Keypoints to Object Landmarks via Self-Training Correspondence: A
novel approach to Unsupervised Landmark Discovery [37.78933209094847]
本稿ではオブジェクトランドマーク検出器の教師なし学習のための新しいパラダイムを提案する。
我々はLS3D、BBCPose、Human3.6M、PennActionなどの難解なデータセットに対して本手法の有効性を検証した。
論文 参考訳(メタデータ) (2022-05-31T15:44:29Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Content-Based Detection of Temporal Metadata Manipulation [91.34308819261905]
画像の撮像時間とその内容と地理的位置とが一致しているかどうかを検証するためのエンドツーエンドのアプローチを提案する。
中心となる考え方は、画像の内容、キャプチャ時間、地理的位置が一致する確率を予測するための教師付き一貫性検証の利用である。
我々のアプローチは、大規模なベンチマークデータセットの以前の作業により改善され、分類精度が59.03%から81.07%に向上した。
論文 参考訳(メタデータ) (2021-03-08T13:16:19Z) - End-to-End Lane Marker Detection via Row-wise Classification [13.82948181492772]
自律運転では、信頼性が高く正確な車線マーカーの位置を検出することが重要な課題である。
レーンマーカー検出問題に対する従来のアプローチは、ピクセルレベルの高密度予測タスクを実行し、その後に洗練された後処理を行う。
後処理のステップを使わずに,エンドツーエンドで直接車線マーカー予測を行う手法を提案する。
論文 参考訳(メタデータ) (2020-05-06T12:48:46Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。