Fugu-MT 論文翻訳(概要): KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration

論文の概要: KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration

arxiv url: http://arxiv.org/abs/2305.16437v3
Date: Mon, 18 Sep 2023 03:25:27 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-19 23:37:45.153324
Title: KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration
Title（参考訳）: KeyPosS: GPSによるTrue-Range Multilaterationによるプラグアンドプレイ顔画像検出
Authors: Xu Bao, Zhi-Qi Cheng, Jun-Yan He, Chenyang Li, Wangmeng Xiang, Jingdong Sun, Hanbing Liu, Wei Liu, Bin Luo, Yifeng Geng, Xuansong Xie
Abstract要約: KeyPoint Positioning System (KeyPosS) は、関心点と完全な畳み込みネットワークによって予測されるアンカー点の距離を三角にして正確なランドマーク座標を導出する最初のフレームワークである。 4つのデータセットの実験では、計算オーバーヘッドが最小限であるにもかかわらず、KeyPosSは、解像度の低い設定で既存のメソッドを上回り、最先端のパフォーマンスを示している。
参考スコア（独自算出の注目度）: 28.96448680048584
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Accurate facial landmark detection is critical for facial analysis tasks, yet prevailing heatmap and coordinate regression methods grapple with prohibitive computational costs and quantization errors. Through comprehensive theoretical analysis and experimentation, we identify and elucidate the limitations of existing techniques. To overcome these challenges, we pioneer the application of True-Range Multilateration, originally devised for GPS localization, to facial landmark detection. We propose KeyPoint Positioning System (KeyPosS) - the first framework to deduce exact landmark coordinates by triangulating distances between points of interest and anchor points predicted by a fully convolutional network. A key advantage of KeyPosS is its plug-and-play nature, enabling flexible integration into diverse decoding pipelines. Extensive experiments on four datasets demonstrate state-of-the-art performance, with KeyPosS outperforming existing methods in low-resolution settings despite minimal computational overhead. By spearheading the integration of Multilateration with facial analysis, KeyPosS marks a paradigm shift in facial landmark detection. The code is available at https://github.com/zhiqic/KeyPosS.
Abstract（参考訳）: 顔のランドマークの正確な検出は、顔の分析作業には不可欠であるが、熱マップと座標回帰法は、計算コストや量子化エラーに対処する。包括的理論的分析と実験を通じて,既存の手法の限界を特定し,解明する。これらの課題を克服するために、当初GPSの局所化のために開発されたTrue-Range Multilaterationの顔のランドマーク検出への応用を開拓した。完全畳み込みネットワークによって予測される注目点とアンカー点の距離を三角にして正確なランドマーク座標を推定する最初のフレームワークであるKeyPoint Positioning System(KeyPosS)を提案する。 KeyPosSの重要な利点は、様々なデコードパイプラインへの柔軟な統合を可能にする、プラグアンドプレイの性質である。 4つのデータセットに関する広範囲な実験が最先端のパフォーマンスを示している。顔分析とMultilaterationの統合を先導することで、KeyPosSは顔のランドマーク検出のパラダイムシフトを示す。コードはhttps://github.com/zhiqic/keypossで入手できる。

関連論文リスト

From Pairs to Sequences: Track-Aware Policy Gradients for Keypoint Detection [23.384541298514574]
キーポイントベースのマッチングは、Structure-from-Motion (SfM) やSLAMといった現代の3Dビジョンシステムの基本コンポーネントである。本稿では,キーポイントを直接画像シーケンス上で最適化する新しいエンドツーエンド強化学習フレームワークであるTraqPointを紹介する。私たちの中核的なイノベーションは、複数のビューにまたがるキーポイントの一貫性と特異性を共同で促進する、トラックアウェアの報酬メカニズムです。
論文参考訳（メタデータ） (2026-02-24T07:24:25Z)
XRefine: Attention-Guided Keypoint Match Refinement [2.318985488473778]
XRefineは、サブピクセルキーポイントの改良のための、新しい、検出器に依存しないアプローチである。我々のクロスアテンションに基づくアーキテクチャは、内部検出器表現に頼ることなく、改良されたキーポイント座標を予測することを学ぶ。 MegaDepth、KITTI、ScanNetの実験では、このアプローチが幾何推定精度を一貫して改善することを示した。
論文参考訳（メタデータ） (2026-01-18T18:32:53Z)
Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文参考訳（メタデータ） (2024-07-16T12:39:56Z)
X-Pose: Detecting Any Keypoints [28.274913140048003]
X-Poseは画像内の複数オブジェクトのキーポイント検出のための新しいフレームワークである。 UniKPTはキーポイント検出データセットの大規模なデータセットである。 X-Poseは、最先端の非プロンプタブル、視覚的プロンプトベース、テキスト的プロンプトベースメソッドに対する顕著な改善を実現している。
論文参考訳（メタデータ） (2023-10-12T17:22:58Z)
DeDoDe: Detect, Don't Describe -- Describe, Don't Detect for Local Feature Matching [14.837075102089]
キーポイント検出は3次元再構成において重要なステップであり、シーンの各ビューで最大K点のセットを検出する。従来の学習に基づく手法は、通常、キーポイントを持つ記述子を学習し、キーポイント検出を隣り合う隣人の二項分類タスクとして扱う。本研究は, キーポイントを3次元整合性から直接学習し, この目的を達成するための半教師付き2視点検出目標を導出する。その結果,複数の幾何ベンチマークにおいて,DeDoDeという手法が大幅に向上していることが判明した。
論文参考訳（メタデータ） (2023-08-16T16:37:02Z)
COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文参考訳（メタデータ） (2023-08-03T03:37:13Z)
Towards Accurate Facial Landmark Detection via Cascaded Transformers [14.74021483826222]
本稿では,カスケードトランスを用いた正確な顔のランドマーク検出手法を提案する。トランスにおける自己注意によって、我々のモデルは本質的にランドマーク間の構造化された関係を活用できる。このモデルでは, 目標ランドマークの周囲に最も関連性の高い画像の特徴を抽出し, 座標予測を行う。
論文参考訳（メタデータ） (2022-08-23T08:42:13Z)
From Keypoints to Object Landmarks via Self-Training Correspondence: A novel approach to Unsupervised Landmark Discovery [37.78933209094847]
本稿ではオブジェクトランドマーク検出器の教師なし学習のための新しいパラダイムを提案する。我々はLS3D、BBCPose、Human3.6M、PennActionなどの難解なデータセットに対して本手法の有効性を検証した。
論文参考訳（メタデータ） (2022-05-31T15:44:29Z)
Self-Supervised Equivariant Learning for Oriented Keypoint Detection [35.94215211409985]
我々は、回転同変CNNを用いた自己教師付き学習フレームワークを導入し、ロバスト指向キーポイントの検出を学習する。ヒストグラムに基づく配向マップのトレーニングのために,合成変換により生成した画像対による高密度配向損失を提案する。提案手法は,画像マッチングベンチマークとカメラポーズ推定ベンチマークにおいて,従来の手法よりも優れていた。
論文参考訳（メタデータ） (2022-04-19T02:26:07Z)
SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文参考訳（メタデータ） (2022-01-06T08:54:47Z)
Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文参考訳（メタデータ） (2021-04-07T05:42:11Z)
Robust Facial Landmark Detection by Cross-order Cross-semantic Deep Network [58.843211405385205]
顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
論文参考訳（メタデータ） (2020-11-16T08:19:26Z)
Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文参考訳（メタデータ） (2020-03-18T17:22:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。