Fugu-MT 論文翻訳(概要): KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration

論文の概要: KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration

arxiv url: http://arxiv.org/abs/2305.16437v2
Date: Fri, 18 Aug 2023 16:54:02 GMT
ステータス: 翻訳完了
システム内更新日: 2023-08-21 23:47:26.265286
Title: KeyPosS: Plug-and-Play Facial Landmark Detection through GPS-Inspired True-Range Multilateration
Title（参考訳）: KeyPosS: GPSによるTrue-Range Multilaterationによるプラグアンドプレイ顔画像検出
Authors: Xu Bao, Zhi-Qi Cheng, Jun-Yan He, Chenyang Li, Wangmeng Xiang, Jingdong Sun, Hanbing Liu, Wei Liu, Bin Luo, Yifeng Geng, Xuansong Xie
Abstract要約: KeyPoint Positioning System (KeyPosS) は画期的な顔のランドマーク検出フレームワークである。 KeyPosSは完全な畳み込みネットワークを使用して距離マップを予測し、ポイント・オブ・興味(POI)と複数のアンカーポイントの間の距離を計算する。その結果,KeyPosSは低解像度設定で先行手法を著しく上回っていることがわかった。
参考スコア（独自算出の注目度）: 28.96448680048584
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In the realm of facial analysis, accurate landmark detection is crucial for various applications, ranging from face recognition and expression analysis to animation. Conventional heatmap or coordinate regression-based techniques, however, often face challenges in terms of computational burden and quantization errors. To address these issues, we present the KeyPoint Positioning System (KeyPosS) - a groundbreaking facial landmark detection framework that stands out from existing methods. The framework utilizes a fully convolutional network to predict a distance map, which computes the distance between a Point of Interest (POI) and multiple anchor points. These anchor points are ingeniously harnessed to triangulate the POI's position through the True-range Multilateration algorithm. Notably, the plug-and-play nature of KeyPosS enables seamless integration into any decoding stage, ensuring a versatile and adaptable solution. We conducted a thorough evaluation of KeyPosS's performance by benchmarking it against state-of-the-art models on four different datasets. The results show that KeyPosS substantially outperforms leading methods in low-resolution settings while requiring a minimal time overhead. The code is available at https://github.com/zhiqic/KeyPosS.
Abstract（参考訳）: 顔分析の分野では、顔認識や表情分析からアニメーションまで、さまざまな応用において正確なランドマーク検出が重要である。しかし、従来のヒートマップや座標回帰に基づく手法は計算負荷や量子化誤差の点でしばしば問題に直面している。これらの問題に対処するために、KeyPoint Positioning System (KeyPosS) という、既存の手法とは違い画期的な顔のランドマーク検出フレームワークを紹介します。このフレームワークは完全畳み込みネットワークを利用して距離マップを予測し、poi(point of interest)と複数のアンカーポイントの間の距離を計算する。これらのアンカーポイントは、True-range Multilaterationアルゴリズムを通じてPOIの位置を三角測量するために巧妙に活用される。特に、KeyPosSのプラグ&プレイの性質は、任意のデコードステージへのシームレスな統合を可能にし、汎用的で適応可能なソリューションを保証する。我々は、4つの異なるデータセットの最先端モデルと比較し、KeyPosSの性能を徹底的に評価した。その結果、KeyPosSは低解像度設定でリードメソッドを著しく上回り、時間オーバーヘッドは最小限であることがわかった。コードはhttps://github.com/zhiqic/keypossで入手できる。

関連論文リスト

From Pairs to Sequences: Track-Aware Policy Gradients for Keypoint Detection [23.384541298514574]
キーポイントベースのマッチングは、Structure-from-Motion (SfM) やSLAMといった現代の3Dビジョンシステムの基本コンポーネントである。本稿では,キーポイントを直接画像シーケンス上で最適化する新しいエンドツーエンド強化学習フレームワークであるTraqPointを紹介する。私たちの中核的なイノベーションは、複数のビューにまたがるキーポイントの一貫性と特異性を共同で促進する、トラックアウェアの報酬メカニズムです。
論文参考訳（メタデータ） (2026-02-24T07:24:25Z)
XRefine: Attention-Guided Keypoint Match Refinement [2.318985488473778]
XRefineは、サブピクセルキーポイントの改良のための、新しい、検出器に依存しないアプローチである。我々のクロスアテンションに基づくアーキテクチャは、内部検出器表現に頼ることなく、改良されたキーポイント座標を予測することを学ぶ。 MegaDepth、KITTI、ScanNetの実験では、このアプローチが幾何推定精度を一貫して改善することを示した。
論文参考訳（メタデータ） (2026-01-18T18:32:53Z)
Learning to Make Keypoints Sub-Pixel Accurate [80.55676599677824]
本研究は,2次元局所特徴の検出におけるサブピクセル精度の課題に対処する。本稿では,検出された特徴に対するオフセットベクトルを学習することにより,サブピクセル精度で検出器を拡張できる新しいネットワークを提案する。
論文参考訳（メタデータ） (2024-07-16T12:39:56Z)
X-Pose: Detecting Any Keypoints [28.274913140048003]
X-Poseは画像内の複数オブジェクトのキーポイント検出のための新しいフレームワークである。 UniKPTはキーポイント検出データセットの大規模なデータセットである。 X-Poseは、最先端の非プロンプタブル、視覚的プロンプトベース、テキスト的プロンプトベースメソッドに対する顕著な改善を実現している。
論文参考訳（メタデータ） (2023-10-12T17:22:58Z)
DeDoDe: Detect, Don't Describe -- Describe, Don't Detect for Local Feature Matching [14.837075102089]
キーポイント検出は3次元再構成において重要なステップであり、シーンの各ビューで最大K点のセットを検出する。従来の学習に基づく手法は、通常、キーポイントを持つ記述子を学習し、キーポイント検出を隣り合う隣人の二項分類タスクとして扱う。本研究は, キーポイントを3次元整合性から直接学習し, この目的を達成するための半教師付き2視点検出目標を導出する。その結果,複数の幾何ベンチマークにおいて,DeDoDeという手法が大幅に向上していることが判明した。
論文参考訳（メタデータ） (2023-08-16T16:37:02Z)
COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文参考訳（メタデータ） (2023-08-03T03:37:13Z)
Towards Accurate Facial Landmark Detection via Cascaded Transformers [14.74021483826222]
本稿では,カスケードトランスを用いた正確な顔のランドマーク検出手法を提案する。トランスにおける自己注意によって、我々のモデルは本質的にランドマーク間の構造化された関係を活用できる。このモデルでは, 目標ランドマークの周囲に最も関連性の高い画像の特徴を抽出し, 座標予測を行う。
論文参考訳（メタデータ） (2022-08-23T08:42:13Z)
From Keypoints to Object Landmarks via Self-Training Correspondence: A novel approach to Unsupervised Landmark Discovery [37.78933209094847]
本稿ではオブジェクトランドマーク検出器の教師なし学習のための新しいパラダイムを提案する。我々はLS3D、BBCPose、Human3.6M、PennActionなどの難解なデータセットに対して本手法の有効性を検証した。
論文参考訳（メタデータ） (2022-05-31T15:44:29Z)
Self-Supervised Equivariant Learning for Oriented Keypoint Detection [35.94215211409985]
我々は、回転同変CNNを用いた自己教師付き学習フレームワークを導入し、ロバスト指向キーポイントの検出を学習する。ヒストグラムに基づく配向マップのトレーニングのために,合成変換により生成した画像対による高密度配向損失を提案する。提案手法は,画像マッチングベンチマークとカメラポーズ推定ベンチマークにおいて,従来の手法よりも優れていた。
論文参考訳（メタデータ） (2022-04-19T02:26:07Z)
SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文参考訳（メタデータ） (2022-01-06T08:54:47Z)
Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文参考訳（メタデータ） (2021-04-07T05:42:11Z)
Robust Facial Landmark Detection by Cross-order Cross-semantic Deep Network [58.843211405385205]
顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
論文参考訳（メタデータ） (2020-11-16T08:19:26Z)
Multi-View Optimization of Local Feature Geometry [70.18863787469805]
本研究では,複数視点からの局所像の特徴の幾何を,未知のシーンやカメラの幾何を伴わずに精査する問題に対処する。提案手法は,従来の特徴抽出とマッチングのパラダイムを自然に補完する。本手法は,手作りと学習の両方の局所的特徴に対して,三角測量とカメラのローカライゼーション性能を常に向上することを示す。
論文参考訳（メタデータ） (2020-03-18T17:22:11Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。