論文の概要: Revisiting Cephalometric Landmark Detection from the view of Human Pose
Estimation with Lightweight Super-Resolution Head
- arxiv url: http://arxiv.org/abs/2309.17143v1
- Date: Fri, 29 Sep 2023 11:15:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-02 14:24:12.517877
- Title: Revisiting Cephalometric Landmark Detection from the view of Human Pose
Estimation with Lightweight Super-Resolution Head
- Title(参考訳): 軽量超解像頭を用いた人文推定の観点からのケパロメトリランドマーク検出の再検討
- Authors: Qian Wu and Si Yong Yeo and Yufei Chen and Jun Liu
- Abstract要約: 提案手法は,MMPose として知られるヒューマノイドポーズ推定(HPE)に基づくベンチマークである。
パフォーマンスをさらに向上するために、フレームワーク内にアップスケーリング設計を導入します。
MICCAI CLDetection2023では,3つの指標で1位,残る1つで3位となった。
- 参考スコア(独自算出の注目度): 11.40242574405714
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate localization of cephalometric landmarks holds great importance in
the fields of orthodontics and orthognathics due to its potential for
automating key point labeling. In the context of landmark detection,
particularly in cephalometrics, it has been observed that existing methods
often lack standardized pipelines and well-designed bias reduction processes,
which significantly impact their performance. In this paper, we revisit a
related task, human pose estimation (HPE), which shares numerous similarities
with cephalometric landmark detection (CLD), and emphasize the potential for
transferring techniques from the former field to benefit the latter. Motivated
by this insight, we have developed a robust and adaptable benchmark based on
the well-established HPE codebase known as MMPose. This benchmark can serve as
a dependable baseline for achieving exceptional CLD performance. Furthermore,
we introduce an upscaling design within the framework to further enhance
performance. This enhancement involves the incorporation of a lightweight and
efficient super-resolution module, which generates heatmap predictions on
high-resolution features and leads to further performance refinement,
benefiting from its ability to reduce quantization bias. In the MICCAI
CLDetection2023 challenge, our method achieves 1st place ranking on three
metrics and 3rd place on the remaining one. The code for our method is
available at https://github.com/5k5000/CLdetection2023.
- Abstract(参考訳): 正確な脳波ランドマークの定位は、キーポイントラベリングの自動化の可能性から、矯正学や矯正学の分野で非常に重要である。
ランドマーク検出、特に脳波学の文脈では、既存の手法には標準化されたパイプラインやよく設計されたバイアス低減プロセスが欠如していることが観察されている。
本稿では,脳波ランドマーク検出(CLD)と多くの類似点を持つヒューマンポーズ推定(HPE)の課題を再考し,後者の利点を活かすため,前者フィールドからの技術移転の可能性を強調した。
この知見に触発されて、我々はMMPoseとして知られるよく確立されたHPEコードベースに基づく堅牢で適応可能なベンチマークを開発した。
このベンチマークは、例外的なCLDパフォーマンスを達成するための信頼性の高いベースラインとして機能する。
さらに,フレームワーク内にアップスケーリング設計を導入し,パフォーマンスをさらに向上する。
この強化には軽量で効率的な超解像モジュールが組み込まれ、高分解能特性のヒートマップ予測を発生させ、量子化バイアスを減らす能力によってさらなる性能改善をもたらす。
miccai cldetection2023チャレンジでは、3つの指標でランキング1位、残りで3位となった。
このメソッドのコードはhttps://github.com/5k5000/cldetection2023で入手できる。
関連論文リスト
- Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - High-level Feature Guided Decoding for Semantic Segmentation [54.424062794490254]
そこで本稿では,アップサンプラーが頑健な結果を得るためのガイダンス(HFG)として,強力な事前学習高レベル機能を提案する。
具体的には、バックボーンの高レベルな機能はクラストークンのトレーニングに使用され、クラストークンはクラス分類のためにアップサンプラーによって再利用される。
HFGの上限を押し上げるために、低解像度の高レベル特徴に対して効率よく効果的に操作できる文脈拡張エンコーダ(CAE)を導入する。
論文 参考訳(メタデータ) (2023-03-15T14:23:07Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - Occlusion-Robust Object Pose Estimation with Holistic Representation [42.27081423489484]
State-of-the-art(SOTA)オブジェクトのポーズ推定器は2段階のアプローチを取る。
我々は,新しいブロック・アンド・ブラックアウトバッチ拡張技術を開発した。
また,総合的なポーズ表現学習を促進するためのマルチ精度監視アーキテクチャも開発している。
論文 参考訳(メタデータ) (2021-10-22T08:00:26Z) - Learn Fine-grained Adaptive Loss for Multiple Anatomical Landmark
Detection in Medical Images [15.7026400415269]
本稿ではランドマーク検出のための新しい学習学習フレームワークを提案する。
提案手法は汎用的であり,解剖学的ランドマーク検出の効率向上の可能性を示す。
論文 参考訳(メタデータ) (2021-05-19T13:39:18Z) - Lite-FPN for Keypoint-based Monocular 3D Object Detection [18.03406686769539]
keypointベースのモノクロ3dオブジェクト検出は、非常に進歩し、高い速度精度のトレードオフを達成した。
マルチスケール機能融合を実現する軽量機能ピラミッドネットワークLite-FPNを提案します。
提案手法は,高い精度とフレームレートを同時に達成する。
論文 参考訳(メタデータ) (2021-05-01T14:44:31Z) - Towards High Performance Human Keypoint Detection [87.1034745775229]
文脈情報は人体構成や見えないキーポイントを推論する上で重要な役割を担っている。
そこで我々は,空間とチャネルのコンテキスト情報を効率的に統合するカスケードコンテキストミキサー(CCM)を提案する。
CCMの表現能力を最大化するために、我々は、強陰性な人検出マイニング戦略と共同訓練戦略を開発する。
検出精度を向上させるために,キーポイント予測を後処理するためのいくつかのサブピクセル改良手法を提案する。
論文 参考訳(メタデータ) (2020-02-03T02:24:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。