論文の概要: Coordinated Transformer with Position \& Sample-aware Central Loss for
Anatomical Landmark Detection
- arxiv url: http://arxiv.org/abs/2305.11338v1
- Date: Thu, 18 May 2023 23:05:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-22 16:59:43.000538
- Title: Coordinated Transformer with Position \& Sample-aware Central Loss for
Anatomical Landmark Detection
- Title(参考訳): 解剖学的ランドマーク検出のための位置印とサンプル認識中央損失の協調変換器
- Authors: Qikui Zhu, Yihui Bi, Danxin Wang, Xiangpeng Chu, Jie Chen, Yanqing
Wang
- Abstract要約: 熱マップに基づく解剖学的ランドマーク検出はまだ2つの未解決課題に直面している。
我々は新しい位置認識とサンプル認識中心損失を提案する。
構造情報の無視という課題に対処するために,CoorTransformerと呼ばれる協調変換器を提案する。
- 参考スコア(独自算出の注目度): 6.004522909994631
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heatmap-based anatomical landmark detection is still facing two unresolved
challenges: 1) inability to accurately evaluate the distribution of heatmap; 2)
inability to effectively exploit global spatial structure information. To
address the computational inability challenge, we propose a novel
position-aware and sample-aware central loss. Specifically, our central loss
can absorb position information, enabling accurate evaluation of the heatmap
distribution. More advanced is that our central loss is sample-aware, which can
adaptively distinguish easy and hard samples and make the model more focused on
hard samples while solving the challenge of extreme imbalance between landmarks
and non-landmarks. To address the challenge of ignoring structure information,
a Coordinated Transformer, called CoorTransformer, is proposed, which
establishes long-range dependencies under the guidance of landmark coordination
information, making the attention more focused on the sparse landmarks while
taking advantage of global spatial structure. Furthermore, CoorTransformer can
speed up convergence, effectively avoiding the defect that Transformers have
difficulty converging in sparse representation learning. Using the advanced
CoorTransformer and central loss, we propose a generalized detection model that
can handle various scenarios, inherently exploiting the underlying relationship
between landmarks and incorporating rich structural knowledge around the target
landmarks. We analyzed and evaluated CoorTransformer and central loss on three
challenging landmark detection tasks. The experimental results show that our
CoorTransformer outperforms state-of-the-art methods, and the central loss
significantly improves the performance of the model with p-values< 0.05.
- Abstract(参考訳): 熱マップに基づく解剖学的ランドマーク検出はまだ2つの未解決課題に直面している。
1) ヒートマップの分布を正確に評価できないこと
2)グローバル空間構造情報を効果的に活用できない。
計算不能問題に対処するために,新しい位置認識およびサンプル認識中心損失を提案する。
具体的には、中央損失は位置情報を吸収し、ヒートマップ分布の正確な評価を可能にする。
これにより、ランドマークと非ランドマークの極端な不均衡という課題を解決しつつ、簡単でハードなサンプルを適応的に区別し、ハードなサンプルにもっと集中させることができる。
構造情報の無視という課題に対処するため,CoorTransformerと呼ばれるコーディネートトランスフォーマーが,ランドマーク調整情報の指導の下で長距離依存を確立し,グローバル空間構造を生かしつつ,スパークランドマークに注目する。
さらに、coortransformerはコンバージェンスを高速化でき、トランスフォーマがスパース表現学習で収束しにくい欠陥を効果的に回避できる。
先進的なCoorTransformerと中心的損失を用いて,ランドマーク間の基盤となる関係を本質的に活用し,ターゲットランドマーク周辺の豊富な構造的知識を取り入れた,様々なシナリオを処理可能な一般化検出モデルを提案する。
3つの困難なランドマーク検出タスクにおいて, coortransformer と central loss を分析し, 評価した。
実験の結果,CoorTransformerは最先端の手法よりも優れており,中心的な損失はp値0.05のモデルの性能を著しく向上させることがわかった。
関連論文リスト
- Kriformer: A Novel Spatiotemporal Kriging Approach Based on Graph Transformers [5.4381914710364665]
本研究は, 環境問題として, スパースセンサの配置と信頼性の低いデータに対処する。
グラフクリフォーマーモデルであるKriformerは、限られた資源であっても、空間的および時間的相関をマイニングすることで、センサのない場所でデータを推定する。
論文 参考訳(メタデータ) (2024-09-23T11:01:18Z) - Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Unsupervised Landmark Discovery Using Consistency Guided Bottleneck [63.624186864522315]
画像再構成に基づくパイプラインに一貫性のあるボトルネックを導入する。
本稿では,画像間のランドマーク対応を形成することによって,擬似スーパービジョンを得る手法を提案する。
この一貫性は、アダプティブ・ヒートマップの生成において発見されたランドマークの不確かさを変調する。
論文 参考訳(メタデータ) (2023-09-19T10:57:53Z) - Weakly-supervised 3D Pose Transfer with Keypoints [57.66991032263699]
3Dポーズ転送の主な課題は、1) 異なる文字で同じポーズを行うペアトレーニングデータの欠如、2) ターゲットメッシュからポーズと形状情報を分離すること、3) 異なるトポロジを持つメッシュに適用することの難しさである。
本稿では,これらの課題を克服するためのキーポイントベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-25T12:40:24Z) - Semi-Supervised Building Footprint Generation with Feature and Output
Consistency Training [17.6179873429447]
一貫性トレーニングを備えた最先端の半教師付きセマンティックセマンティクスネットワークは、この問題に対処するのに役立ちます。
ラベルなしサンプルのエンドツーエンドネットワークトレーニングにおいて,特徴と出力の整合性を統合することを提案する。
実験により, 提案手法により, より完全な構造を抽出できることが示唆された。
論文 参考訳(メタデータ) (2022-05-17T14:55:13Z) - Robust Self-Supervised LiDAR Odometry via Representative Structure
Discovery and 3D Inherent Error Modeling [67.75095378830694]
そこで我々は,2段階のオドメトリ推定ネットワークを構築し,一連の部分領域変換を推定してエゴモーメントを求める。
本稿では,トレーニング,推論,マッピングフェーズにおける信頼できない構造の影響を軽減することを目的とする。
我々の2フレームのオードメトリーは、翻訳/回転誤差の点で、過去の芸術の状態を16%/12%上回っている。
論文 参考訳(メタデータ) (2022-02-27T12:52:27Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - Toward Minimal Misalignment at Minimal Cost in One-Stage and Anchor-Free
Object Detection [6.486325109549893]
分類と回帰の分岐は、同じ規模と同じ空間的位置から特徴に対して異なる感受性を持つ。
本稿では,高い分類信頼点が高い回帰品質を持つという仮定に基づいて,点に基づく予測手法を提案する。
我々は,この現象を最小限のコストで解決することを目指しており,頭部ネットワークの微調整と,剛体ネットワークを置き換えた新しいラベル割り当て手法を提案する。
論文 参考訳(メタデータ) (2021-12-16T14:22:13Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。