論文の概要: DATR: Domain-adaptive transformer for multi-domain landmark detection
- arxiv url: http://arxiv.org/abs/2203.06433v1
- Date: Sat, 12 Mar 2022 13:22:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-15 15:12:36.342726
- Title: DATR: Domain-adaptive transformer for multi-domain landmark detection
- Title(参考訳): datr:マルチドメインランドマーク検出のためのドメイン適応トランス
- Authors: Heqin Zhu, Qingsong Yao, S. Kevin Zhou
- Abstract要約: 本稿では,多領域ランドマーク検出のための多元的モデルを提案する。
我々はDATRと呼ばれるドメイン適応型トランスフォーマーモデルを開発し、異なる解剖学から複数の混合データセットをトレーニングする。
提案するDATRは,従来の畳み込みモデルよりも優れた動作を示す。
- 参考スコア(独自算出の注目度): 15.929852667227003
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate anatomical landmark detection plays an increasingly vital role in
medical image analysis. Although existing methods achieve satisfying
performance, they are mostly based on CNN and specialized for a single domain
say associated with a particular anatomical region. In this work, we propose a
universal model for multi-domain landmark detection by taking advantage of
transformer for modeling long dependencies and develop a domain-adaptive
transformer model, named as DATR, which is trained on multiple mixed datasets
from different anatomies and capable of detecting landmarks of any image from
those anatomies. The proposed DATR exhibits three primary features: (i) It is
the first universal model which introduces transformer as an encoder for
multi-anatomy landmark detection; (ii) We design a domain-adaptive transformer
for anatomy-aware landmark detection, which can be effectively extended to any
other transformer network; (iii) Following previous studies, we employ a
light-weighted guidance network, which encourages the transformer network to
detect more accurate landmarks. We carry out experiments on three widely used
X-ray datasets for landmark detection, which have 1,588 images and 62 landmarks
in total, including three different anatomies (head, hand, and chest).
Experimental results demonstrate that our proposed DATR achieves
state-of-the-art performances by most metrics and behaves much better than any
previous convolution-based models. The code will be released publicly.
- Abstract(参考訳): 正確な解剖学的ランドマーク検出は、医療画像解析においてますます重要な役割を果たす。
既存の手法は性能を満足するが、ほとんどはcnnに基づいており、特定の解剖学的領域に関連する単一のドメイン say に特化している。
本稿では,多領域ランドマーク検出のための汎用モデルを提案する。長い依存関係のモデル化にtransformerを活用し,datrと呼ばれるドメイン適応型トランスフォーマーモデルを開発し,異なる解剖学の複数の混合データセット上でトレーニングし,それらの解剖から任意の画像のランドマークを検出する。
提案したDATRには3つの特徴がある。
(i)マルチ解剖学的ランドマーク検出のためのエンコーダとしてトランスフォーマーを導入する最初のユニバーサルモデルである。
(II)解剖学的ランドマーク検出のためのドメイン適応型トランスフォーマーを設計し,これを他のトランスネットワークに効果的に拡張する。
3) 先行研究の後, トランスフォーマーネットワークがより正確なランドマークを検出することを奨励する軽量誘導ネットワークを採用した。
我々は,3つの異なる解剖学(頭部,手,胸部)を含む1,588枚の画像と62個のランドマークを持つランドマーク検出のために,広く使用されている3つのX線データセットの実験を行った。
実験の結果,提案するdatrは,従来の畳み込みモデルよりも動作が良好であることがわかった。
コードは公開される予定だ。
関連論文リスト
- Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - Hierarchical Point Attention for Indoor 3D Object Detection [111.04397308495618]
本研究は、点ベース変圧器検出器の汎用階層設計として、2つの新しい注意操作を提案する。
まず、よりきめ細かい特徴学習を可能にするために、シングルスケールの入力機能からマルチスケールトークンを構築するマルチスケール注意(MS-A)を提案する。
第2に,適応型アテンション領域を持つサイズ適応型ローカルアテンション(Local-A)を提案する。
論文 参考訳(メタデータ) (2023-01-06T18:52:12Z) - View-Disentangled Transformer for Brain Lesion Detection [50.4918615815066]
より正確な腫瘍検出のためのMRI特徴抽出のための新しいビューディペンタングル変換器を提案する。
まず, 3次元脳スキャンにおいて, 異なる位置の長距離相関を求める。
第二に、トランスフォーマーはスライス機能のスタックを複数の2Dビューとしてモデル化し、これらの機能をビュー・バイ・ビューとして拡張する。
第三に、提案したトランスモジュールをトランスのバックボーンに展開し、脳病変を取り巻く2D領域を効果的に検出する。
論文 参考訳(メタデータ) (2022-09-20T11:58:23Z) - Focused Decoding Enables 3D Anatomical Detection by Transformers [64.36530874341666]
集束デコーダと呼ばれる3次元解剖学的構造検出のための新しい検出変換器を提案する。
Focused Decoderは、解剖学的領域のアトラスからの情報を活用して、クエリアンカーを同時にデプロイし、クロスアテンションの視野を制限する。
提案手法を利用可能な2つのCTデータセットに対して評価し、フォーカスドデコーダが強力な検出結果を提供するだけでなく、大量の注釈付きデータの必要性を軽減し、注意重みによる結果の例外的で直感的な説明性を示すことを示した。
論文 参考訳(メタデータ) (2022-07-21T22:17:21Z) - Class-Aware Generative Adversarial Transformers for Medical Image
Segmentation [39.14169989603906]
医用画像セグメンテーションのための新規な生成逆変換器CA-GANformerを提案する。
まず、ピラミッド構造を利用してマルチスケール表現を構築し、マルチスケールのバリエーションを扱う。
次に、意味構造を持つオブジェクトの識別領域をよりよく学習するために、新しいクラス対応トランスフォーマーモジュールを設計する。
論文 参考訳(メタデータ) (2022-01-26T03:50:02Z) - Hepatic vessel segmentation based on 3Dswin-transformer with inductive
biased multi-head self-attention [46.46365941681487]
Indu BIased Multi-Head Attention Vessel Net という,堅牢なエンドツーエンドのコンテナセグメンテーションネットワークを提案する。
正確な肝血管のボクセルを見つけるために,パッチワイド埋め込みよりもボクセルワイド埋め込みを導入する。
一方,絶対位置埋め込みから帰納的バイアス付き相対的位置埋め込みを学習する帰納的バイアス付きマルチヘッド自己アテンションを提案する。
論文 参考訳(メタデータ) (2021-11-05T10:17:08Z) - DA-DETR: Domain Adaptive Detection Transformer with Information Fusion [53.25930448542148]
DA-DETRは、ラベル付きソースドメインからラベルなしターゲットドメインへの効果的な転送のための情報融合を導入するドメイン適応型オブジェクト検出変換器である。
本稿では,CNN機能とトランスフォーマー機能を融合した新しいCNN-Transformer Blender(CTBlender)を提案する。
CTBlenderはTransformer機能を使用して、高レベルの意味情報と低レベルの空間情報が融合した複数のスケールでCNN機能を変調し、正確な物体識別と位置決めを行う。
論文 参考訳(メタデータ) (2021-03-31T13:55:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。