論文の概要: Anisotropic Fourier Features for Positional Encoding in Medical Imaging
- arxiv url: http://arxiv.org/abs/2509.02488v1
- Date: Tue, 02 Sep 2025 16:38:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:04.106652
- Title: Anisotropic Fourier Features for Positional Encoding in Medical Imaging
- Title(参考訳): 医用画像における位置エンコーディングの異方性フーリエ特性
- Authors: Nabil Jabareen, Dongsheng Yuan, Dingming Liu, Foo-Wei Ten, Sören Lukassen,
- Abstract要約: 位置距離 (PE) は, 医用画像撮影の課題に最適である可能性が示唆された。
異方性,クラス固有の,ドメイン固有の依存関係を組み込んだIFPEの一般化であるAnisotropic Feature Positional AFPEを提案する。
その結果,正しいPEを選択することで,モデルの性能が大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 0.2609784101826761
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The adoption of Transformer-based architectures in the medical domain is growing rapidly. In medical imaging, the analysis of complex shapes - such as organs, tissues, or other anatomical structures - combined with the often anisotropic nature of high-dimensional images complicates these adaptations. In this study, we critically examine the role of Positional Encodings (PEs), arguing that commonly used approaches may be suboptimal for the specific challenges of medical imaging. Sinusoidal Positional Encodings (SPEs) have proven effective in vision tasks, but they struggle to preserve Euclidean distances in higher-dimensional spaces. Isotropic Fourier Feature Positional Encodings (IFPEs) have been proposed to better preserve Euclidean distances, but they lack the ability to account for anisotropy in images. To address these limitations, we propose Anisotropic Fourier Feature Positional Encoding (AFPE), a generalization of IFPE that incorporates anisotropic, class-specific, and domain-specific spatial dependencies. We systematically benchmark AFPE against commonly used PEs on multi-label classification in chest X-rays, organ classification in CT images, and ejection fraction regression in echocardiography. Our results demonstrate that choosing the correct PE can significantly improve model performance. We show that the optimal PE depends on the shape of the structure of interest and the anisotropy of the data. Finally, our proposed AFPE significantly outperforms state-of-the-art PEs in all tested anisotropic settings. We conclude that, in anisotropic medical images and videos, it is of paramount importance to choose an anisotropic PE that fits the data and the shape of interest.
- Abstract(参考訳): 医療分野におけるTransformerベースのアーキテクチャの採用は急速に増加している。
医用画像において、臓器、組織、その他の解剖学的構造などの複雑な形状の分析は、高次元画像のしばしば異方性の性質と組み合わさってこれらの適応を複雑にする。
本研究では, 医用画像の特定の課題に対して, 一般的に用いられるアプローチが最適であるとして, 位置エンコーディング(PE)の役割を批判的に検討する。
SPE(sinusoidal Positional Encodings)は視覚タスクにおいて有効であることが証明されているが、高次元空間におけるユークリッド距離の保存に苦慮している。
等方的フーリエ特徴位置符号化(IFPE)はユークリッド距離の保存を改善するために提案されているが、画像中の異方性を説明する能力は欠如している。
これらの制約に対処するため,異方性,クラス固有,ドメイン固有の空間依存を組み込んだIFPEの一般化であるAFPEを提案する。
胸部X線像の多ラベル分類,CT画像の臓器分類,心エコー図の退行率回帰について,AFPEとPEを系統的に比較検討した。
その結果,正しいPEを選択することで,モデルの性能が大幅に向上することが示された。
最適なPEは、データの構造と異方性に依存することを示す。
最後に,提案したAFPEは,すべての異方性設定において,最先端のPEよりも有意に優れていた。
異方性医用画像やビデオでは、データと興味の形状に適合する異方性PEを選択することが最重要であると結論付けている。
関連論文リスト
- PEPSI: Pathology-Enhanced Pulse-Sequence-Invariant Representations for
Brain MRI [3.2159523360159827]
PEPSIは、脳MRIのための最初の病理拡張型、パルスシーケンス不変な特徴表現学習モデルである。
PEPSIは、新しい病理エンコーディング戦略を持つ合成画像で完全に訓練されている。
実験では,PEPSIの画像合成能力について,最先端のコントラスト非依存合成モデルと比較した。
論文 参考訳(メタデータ) (2024-03-10T14:33:55Z) - DeepPyramid+: Medical Image Segmentation using Pyramid View Fusion and
Deformable Pyramid Reception [6.541613812766445]
本稿では,医療画像や手術ビデオのセグメンテーションにおいて直面するさまざまな課題に対処するネットワークアーキテクチャであるDeepPyramid+を提案する。
提案されたDeepPyramid+には、"Pyramid View Fusion"(PVF)と"Deformable Pyramid Reception"(DPR)という2つの主要なモジュールが含まれている。
DPRは、拡張変形可能な畳み込みを用いた形状およびスケール適応的特徴抽出技術を導入している。
論文 参考訳(メタデータ) (2023-12-06T10:47:11Z) - PhysFormer++: Facial Video-based Physiological Measurement with SlowFast
Temporal Difference Transformer [76.40106756572644]
最近のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙な手がかりのマイニングに重点を置いている。
本稿では,PhysFormerとPhys++++をベースとした2つのエンドツーエンドビデオ変換器を提案する。
4つのベンチマークデータセットで総合的な実験を行い、時間内テストとクロスデータセットテストの両方において優れた性能を示す。
論文 参考訳(メタデータ) (2023-02-07T15:56:03Z) - This Intestine Does Not Exist: Multiscale Residual Variational
Autoencoder for Realistic Wireless Capsule Endoscopy Image Generation [7.430724826764835]
新規な変分オートエンコーダアーキテクチャ,すなわち "This Intestine Don Not Exist" (TIDE) を提案する。
提案アーキテクチャは,マルチスケールな特徴抽出畳み込みブロックと残差接続を備え,高品質で多様なデータセットの生成を可能にする。
利用可能なデータセットの増大を指向した現在のアプローチとは対照的に,本研究では,TIDEを用いて実際のWCEデータセットを完全に置換できることを実証する。
論文 参考訳(メタデータ) (2023-02-04T11:49:38Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - SIAN: Style-Guided Instance-Adaptive Normalization for Multi-Organ
Histopathology Image Synthesis [63.845552349914186]
本研究では,異なる臓器に対して,現実的な色分布とテクスチャを合成するためのスタイル誘導型インスタンス適応正規化(SIAN)を提案する。
4つのフェーズは一緒に動作し、生成ネットワークに統合され、イメージセマンティクス、スタイル、インスタンスレベルのバウンダリを埋め込む。
論文 参考訳(メタデータ) (2022-09-02T16:45:46Z) - PhysFormer: Facial Video-based Physiological Measurement with Temporal
Difference Transformer [55.936527926778695]
近年のディープラーニングアプローチは、時間的受容の限られた畳み込みニューラルネットワークを用いた微妙なrの手がかりのマイニングに重点を置いている。
本稿では,エンドツーエンドのビデオトランスをベースとしたアーキテクチャであるPhysFormerを提案する。
論文 参考訳(メタデータ) (2021-11-23T18:57:11Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。