論文の概要: PolarMAE: Efficient Fetal Ultrasound Pre-training via Semantic Screening and Polar-Guided Masking
- arxiv url: http://arxiv.org/abs/2604.15893v1
- Date: Fri, 17 Apr 2026 09:45:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-20 22:00:19.867775
- Title: PolarMAE: Efficient Fetal Ultrasound Pre-training via Semantic Screening and Polar-Guided Masking
- Title(参考訳): PolarMAE: セマンティックスクリーニングと極誘導マスキングによる高効率胎児超音波事前トレーニング
- Authors: Meng Lv, Yapeng Li, Hang Su, Juhua Liu, Bo Du,
- Abstract要約: PolarMAEは、米国の画像用に設計された、新しくて効率的な事前トレーニングフレームワークである。
連続走査冗長性を軽減するために,プログレッシブ・ビジュアル・セマンティック・スクリーニングを導入する。
また,極テクスチャ協調型マスキングを提案する。
- 参考スコア(独自算出の注目度): 47.59361789212719
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent fetal ultrasound (US) interpretation is crucial for prenatal diagnosis, but high annotation costs and operator-induced variance make unsupervised pre-training a highly promising paradigm. However, existing pre-training methods largely ignore US-specific characteristics -- severe data redundancy, fan-shaped locality, and polar coordinate beamforming -- limiting their effectiveness in downstream tasks. To address this, we propose PolarMAE, a novel and efficient pre-training framework tailored for US images. Specifically, to mitigate continuous scanning redundancy, we introduce a Progressive Visual-Semantic Screening (PVSS) that adaptively extracts high-value samples, significantly boosting pre-training efficiency. Furthermore, we design an Acoustic-Bounded Region Constraint (ABRC) to accommodate US locality, forcing the model to focus strictly on valid acoustic regions rather than invalid dark backgrounds. Finally, leveraging the beamforming prior and local details, we propose a Polar-Texture Collaborative Masking (PTCM), enabling the model to capture underlying radial imaging patterns and critical tissue structures. Extensive experiments across diverse datasets and downstream interpretation tasks demonstrate that our method achieves state-of-the-art performance with strong pre-training scalability and efficiency.
- Abstract(参考訳): 出生前診断には知的胎児超音波(US)の解釈が不可欠であるが、高いアノテーションコストと操作者による分散は、教師なしの事前訓練を非常に有望なパラダイムにしている。
しかし、既存の事前訓練手法は、深刻なデータ冗長性、扇形の局所性、極座標ビームフォーミングといった米国固有の特性を無視し、下流でのタスクの有効性を制限している。
この問題に対処するために,米国画像に適した新しい,効率的な事前学習フレームワークであるPolarMAEを提案する。
具体的には、連続走査冗長性を軽減するために、高値サンプルを適応的に抽出し、事前学習効率を大幅に向上させるプログレッシブ・ビジュアル・セマンティック・スクリーニング(PVSS)を導入する。
さらに,米国局所性に配慮したアコースティック境界領域制約 (ABRC) を設計し,無効な暗黒背景ではなく,有効なアコースティック領域に厳格に焦点を絞った。
最後に、ビームフォーミングの先行および局所的詳細を生かしたPTCM(Polar-Texture Collaborative Masking)を提案する。
多様なデータセットおよび下流解釈タスクにわたる広範囲な実験により、我々の手法は、訓練前のスケーラビリティと効率の強い最先端の性能を達成することを示した。
関連論文リスト
- Dual-Teacher Distillation with Subnetwork Rectification for Black-Box Domain Adaptation [69.7036779439312]
ブラックボックスドメイン適応は、非常に実用的で非常に困難な設定である。
ブラックボックスソースモデルに埋め込まれた特定の知識を活用するサブネットワーク整合モデル(DDSR)を用いた二重蒸留法を提案する。
我々の手法は、ソースデータやモデルの使用を含む、最先端の手法に対する一貫した改善を実証する。
論文 参考訳(メタデータ) (2026-03-24T07:54:19Z) - Human-Guided Shade Artifact Suppression in CBCT-to-MDCT Translation via Schrödinger Bridge with Conditional Diffusion [1.5869861104370917]
我々はSchrodinger Bridge (SB) の定式化を基礎としたCBCT-to-MDCT翻訳のための新しいフレームワークを提案する。
提案手法はCBCT入力と疑似ターゲットの境界の整合性を明示し,解剖学的忠実度と知覚的制御性の両方を保証する。
論文 参考訳(メタデータ) (2025-07-15T06:44:53Z) - SDTN and TRN: Adaptive Spectral-Spatial Feature Extraction for Hyperspectral Image Classification [1.2871580250533408]
ハイパースペクトル画像分類は、精密農業において重要な役割を担い、作物の健康モニタリング、病気の検出、土壌分析に関する正確な洞察を提供する。
従来の手法は高次元データ、スペクトル空間の冗長性、ラベル付きサンプルの不足に悩まされ、しばしば準最適性能に繋がる。
これらの課題に対処するために,テンソル分解と正規化機構を組み合わせた自己適応正規化ネットワーク(SDTN)を提案し,テンソルランクを動的に調整する。
このアプローチは、高い分類精度を維持するだけでなく、計算の複雑さを大幅に減らし、リソース制約のある環境でのリアルタイムデプロイメントに非常に適している。
論文 参考訳(メタデータ) (2025-07-13T04:53:33Z) - PLADIS: Pushing the Limits of Attention in Diffusion Models at Inference Time by Leveraging Sparsity [9.092404060771306]
拡散モデルでは、高品質な条件付きサンプルの生成に顕著な結果が示されている。
しかし、既存の方法は、しばしば追加のトレーニングや神経機能評価(NFE)を必要とする。
本稿では,スパースアテンションを生かして事前学習モデルを強化する,PLADISと呼ばれる新しい,効率的な手法を提案する。
論文 参考訳(メタデータ) (2025-03-10T07:23:19Z) - Generative Edge Detection with Stable Diffusion [52.870631376660924]
エッジ検出は一般的に、主に識別法によって対処されるピクセルレベルの分類問題と見なされる。
本稿では、事前学習した安定拡散モデルのポテンシャルを十分に活用して、GED(Generative Edge Detector)という新しい手法を提案する。
複数のデータセットに対して広範な実験を行い、競争性能を達成する。
論文 参考訳(メタデータ) (2024-10-04T01:52:23Z) - Reliable Deep Diffusion Tensor Estimation: Rethinking the Power of Data-Driven Optimization Routine [17.516054970588137]
本研究では,データ駆動型最適化手法であるDoDTIを紹介する。
提案手法はDTIパラメータ推定における最先端性能を実現する。
特に、より優れた一般化、精度、効率を示し、この分野の幅広い応用に高い信頼性を与えている。
論文 参考訳(メタデータ) (2024-09-04T07:35:12Z) - DPMesh: Exploiting Diffusion Prior for Occluded Human Mesh Recovery [71.6345505427213]
DPMeshは、人間のメッシュリカバリを排除した革新的なフレームワークである。
これは、事前訓練されたテキスト・ツー・イメージ拡散モデルに埋め込まれた対象構造と空間的関係について、より深い拡散に乗じる。
論文 参考訳(メタデータ) (2024-04-01T18:59:13Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。