論文の概要: Baseline Method of the Foundation Model Challenge for Ultrasound Image Analysis
- arxiv url: http://arxiv.org/abs/2602.01055v1
- Date: Sun, 01 Feb 2026 06:52:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.561545
- Title: Baseline Method of the Foundation Model Challenge for Ultrasound Image Analysis
- Title(参考訳): 超音波画像解析のための基礎モデルチャレンジのベースライン法
- Authors: Bo Deng, Yitong Tang, Jiake Li, Yuxin Huang, Li Wang, Yu Zhang, Yufei Zhan, Hua Lu, Xiaoshen Zhang, Jieyun Bai,
- Abstract要約: 超音波画像解析のための基礎モデルチャレンジ(FM_UIA2026)を提案する。
このモデルは、ImageNet-pretrained EfficientNet--B4のバックボーンを堅牢な特徴抽出に使用し、FPN(Feature Pyramid Network)と組み合わせてコンテキスト情報をキャプチャする。
タスク固有のルーティング戦略により、グローバルタスクは高レベルなセマンティックな特徴を活用でき、高密度な予測タスクは空間的詳細なFPN表現を活用できる。
- 参考スコア(独自算出の注目度): 15.017057362402687
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ultrasound (US) imaging exhibits substantial heterogeneity across anatomical structures and acquisition protocols, posing significant challenges to the development of generalizable analysis models. Most existing methods are task-specific, limiting their suitability as clinically deployable foundation models. To address this limitation, the Foundation Model Challenge for Ultrasound Image Analysis (FM\_UIA~2026) introduces a large-scale multi-task benchmark comprising 27 subtasks across segmentation, classification, detection, and regression. In this paper, we present the official baseline for FM\_UIA~2026 based on a unified Multi-Head Multi-Task Learning (MH-MTL) framework that supports all tasks within a single shared network. The model employs an ImageNet-pretrained EfficientNet--B4 backbone for robust feature extraction, combined with a Feature Pyramid Network (FPN) to capture multi-scale contextual information. A task-specific routing strategy enables global tasks to leverage high-level semantic features, while dense prediction tasks exploit spatially detailed FPN representations. Training incorporates a composite loss with task-adaptive learning rate scaling and a cosine annealing schedule. Validation results demonstrate the feasibility and robustness of this unified design, establishing a strong and extensible baseline for ultrasound foundation model research. The code and dataset are publicly available at \href{https://github.com/lijiake2408/Foundation-Model-Challenge-for-Ultrasound-Image-Analysis}{GitHub}.
- Abstract(参考訳): 超音波(US)イメージングは解剖学的構造と取得プロトコルにまたがってかなりの異質性を示し、一般化可能な解析モデルの開発に重大な課題を生んでいる。
既存の手法の多くはタスク固有であり、臨床展開可能な基礎モデルとして適合性を制限している。
この制限に対処するため、FM\_UIA~2026(Foundation Model Challenge for Ultrasound Image Analysis)では、セグメンテーション、分類、検出、回帰を含む27のサブタスクからなる大規模マルチタスクベンチマークが導入されている。
本稿では,FM\_UIA~2026におけるMH-MTL(Multi-Head Multi-Task Learning)フレームワークについて述べる。
このモデルは、ImageNet-pretrained EfficientNet--B4のバックボーンを堅牢な特徴抽出に使用し、FPN(Feature Pyramid Network)と組み合わせて、マルチスケールのコンテキスト情報をキャプチャする。
タスク固有のルーティング戦略により、グローバルタスクは高レベルなセマンティックな特徴を活用でき、高密度な予測タスクは空間的詳細なFPN表現を活用できる。
トレーニングには、タスク適応学習率のスケーリングとコサインアニールスケジュールによる複合的損失が組み込まれている。
評価結果は, この統一設計の実現可能性と堅牢性を示し, 超音波基礎モデル研究の強靭で拡張可能なベースラインを確立した。
コードとデータセットは、 \href{https://github.com/lijiake2408/Foundation-Model-Challenge-for-Ultrasound-Image-Analysis}{GitHub}で公開されている。
関連論文リスト
- OFA-MAS: One-for-All Multi-Agent System Topology Design based on Mixture-of-Experts Graph Generative Models [57.94189874119267]
マルチエージェントシステム(MAS)は複雑な問題を解決するための強力なパラダイムを提供する。
現在のグラフ学習に基づく設計手法は、しばしば「1対1」のパラダイムに準拠している。
自然言語で記述されたタスクに対して適応的な協調グラフを生成する一対一のフレームワークOFA-TADを提案する。
論文 参考訳(メタデータ) (2026-01-19T12:23:44Z) - PanMatch: Unleashing the Potential of Large Vision Models for Unified Matching Models [80.65273820998875]
頑健な対応マッチングのための汎用基盤モデルであるPanMatchを提案する。
我々の重要な洞察は、任意の2フレーム対応タスクが2次元変位推定フレームワーク内で処理可能であることである。
PanMatchは、偏差推定アルゴリズムを前例のない一般化能力で実現し、マルチタスク統合を実現する。
論文 参考訳(メタデータ) (2025-07-11T08:18:52Z) - A Wireless Foundation Model for Multi-Task Prediction [50.21098141769079]
多様な予測区間をサポートする無線ネットワークにおけるマルチタスク予測のための統合基盤モデルを提案する。
大規模データセットをトレーニングした後、提案した基礎モデルは、新しいタスクにおいて、目に見えないシナリオとゼロショットのパフォーマンスに強力な一般化を示す。
論文 参考訳(メタデータ) (2025-07-08T12:37:55Z) - ForgerySleuth: Empowering Multimodal Large Language Models for Image Manipulation Detection [107.86009509291581]
我々はForgerySleuthを提案し、包括的ヒント融合を行い、改ざんされた領域を示すセグメンテーション出力を生成する。
ForgeryAnalysisの有効性を実証し,ForgerySleuthが既存手法の堅牢性,一般化性,説明可能性において著しく優れていたことを示す。
論文 参考訳(メタデータ) (2024-11-29T04:35:18Z) - Modality-agnostic Domain Generalizable Medical Image Segmentation by Multi-Frequency in Multi-Scale Attention [1.1155836879100416]
医用画像セグメンテーションのためのModality-Agnostic Domain Generalizable Network (MADGNet)を提案する。
MFMSAブロックは空間的特徴抽出の過程を洗練させる。
E-SDMは、深い監督を伴うマルチタスク学習における情報損失を軽減する。
論文 参考訳(メタデータ) (2024-05-10T07:34:36Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Generalizing Medical Image Representations via Quaternion Wavelet Networks [9.836302410524842]
医用画像から健全な特徴を抽出できる,新しい,一般化可能な,データに依存しないフレームワークを提案する。
提案する4元ウェーブレットネットワーク(quaVE)は,既存の医用画像解析や合成作業と容易に統合できる。
論文 参考訳(メタデータ) (2023-10-16T09:34:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。