論文の概要: DeNAS-ViT: Data Efficient NAS-Optimized Vision Transformer for Ultrasound Image Segmentation
- arxiv url: http://arxiv.org/abs/2407.04203v3
- Date: Mon, 10 Nov 2025 08:23:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.261688
- Title: DeNAS-ViT: Data Efficient NAS-Optimized Vision Transformer for Ultrasound Image Segmentation
- Title(参考訳): DeNAS-ViT:超音波画像分割のためのNAS最適化視覚変換器
- Authors: Renqi Chen, Xinzhe Zheng, Haoyang Su, Kehan Wu,
- Abstract要約: 超音波画像分割のためのデータ効率の高いNAS最適化ビジョン変換器であるDeNAS-ViTを紹介する。
ViTのアテンション機構に先立って,マルチスケールトークンサーチを行う効率的なNASモジュールを提案する。
公開データセットの実験では、DeNAS-ViTが最先端のパフォーマンスを実現し、ラベル付き最小限のデータで堅牢性を維持することが示されている。
- 参考スコア(独自算出の注目度): 7.0775010318400495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of ultrasound images is essential for reliable medical diagnoses but is challenged by poor image quality and scarce labeled data. Prior approaches have relied on manually designed, complex network architectures to improve multi-scale feature extraction. However, such handcrafted models offer limited gains when prior knowledge is inadequate and are prone to overfitting on small datasets. In this paper, we introduce DeNAS-ViT, a data-efficient NAS-optimized Vision Transformer, the first method to leverage neural architecture search (NAS) for ultrasound image segmentation by automatically optimizing model architecture through token-level search. Specifically, we propose an efficient NAS module that performs multi-scale token search prior to the ViT's attention mechanism, effectively capturing both contextual and local features while minimizing computational costs. Given ultrasound's data scarcity and NAS's inherent data demands, we further develop a NAS-guided semi-supervised learning (SSL) framework. This approach integrates network independence and contrastive learning within a stage-wise optimization strategy, significantly enhancing model robustness under limited-data conditions. Extensive experiments on public datasets demonstrate that DeNAS-ViT achieves state-of-the-art performance, maintaining robustness with minimal labeled data. Moreover, we highlight DeNAS-ViT's generalization potential beyond ultrasound imaging, underscoring its broader applicability.
- Abstract(参考訳): 超音波画像の正確なセグメンテーションは信頼性の高い診断には不可欠であるが,画像品質の低下とラベル付きデータ不足が課題である。
従来のアプローチは、マルチスケールの機能抽出を改善するために、手動で設計された複雑なネットワークアーキテクチャに依存していた。
しかし、そのような手作りのモデルは、事前の知識が不十分で、小さなデータセットに過度に適合する傾向がある場合に、限られた利益をもたらす。
本稿では,データ効率の高いNAS最適化ビジョン変換器であるDeNAS-ViTを紹介し,トークンレベルの探索によるモデルアーキテクチャの自動最適化により,超音波画像セグメンテーションにNAS(Neural Architecture Search)を利用する最初の方法を提案する。
具体的には、ViTのアテンションメカニズムに先立ってマルチスケールトークンサーチを行う効率的なNASモジュールを提案し、計算コストを最小化しつつ、文脈的特徴と局所的特徴の両方を効果的にキャプチャする。
超音波のデータ不足とNAS固有のデータ要求を考慮して、NAS誘導半教師付き学習(SSL)フレームワークをさらに開発する。
このアプローチは、段階最適化戦略において、ネットワーク独立性とコントラスト学習を統合し、限られたデータ条件下でのモデルロバスト性を大幅に向上する。
公開データセットに関する大規模な実験は、DeNAS-ViTが最先端のパフォーマンスを達成し、最小限のラベル付きデータで堅牢性を維持することを実証している。
さらに,DeNAS-ViTの超音波画像以上の一般化の可能性を強調し,その適用可能性を強調した。
関連論文リスト
- Flexiffusion: Training-Free Segment-Wise Neural Architecture Search for Efficient Diffusion Models [50.260693393896716]
拡散モデル(DM)は高忠実度画像を生成できる強力な生成モデルであるが、高い計算コストで制約される。
我々は、事前訓練されたパラメータを変更することなく、生成スケジュールとモデルアーキテクチャを協調的に最適化する、トレーニング不要なNASフレームワークFlexiffusionを提案する。
我々の研究は、品質を犠牲にすることなく高速DMを検索するための資源効率の良いパラダイムを開拓した。
論文 参考訳(メタデータ) (2025-06-03T06:02:50Z) - Hypergraph Mamba for Efficient Whole Slide Image Understanding [10.285000840656808]
ホイルスライド画像 (WSI) は, 超高解像度, 大規模, 複雑な空間関係のため, 医用画像解析において重要な課題となっている。
本稿では,ハイパーグラフニューラルネットワーク(HGNN)の高次リレーショナルモデリング機能と状態空間モデルの線形時間逐次モデリング効率を一体化する新しいフレームワークであるWSI-HGMambaを紹介する。
論文 参考訳(メタデータ) (2025-05-23T04:33:54Z) - L-SWAG: Layer-Sample Wise Activation with Gradients information for Zero-Shot NAS on Vision Transformers [39.19675815138566]
トレーニングフリーなニューラルネットワーク探索(NAS)は、ゼロコスト(ZC)プロキシを使用して、高性能なニューラルネットワークを効率的に識別する。
ZC-NAS は (i) 時間効率であり、モデルトレーニングの必要性を排除し、 (ii) 解釈可能である。
この作業は、ビジョントランスフォーマー(ViT)へのZCプロキシの適用性を拡張する。
論文 参考訳(メタデータ) (2025-05-12T07:44:52Z) - HSLiNets: Hyperspectral Image and LiDAR Data Fusion Using Efficient Dual Non-Linear Feature Learning Networks [7.06787067270941]
新しい線形特徴空間におけるハイパースペクトルイメージング(HSI)とLiDARデータの統合は、HSIに固有の高次元性と冗長性に起因する課題に対する有望な解決策を提供する。
本研究では、双方向逆畳み込み畳み込みニューラルネットワーク(CNN)経路と特殊空間解析ブロックを併用した、二重線型融合空間フレームワークを提案する。
提案手法は,データ処理や分類精度を向上するだけでなく,トランスフォーマーなどの先進モデルに係わる計算負担を軽減する。
論文 参考訳(メタデータ) (2024-11-30T01:08:08Z) - Semi-Mamba-UNet: Pixel-Level Contrastive and Pixel-Level Cross-Supervised Visual Mamba-based UNet for Semi-Supervised Medical Image Segmentation [11.637738540262797]
本研究では,従来のCNNベースのUNetと純粋に視覚的なMambaベースのエンコーダデコーダアーキテクチャを組み込んだセミマンバUNetを,半教師付き学習フレームワークに統合する。
この革新的なSSLアプローチは、両方のネットワークを利用して擬似ラベルを生成し、ピクセルレベルで相互に相互に監督する。
本稿では,2対のプロジェクタを用いた自己教師型画素レベルのコントラスト学習戦略を導入し,特徴学習機能をさらに強化する。
論文 参考訳(メタデータ) (2024-02-11T17:09:21Z) - ADASR: An Adversarial Auto-Augmentation Framework for Hyperspectral and
Multispectral Data Fusion [54.668445421149364]
HSI(Deep Learning-based Hyperspectral Image)は、HSI(Hyperspectral Image)とMSI(Multispectral Image)を深層ニューラルネットワーク(DNN)に融合させることにより、高空間分解能HSI(HR-HSI)を生成することを目的としている。
本稿では, HSI-MSI 融合のためのデータ多様性を向上するために, HSI-MSI サンプルペアの自動最適化と拡張を行う新しい逆自動データ拡張フレームワーク ADASR を提案する。
論文 参考訳(メタデータ) (2023-10-11T07:30:37Z) - SSHNN: Semi-Supervised Hybrid NAS Network for Echocardiographic Image
Segmentation [2.8358100463599722]
SSHNNと呼ばれる医用画像分割のための半教師付きハイブリッドNASネットワークを提案する。
SSHNNでは、詳細を失うのを避けるために、正規化されたスカラーの代わりに、レイヤワイズ機能融合における畳み込み操作を創造的に利用する。
具体的には,ラベル付き医用画像データセットの限られたボリューム問題を克服するために,半教師付きアルゴリズムであるMean-Teacherを実装した。
論文 参考訳(メタデータ) (2023-09-09T03:38:40Z) - HKNAS: Classification of Hyperspectral Imagery Based on Hyper Kernel
Neural Architecture Search [104.45426861115972]
設計したハイパーカーネルを利用して,構造パラメータを直接生成することを提案する。
我々は1次元または3次元の畳み込みを伴う画素レベルの分類と画像レベルの分類を別々に行う3種類のネットワークを得る。
6つの公開データセットに関する一連の実験は、提案手法が最先端の結果を得ることを示した。
論文 参考訳(メタデータ) (2023-04-23T17:27:40Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - HASA: Hybrid Architecture Search with Aggregation Strategy for
Echinococcosis Classification and Ovary Segmentation in Ultrasound Images [0.0]
超音波(US)画像分類と分割のためのハイブリッドNASフレームワークを提案する。
本手法は、上記の米国画像分類および分割タスクに対して、より強力で軽量なモデルを生成することができる。
論文 参考訳(メタデータ) (2022-04-14T01:43:00Z) - Federated Split Vision Transformer for COVID-19 CXR Diagnosis using
Task-Agnostic Training [28.309185925167565]
フェデレートラーニングは、複数の病院で患者のCXRデータを収集することなく、胸部X線(CXR)画像上の新型コロナウイルス診断のためのニューラルネットワークトレーニングを可能にする。
直感的に分解可能な構成を持つ最近開発されたディープラーニングアーキテクチャであるVision Transformerは、性能を犠牲にすることなく、分割学習に最適であることを示す。
本研究は,医用画像の協調学習におけるTransformerの適合性を確認し,将来的な実世界の実現に向けての道筋をたどるものである。
論文 参考訳(メタデータ) (2021-11-02T02:54:30Z) - Trilevel Neural Architecture Search for Efficient Single Image
Super-Resolution [127.92235484598811]
本稿では,高効率単一画像超解像(SR)のための3レベルニューラルネットワーク探索法を提案する。
離散探索空間をモデル化するために、離散探索空間に新たな連続緩和を適用し、ネットワークパス、セル操作、カーネル幅の階層的混合を構築する。
階層型スーパーネット方式による最適化を行うため,効率的な探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-17T12:19:49Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - Searching Central Difference Convolutional Networks for Face
Anti-Spoofing [68.77468465774267]
顔認識システムにおいて、顔の反偽造(FAS)が重要な役割を担っている。
最先端のFASメソッドの多くは、スタック化された畳み込みと専門家が設計したネットワークに依存している。
ここでは、中央差分畳み込み(CDC)に基づくフレームレベルの新しいFAS手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T12:48:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。