Fugu-MT 論文翻訳(概要): UniUSNet: A Promptable Framework for Universal Ultrasound Disease Prediction and Tissue Segmentation

論文の概要: UniUSNet: A Promptable Framework for Universal Ultrasound Disease Prediction and Tissue Segmentation

arxiv url: http://arxiv.org/abs/2406.01154v3
Date: Mon, 2 Sep 2024 08:52:19 GMT
ステータス: 翻訳完了
システム内更新日: 2024-09-04 18:00:58.212861
Title: UniUSNet: A Promptable Framework for Universal Ultrasound Disease Prediction and Tissue Segmentation
Title（参考訳）: UniUSNet:Universal Ultrasound Disease Prediction and tissue Segmentationのためのプロンプタブルフレームワーク
Authors: Zehui Lin, Zhuoneng Zhang, Xindi Hu, Zhifan Gao, Xin Yang, Yue Sun, Dong Ni, Tao Tan,
Abstract要約: 超音波画像分類とセグメンテーションのための汎用フレームワークUniUSNetを提案する。このモデルは様々な超音波タイプ、解剖学的位置、入力形式を扱い、セグメンテーションと分類の両方に優れる。データセットを拡張して、モデルウェイトとコードが利用可能で、プロンプトメカニズムを洗練する予定です。
参考スコア（独自算出の注目度）: 19.85119434049726
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Ultrasound is widely used in clinical practice due to its affordability, portability, and safety. However, current AI research often overlooks combined disease prediction and tissue segmentation. We propose UniUSNet, a universal framework for ultrasound image classification and segmentation. This model handles various ultrasound types, anatomical positions, and input formats, excelling in both segmentation and classification tasks. Trained on a comprehensive dataset with over 9.7K annotations from 7 distinct anatomical positions, our model matches state-of-the-art performance and surpasses single-dataset and ablated models. Zero-shot and fine-tuning experiments show strong generalization and adaptability with minimal fine-tuning. We plan to expand our dataset and refine the prompting mechanism, with model weights and code available at (https://github.com/Zehui-Lin/UniUSNet).
Abstract（参考訳）: 超音波は可搬性、可搬性、安全性のために臨床で広く用いられている。しかし、現在のAI研究は、疾患予測と組織セグメンテーションの組み合わせを見落としていることが多い。超音波画像分類とセグメンテーションのための汎用フレームワークUniUSNetを提案する。このモデルは様々な超音波タイプ、解剖学的位置、入力形式を扱い、セグメンテーションと分類の両方に優れる。 7つの異なる解剖学的位置から9.7Kアノテーションを持つ包括的なデータセットでトレーニングされた私たちのモデルは、最先端のパフォーマンスと一致し、単一データセットおよび短縮モデルを上回る。ゼロショットおよび微調整実験は、最小限の微調整で強力な一般化と適応性を示す。モデルウェイトとコードはhttps://github.com/Zehui-Lin/UniUSNet.orgで利用可能です。

関連論文リスト

One Language-Free Foundation Model Is Enough for Universal Vision Anomaly Detection [65.11602552904456]
Universal Visual Anomaly Detection (AD) は、オープンかつダイナミックなシナリオに向けて、異常画像とセグメント異常領域を識別することを目的としている。現在の手法は、複雑なプロンプトエンジニアリング、精巧な適応モジュール、そして挑戦的な訓練戦略に苦しむことが多い。本稿では,Universal Vision Anomaly Detection(UniADet)のための,恥ずかしいほどシンプルで汎用的で効果的なフレームワークを提案する。
論文参考訳（メタデータ） (2026-01-09T06:05:18Z)
A Fully Open and Generalizable Foundation Model for Ultrasound Clinical Applications [77.3888788549565]
一般臨床用超音波基礎モデルであるEchoCareについて紹介する。我々は、キュレートされた、一般公開された大規模なデータセットであるEchoCareData上で、自己教師付き学習を通じてEchoCareを開発した。最小限のトレーニングで、EchoCareは10の代表的なベンチマークで最先端の比較モデルを上回っている。
論文参考訳（メタデータ） (2025-09-15T10:05:31Z)
UltraUPConvNet: A UPerNet- and ConvNeXt-Based Multi-Task Network for Ultrasound Tissue Segmentation and Disease Prediction [8.547397293290404]
超音波画像分類とセグメンテーションの両方のための普遍的なフレームワークであるUltraUPConvNetを紹介する。本モデルは,計算オーバーヘッドの少ない特定のデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2025-09-14T05:51:58Z)
Unified Supervision For Vision-Language Modeling in 3D Computed Tomography [1.4193731654133002]
汎用視覚言語モデル(VLM)は放射線学において有望なツールとして登場し、ゼロショット機能を提供している。診断放射線学のような高度な領域では、これらのモデルは信頼できる臨床使用に必要な識別精度を欠いていることが多い。分類ラベルやセグメンテーションマスクにエンコードされた多種多様な監視信号を統合するボリュームVLMであるUniferumを,単一のトレーニングフレームワークに導入する。
論文参考訳（メタデータ） (2025-09-01T15:30:17Z)
GroundingDINO-US-SAM: Text-Prompted Multi-Organ Segmentation in Ultrasound with LoRA-Tuned Vision-Language Models [2.089191490381739]
本研究では,複数の超音波臓器にまたがる物体セグメンテーションを実現するために,Grounding DINOとSAM2を統合したプロンプト駆動視覚言語モデル(VLM)を提案する。胸, 甲状腺, 肝臓, 前立腺, 腎臓, 脊髄筋を含む18種類の超音波データセットが得られた。提案手法は,UniverSeg,MedSAM,MedCLIP-SAM,BiomedParse,SAMUSなどの最先端セグメンテーション手法より優れている。
論文参考訳（メタデータ） (2025-06-30T14:33:44Z)
Interpreting Biomedical VLMs on High-Imbalance Out-of-Distributions: An Insight into BiomedCLIP on Radiology [0.0]
我々は、高度にバランスの取れない、アウト・オブ・ディストリビューションな医療データセットに適用した場合、BiomedCLIPの限界を分析する。ゼロショット設定下でのモデルは,すべてのラベルを過度に予測し,精度の低下とクラス間分離性に繋がることを示す。我々は、現実の環境で信頼性と適用性を高めるために、モデルの慎重な適応の必要性を強調します。
論文参考訳（メタデータ） (2025-06-17T02:59:42Z)
CAVE-Net: Classifying Abnormalities in Video Capsule Endoscopy [0.1937002985471497]
複雑な画像データセットを解析する際の診断精度を向上させるために,アンサンブルに基づくアプローチを提案する。各モデルのユニークな特徴抽出機能を活用し、全体的な精度を向上させる。これらの手法を用いることで、提案フレームワークであるCAVE-Netは、ロバストな特徴識別と、より優れた分類結果を提供する。
論文参考訳（メタデータ） (2024-10-26T17:25:08Z)
UNICORN: A Deep Learning Model for Integrating Multi-Stain Data in Histopathology [2.9389205138207277]
UNICORNは動脈硬化の重症度予測のための多段階組織学を処理できるマルチモーダルトランスフォーマーである。このアーキテクチャは、2段階のエンドツーエンドのトレーニング可能なモデルと、トランスフォーマーの自己保持ブロックを利用する特殊なモジュールから構成される。 UNICORNは0.67の分類精度を達成し、他の最先端モデルを上回った。
論文参考訳（メタデータ） (2024-09-26T12:13:52Z)
A novel open-source ultrasound dataset with deep learning benchmarks for spinal cord injury localization and anatomical segmentation [1.02101998415327]
ブタ脊髄の矢状切片からなる10,223モード(Bモード)画像の超音波データセットを提案する。損傷部位をローカライズするために,いくつかの最先端オブジェクト検出アルゴリズムの性能指標をベンチマークした。ヒトの超音波脊髄画像におけるセグメンテーションモデルのゼロショット一般化能力を評価する。
論文参考訳（メタデータ） (2024-09-24T20:22:59Z)
Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。 ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文参考訳（メタデータ） (2024-08-19T15:04:42Z)
Universal and Extensible Language-Vision Models for Organ Segmentation and Tumor Detection from Abdominal Computed Tomography [50.08496922659307]
本稿では、単一のモデルであるUniversal Modelが複数の公開データセットに対処し、新しいクラスに適応することを可能にするユニバーサルフレームワークを提案する。まず,大規模言語モデルからの言語埋め込みを利用した新しい言語駆動パラメータ生成手法を提案する。第二に、従来の出力層は軽量でクラス固有のヘッドに置き換えられ、ユニバーサルモデルでは25の臓器と6種類の腫瘍を同時に分割することができる。
論文参考訳（メタデータ） (2024-05-28T16:55:15Z)
WATUNet: A Deep Neural Network for Segmentation of Volumetric Sweep Imaging Ultrasound [1.2903292694072621]
ボリューム・スイープ・イメージング(VSI)は、訓練を受けていないオペレーターが高品質な超音波画像をキャプチャできる革新的な手法である。本稿ではWavelet_Attention_UNet(WATUNet)と呼ばれる新しいセグメンテーションモデルを提案する。このモデルでは、簡単な接続ではなく、ウェーブレットゲート(WG)とアテンションゲート(AG)をエンコーダとデコーダの間に組み込んで、上記の制限を克服する。
論文参考訳（メタデータ） (2023-11-17T20:32:37Z)
Detecting Speech Abnormalities with a Perceiver-based Sequence Classifier that Leverages a Universal Speech Model [4.503292461488901]
いくつかの神経疾患の音声反射異常を検出するPerceiver-based sequenceを提案する。このシーケンスとUniversal Speech Model (USM)を組み合わせ、1200万時間に及ぶ多様な音声録音をトレーニング(教師なし)する。我々のモデルは標準変圧器 (80.9%) および知覚器 (81.8%) モデルより優れ、平均精度は83.1%である。
論文参考訳（メタデータ） (2023-10-16T21:07:12Z)
Learnable Weight Initialization for Volumetric Medical Image Segmentation [66.3030435676252]
本稿では,学習可能な重みに基づくハイブリッド医療画像セグメンテーション手法を提案する。我々のアプローチはどんなハイブリッドモデルにも簡単に統合でき、外部のトレーニングデータを必要としない。多臓器・肺がんセグメンテーションタスクの実験は、我々のアプローチの有効性を実証している。
論文参考訳（メタデータ） (2023-06-15T17:55:05Z)
CLIP-Driven Universal Model for Organ Segmentation and Tumor Detection [36.08551407926805]
本稿では,Contrastive Language-Image Pre-trainingから学習したテキストをセグメンテーションモデルに組み込んだCLIP駆動ユニバーサルモデルを提案する。提案モデルは14のデータセットから作成され、合計3,410個のCTスキャンを使用してトレーニングを行い、さらに3つの追加データセットから6,162個の外部CTスキャンで評価する。
論文参考訳（メタデータ） (2023-01-02T18:07:44Z)
Factored Attention and Embedding for Unstructured-view Topic-related Ultrasound Report Generation [70.7778938191405]
本研究では,非構造的トピック関連超音波レポート生成のための新しい因子的注意・埋め込みモデル(FAE-Gen)を提案する。提案したFAE-Genは主に2つのモジュール、すなわちビュー誘導因子の注意とトピック指向因子の埋め込みから構成されており、異なるビューで均質および不均一な形態的特徴を捉えている。
論文参考訳（メタデータ） (2022-03-12T15:24:03Z)
G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。 2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文参考訳（メタデータ） (2021-01-27T19:28:04Z)
Weakly supervised multiple instance learning histopathological tumor segmentation [51.085268272912415]
スライド画像全体のセグメント化のための弱教師付きフレームワークを提案する。トレーニングモデルに複数のインスタンス学習スキームを利用する。提案するフレームワークは,The Cancer Genome AtlasとPatchCamelyonデータセットのマルチロケーションとマルチ中心公開データに基づいて評価されている。
論文参考訳（メタデータ） (2020-04-10T13:12:47Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。