Fugu-MT 論文翻訳(概要): Fake It Till You Make It: Using Synthetic Data and Domain Knowledge for Improved Text-Based Learning for LGE Detection

論文の概要: Fake It Till You Make It: Using Synthetic Data and Domain Knowledge for Improved Text-Based Learning for LGE Detection

arxiv url: http://arxiv.org/abs/2502.12948v1
Date: Tue, 18 Feb 2025 15:30:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-19 20:12:09.025053
Title: Fake It Till You Make It: Using Synthetic Data and Domain Knowledge for Improved Text-Based Learning for LGE Detection
Title（参考訳）: Fake it Till You Make It: Using Synthetic Data and Domain Knowledge for Improved Text-based Learning for LGE Detection
Authors: Athira J Jacob, Puneet Sharma, Daniel Rueckert,
Abstract要約: 臨床報告からテキストを用いてLGE検出のモデルを訓練するために,ドメイン知識に根ざした戦略を用いる。我々は、画像の向きを解剖学的に表現した方法で標準化し、空間的特徴とテキスト的特徴のより優れたアライメントを可能にする。モデル全体の性能に対する各デザインコンポーネントの貢献を明らかにするためのアブレーション研究が実施されている。
参考スコア（独自算出の注目度）: 11.532639713283226
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Detection of hyperenhancement from cardiac LGE MRI images is a complex task requiring significant clinical expertise. Although deep learning-based models have shown promising results for the task, they require large amounts of data with fine-grained annotations. Clinical reports generated for cardiac MR studies contain rich, clinically relevant information, including the location, extent and etiology of any scars present. Although recently developed CLIP-based training enables pretraining models with image-text pairs, it requires large amounts of data and further finetuning strategies on downstream tasks. In this study, we use various strategies rooted in domain knowledge to train a model for LGE detection solely using text from clinical reports, on a relatively small clinical cohort of 965 patients. We improve performance through the use of synthetic data augmentation, by systematically creating scar images and associated text. In addition, we standardize the orientation of the images in an anatomy-informed way to enable better alignment of spatial and text features. We also use a captioning loss to enable fine-grained supervision and explore the effect of pretraining of the vision encoder on performance. Finally, ablation studies are carried out to elucidate the contributions of each design component to the overall performance of the model.
Abstract（参考訳）: 心 LGE MRI 画像からのハイパーエンハンスメントの検出は,臨床的に重要な専門知識を必要とする複雑な作業である。ディープラーニングベースのモデルはタスクに対して有望な結果を示しているが、細かいアノテーションで大量のデータを必要とする。心臓MRI研究のために生成された臨床報告には、現在存在する傷痕の位置、範囲、エチオロジーを含む、リッチで臨床的に関係のある情報が含まれている。最近開発されたCLIPベースのトレーニングは、画像テキストペアによる事前トレーニングを可能にするが、大量のデータと下流タスクのさらなる微調整戦略を必要とする。本研究では,臨床報告からのテキストのみを用いたLGE検出モデルの訓練にドメイン知識に根ざした様々な戦略を,965例の比較的小さな臨床コホートに応用した。我々は,スカー画像と関連テキストを体系的に生成することにより,合成データ拡張による性能向上を図る。さらに、画像の向きを解剖学的に表現した方法で標準化し、空間的特徴とテキスト的特徴のより優れたアライメントを可能にする。また、キャプション損失を利用して細かな監督を可能にし、視覚エンコーダの事前訓練が性能に与える影響を探索する。最後に, モデル全体の性能に対する各設計部品の寄与を明らかにするために, アブレーション研究を行った。

関連論文リスト

CLIP-IT: CLIP-based Pairing for Histology Images Classification [6.855390956571216]
視覚バックボーンモデルのトレーニングにCLIP-ITを導入し、外部ソースからの特権的なテキスト情報と組み合わせることで、組織像を分類する。当初、モダリティペアリングのステップは、CLIPベースのモデルを使用して、組織像と外部ソースからの意味的に関連するテキストレポートデータとをマッチングし、拡張されたマルチモーダルデータセットを作成する。パラメータ効率のよい微調整法を用いて、主(画像)と対(テキスト)のモダリティのミスアライメントを効率的に解決する。
論文参考訳（メタデータ） (2025-04-22T18:14:43Z)
Leveraging Vision-Language Embeddings for Zero-Shot Learning in Histopathology Images [7.048241543461529]
ゼロショット組織像分類におけるこれらの課題に対処するため, MR-PHE(Multi-Resolution Prompt-Guided Hybrid Embedding)と呼ばれる新しいフレームワークを提案する。我々は,グローバルな画像埋め込みと重み付けされたパッチ埋め込みを統合したハイブリッドな埋め込み戦略を導入する。類似性に基づくパッチ重み付け機構は、クラス埋め込みとの関連性に基づいて、アテンションのような重み付けをパッチに割り当てる。
論文参考訳（メタデータ） (2025-03-13T12:18:37Z)
MRGen: Segmentation Data Engine For Underrepresented MRI Modalities [59.61465292965639]
稀ながら臨床的に重要な画像モダリティのための医用画像分割モデルの訓練は、注釈付きデータの不足により困難である。本稿では、生成モデルを利用してトレーニングデータを合成し、未表現のモダリティに対するセグメンテーションモデルを訓練する。
論文参考訳（メタデータ） (2024-12-04T16:34:22Z)
Synthetic Data for Robust Stroke Segmentation [0.0]
ニューロイメージングにおける病変のセグメンテーションに対する現在のディープラーニングベースのアプローチは、高解像度の画像と広範囲な注釈付きデータに依存することが多い。本稿では,脳卒中病変のセグメンテーションに適した新しい合成データフレームワークを提案する。我々のアプローチは、正常組織と病理組織の両方にまたがるセグメンテーションを促進するために、健康なデータセットと脳卒中データセットからラベルマップでモデルを訓練する。
論文参考訳（メタデータ） (2024-04-02T13:42:29Z)
Less is more: Ensemble Learning for Retinal Disease Recognition Under Limited Resources [12.119196313470887]
本稿では,限られた資源で網膜疾患を認識できる新しいアンサンブル学習機構を提案する。このメカニズムは、複数の事前訓練されたモデルからの洞察を活用し、その知識を網膜CT画像に転送し適応させる。
論文参考訳（メタデータ） (2024-02-15T06:58:25Z)
MLIP: Enhancing Medical Visual Representation with Divergence Encoder and Knowledge-guided Contrastive Learning [48.97640824497327]
本稿では、画像テキストのコントラスト学習を通じて、言語情報を視覚領域に統合するための案内信号として、ドメイン固有の医療知識を活用する新しいフレームワークを提案する。我々のモデルには、設計した分散エンコーダによるグローバルコントラスト学習、局所トークン・知識・パッチアライメントコントラスト学習、知識誘導型カテゴリレベルのコントラスト学習、エキスパートナレッジによるコントラスト学習が含まれる。特に、MLIPは、限られた注釈付きデータであっても最先端の手法を超越し、医療表現学習の進歩におけるマルチモーダル事前学習の可能性を強調している。
論文参考訳（メタデータ） (2024-02-03T05:48:50Z)
LLM-driven Multimodal Target Volume Contouring in Radiation Oncology [46.23891509553877]
大規模言語モデル(LLM)は、テキスト情報と画像の統合を容易にする。 LLM駆動型マルチモーダルAI,すなわちLLMSegを提案する。提案モデルでは,従来のユニモーダルAIモデルと比較して,性能が著しく向上していることが実証された。
論文参考訳（メタデータ） (2023-11-03T13:38:42Z)
Leveraging Semi-Supervised Graph Learning for Enhanced Diabetic Retinopathy Detection [0.0]
糖尿病網膜症(DR: Diabetic Retinopathy)は、早期発見と治療の急激な必要性を浮き彫りにしている。機械学習(ML)技術の最近の進歩は、DR検出における将来性を示しているが、ラベル付きデータの可用性は、しばしばパフォーマンスを制限している。本研究では,DR検出に適したSemi-Supervised Graph Learning SSGLアルゴリズムを提案する。
論文参考訳（メタデータ） (2023-09-02T04:42:08Z)
PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。提案手法は画像とテキストデータを融合して生成プロセスを強化する。我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文参考訳（メタデータ） (2023-09-01T22:08:32Z)
Text-guided Foundation Model Adaptation for Pathological Image Classification [40.45252665455015]
本稿では、画像とテキストの埋め込み(CITE)を結合して、病理画像分類を強化することを提案する。 CITEは、幅広いバイオメディカルテキストで事前訓練された言語モデルから得られたテキスト洞察を注入し、病理画像理解に基礎モデルを適用する。
論文参考訳（メタデータ） (2023-07-27T14:44:56Z)
Vision-Language Modelling For Radiological Imaging and Reports In The Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文参考訳（メタデータ） (2023-03-30T18:20:00Z)
Dynamic Graph Enhanced Contrastive Learning for Chest X-ray Report Generation [92.73584302508907]
コントラスト学習を用いた医療レポート作成を支援するために,動的構造とノードを持つ知識グラフを提案する。詳しくは、グラフの基本構造は一般知識から事前構築される。各イメージ機能は、レポート生成のためにデコーダモジュールに入力する前に、独自の更新グラフに統合される。
論文参考訳（メタデータ） (2023-03-18T03:53:43Z)
RadTex: Learning Efficient Radiograph Representations from Text Reports [7.090896766922791]
我々は,放射線学報告を利用して,限られたラベル付きデータを用いた医用画像分類性能を向上させるための,データ効率のよい学習フレームワークを構築した。本モデルは,ラベル付きトレーニングデータに制限がある場合,ImageNetによる事前学習よりも高い分類性能を実現する。
論文参考訳（メタデータ） (2022-08-05T15:06:26Z)
Pathological Retinal Region Segmentation From OCT Images Using Geometric Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文参考訳（メタデータ） (2020-03-31T11:50:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。