論文の概要: When is a Foundation Model a Foundation Model
- arxiv url: http://arxiv.org/abs/2309.11510v1
- Date: Thu, 14 Sep 2023 18:03:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-24 03:43:08.805925
- Title: When is a Foundation Model a Foundation Model
- Title(参考訳): いつの基礎モデルが基礎モデルになるのか
- Authors: Saghir Alfasly, Peyman Nejat, Sobhan Hemati, Jibran Khan, Isaiah Lahr,
Areej Alsaafin, Abubakr Shafique, Nneka Comfere, Dennis Murphree, Chady
Meroueh, Saba Yasir, Aaron Mangold, Lisa Boardman, Vijay Shah, Joaquin J.
Garcia, and H.R. Tizhoosh
- Abstract要約: ファンデーションモデルは、非常に広範なデータセットのトレーニングを通じて、特定のドメインのコンテキストを学習することのできる、大規模で深い人工知能ニューラルネットワークである。
このようなモデルにより生成された表現は、デジタル病理学における検索タスクにおいて、従来よりはるかに小さいディープネットワークで生成された表現と比較して、劣った性能を示す。
- 参考スコア(独自算出の注目度): 1.306205741109041
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, several studies have reported on the fine-tuning of foundation
models for image-text modeling in the field of medicine, utilizing images from
online data sources such as Twitter and PubMed. Foundation models are large,
deep artificial neural networks capable of learning the context of a specific
domain through training on exceptionally extensive datasets. Through
validation, we have observed that the representations generated by such models
exhibit inferior performance in retrieval tasks within digital pathology when
compared to those generated by significantly smaller, conventional deep
networks.
- Abstract(参考訳): 近年,医学分野における画像テキストモデリングの基礎モデルの微調整について,Twitter や PubMed などのオンラインデータソースの画像を利用した研究が報告されている。
ファンデーションモデルは、非常に広範なデータセットのトレーニングを通じて、特定のドメインのコンテキストを学習できる、大規模で深い人工知能ニューラルネットワークである。
検証を通して,これらのモデルが生成する表現は,従来よりはるかに小さい深層ネットワークで生成した表現と比較して,デジタル病理学における検索タスクにおいて劣る性能を示すことを見出した。
関連論文リスト
- A Disease-Specific Foundation Model Using Over 100K Fundus Images: Release and Validation for Abnormality and Multi-Disease Classification on Downstream Tasks [0.0]
基礎画像の異常を検出するための教師付き人工知能モデルであるFundus-Specific Pretrained Model(Image+Fundus)を開発した。
57,803枚の画像を用いて、この事前訓練されたモデルを開発し、様々な下流タスクにおいて優れた性能を実現した。
論文 参考訳(メタデータ) (2024-08-16T15:03:06Z) - Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。
逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。
我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文 参考訳(メタデータ) (2024-06-19T08:07:14Z) - YaART: Yet Another ART Rendering Technology [119.09155882164573]
そこで本研究では,ヒトの嗜好に適合する新しい生産段階のテキスト・ツー・イメージ拡散モデルYaARTを紹介した。
これらの選択がトレーニングプロセスの効率と生成された画像の品質にどのように影響するかを分析する。
高品質な画像の小さなデータセットでトレーニングされたモデルが、より大きなデータセットでトレーニングされたモデルとうまく競合できることを実証する。
論文 参考訳(メタデータ) (2024-04-08T16:51:19Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - On the Out of Distribution Robustness of Foundation Models in Medical
Image Segmentation [47.95611203419802]
視覚と言語の基礎は、様々な自然画像とテキストデータに基づいて事前訓練されており、有望なアプローチとして現れている。
一般化性能を,同じ分布データセット上で微調整した後,事前学習した各種モデルの未確認領域と比較した。
さらに,凍結モデルに対する新しいベイズ不確実性推定法を開発し,分布外データに基づくモデルの性能評価指標として利用した。
論文 参考訳(メタデータ) (2023-11-18T14:52:10Z) - Foundational Models in Medical Imaging: A Comprehensive Survey and
Future Vision [6.2847894163744105]
ファンデーションモデルは、広範囲の下流タスクに適応した大規模で事前訓練されたディープラーニングモデルである。
これらのモデルは、コンテキスト推論、一般化、テスト時の迅速な機能を促進する。
コンピュータビジョンの進歩に乗じて、医療画像はこれらのモデルへの関心も高まっている。
論文 参考訳(メタデータ) (2023-10-28T12:08:12Z) - Empirical Analysis of a Segmentation Foundation Model in Prostate
Imaging [9.99042549094606]
医療画像セグメンテーションのための基盤モデルUniverSegについて考察する。
本研究では,前立腺画像の文脈における経験的評価研究を行い,従来のタスク固有セグメンテーションモデルの訓練手法と比較する。
論文 参考訳(メタデータ) (2023-07-06T20:00:52Z) - Adapting Pretrained Vision-Language Foundational Models to Medical
Imaging Domains [3.8137985834223502]
臨床の文脈を忠実に描写する医療画像の生成モデルを構築することは、医療データセットの不明瞭さを軽減するのに役立つ。
安定拡散パイプラインのサブコンポーネントを探索し、モデルを微調整して医用画像を生成する。
我々の最良の性能モデルは、安定な拡散ベースラインを改善し、合成ラジオグラフィ画像に現実的な異常を挿入するように条件付けすることができる。
論文 参考訳(メタデータ) (2022-10-09T01:43:08Z) - Ultrasound Signal Processing: From Models to Deep Learning [64.56774869055826]
医用超音波画像は、信頼性と解釈可能な画像再構成を提供するために、高品質な信号処理に大きく依存している。
データ駆動方式で最適化されたディープラーニングベースの手法が人気を集めている。
比較的新しいパラダイムは、データ駆動型ディープラーニングの活用とドメイン知識の活用という2つのパワーを組み合わせたものだ。
論文 参考訳(メタデータ) (2022-04-09T13:04:36Z) - Explainable Adversarial Attacks in Deep Neural Networks Using Activation
Profiles [69.9674326582747]
本稿では,敵対的事例に基づくニューラルネットワークモデルを検討するためのビジュアルフレームワークを提案する。
これらの要素を観察することで、モデル内の悪用領域を素早く特定できることを示す。
論文 参考訳(メタデータ) (2021-03-18T13:04:21Z) - Reducing Textural Bias Improves Robustness of Deep Segmentation CNNs [8.736194193307451]
自然画像の最近の知見は、深いニューラルモデルは、画像分類タスクを実行する際に、テクスチャバイアスを示す可能性があることを示唆している。
本研究の目的は, 深いセグメンテーションモデルの堅牢性と伝達性を高めるために, テクスチャバイアス現象に対処する方法を検討することである。
論文 参考訳(メタデータ) (2020-11-30T18:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。