Fugu-MT 論文翻訳(概要): Models Genesis

論文の概要: Models Genesis

arxiv url: http://arxiv.org/abs/2004.07882v4
Date: Wed, 16 Dec 2020 19:58:08 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-15 03:20:55.822819
Title: Models Genesis
Title（参考訳）: モデル生成
Authors: Zongwei Zhou, Vatsal Sodha, Jiaxuan Pang, Michael B. Gotway, Jianming Liang
Abstract要約: 自然画像から医用画像への変換学習は、医用画像解析のためのディープラーニングにおける最も実践的なパラダイムの1つとして確立されている。この制限を克服するため、私たちはGeneric Autodidactic Modelsと呼ばれるモデルセットを構築しました。実験の結果, 対象とする5つの3Dアプリケーションすべてにおいて, 既存のトレーニング済み3Dモデルとスクラッチから学習を著しく上回る結果が得られた。
参考スコア（独自算出の注目度）: 10.929445262793116
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Transfer learning from natural images to medical images has been established as one of the most practical paradigms in deep learning for medical image analysis. To fit this paradigm, however, 3D imaging tasks in the most prominent imaging modalities (e.g., CT and MRI) have to be reformulated and solved in 2D, losing rich 3D anatomical information, thereby inevitably compromising its performance. To overcome this limitation, we have built a set of models, called Generic Autodidactic Models, nicknamed Models Genesis, because they are created ex nihilo (with no manual labeling), self-taught (learnt by self-supervision), and generic (served as source models for generating application-specific target models). Our extensive experiments demonstrate that our Models Genesis significantly outperform learning from scratch and existing pre-trained 3D models in all five target 3D applications covering both segmentation and classification. More importantly, learning a model from scratch simply in 3D may not necessarily yield performance better than transfer learning from ImageNet in 2D, but our Models Genesis consistently top any 2D/2.5D approaches including fine-tuning the models pre-trained from ImageNet as well as fine-tuning the 2D versions of our Models Genesis, confirming the importance of 3D anatomical information and significance of Models Genesis for 3D medical imaging. This performance is attributed to our unified self-supervised learning framework, built on a simple yet powerful observation: the sophisticated and recurrent anatomy in medical images can serve as strong yet free supervision signals for deep models to learn common anatomical representation automatically via self-supervision. As open science, all codes and pre-trained Models Genesis are available at https://github.com/MrGiovanni/ModelsGenesis.
Abstract（参考訳）: 自然画像から医学画像への学習は、医学画像解析におけるディープラーニングの最も実用的なパラダイムの1つとして確立されている。しかし、このパラダイムに適合するためには、最も顕著な画像モダリティ(例えば、CTやMRI)における3Dイメージングタスクを2Dで再構成して解決する必要がある。この制限を克服するため、私たちはGeneric Autodidactic Modelsと呼ばれるモデルセットを構築しました。それは、ex nihilo(手動ラベリングなしで)、self-taught(セルフスーパービジョンで取得)、ジェネリック(アプリケーション固有のターゲットモデルを生成するためのソースモデルとして保存されている)を作成するためです。我々のモデル生成は、スクラッチと既存のトレーニング済み3Dモデルから、セグメンテーションと分類の両方をカバーする5つのターゲット3Dアプリケーションにおいて、学習を著しく上回ることを示した。より重要なことは、単に3dでスクラッチからモデルを学ぶだけでは、imagenetから2dでトランスファー学習よりもパフォーマンスが向上するとは限らないが、我々のモデル創成は、imagenetから事前トレーニングされたモデルを微調整することや、2dバージョンのモデル創成を微調整することを含む、あらゆる2d/2.5dアプローチを一貫して上回っており、3d解剖情報の重要性と3d医療画像におけるモデル創成の重要性を確認している。医用画像の高度で反復的な解剖学は、ディープモデルが自己監督を通じて共通の解剖学的表現を自動的に学習するための強力な、かつ自由な監視信号として機能する。オープンサイエンスとして、すべてのコードと事前訓練されたModels Genesisはhttps://github.com/MrGiovanni/ModelsGenesisで入手できる。

関連論文リスト

RadSAM: Segmenting 3D radiological images with a 2D promptable model [4.9000940389224885]
1つのプロンプトから2次元モデルで3Dオブジェクトを分割する新しい手法であるRadSAMを提案する。我々は,1つのプロンプトからCT画像に3Dオブジェクトを分割する能力を評価するためのベンチマークを導入する。
論文参考訳（メタデータ） (2025-04-29T15:00:25Z)
How Well Do Supervised 3D Models Transfer to Medical Imaging Tasks? [8.82276658079814]
本稿では,移動学習のためのAbdomenAtlas 1.1で事前訓練したモデルスイートを開発する。予備分析の結果,21個のCTボリューム,672個のマスク,40個のGPU時間でトレーニングしたモデルは,5,050個のCTボリュームと1,152個のGPU時間でトレーニングしたモデルと同様の転送学習能力を有することがわかった。
論文参考訳（メタデータ） (2025-01-20T03:34:49Z)
Zero-1-to-G: Taming Pretrained 2D Diffusion Model for Direct 3D Generation [66.75243908044538]
我々は,事前学習した2次元拡散モデルを用いたガウススプラット上での3次元直接生成手法であるZero-1-to-Gを導入する。 3D認識を取り入れるために,複雑な相関関係を捉え,生成されたスプラット間の3D一貫性を強制する,クロスビュー層とクロスアトリビュートアテンション層を導入する。これにより、Zero-1-to-Gは、事前訓練された2D拡散前処理を効果的に活用する最初の直接画像から3D生成モデルとなり、効率的なトレーニングと未確認物体への一般化が実現された。
論文参考訳（メタデータ） (2025-01-09T18:37:35Z)
Deep Convolutional Neural Networks on Multiclass Classification of Three-Dimensional Brain Images for Parkinson's Disease Stage Prediction [2.931680194227131]
パーキンソン病の病期を正確に予測できるモデルを開発した。我々は3次元脳画像全体を入力として使用した。予測過程において,異なるスライスの重要性を考慮に入れた注意機構を組み込んだ。
論文参考訳（メタデータ） (2024-10-31T05:40:08Z)
3D-VirtFusion: Synthetic 3D Data Augmentation through Generative Diffusion Models and Controllable Editing [52.68314936128752]
本研究では,事前学習された大規模基盤モデルのパワーを活用して,3次元ラベル付きトレーニングデータを自動的に生成する新しいパラダイムを提案する。各ターゲットセマンティッククラスに対して、まず、拡散モデルとチャットGPT生成したテキストプロンプトを介して、様々な構造と外観の1つのオブジェクトの2D画像を生成する。我々は、これらの拡張画像を3Dオブジェクトに変換し、ランダムな合成によって仮想シーンを構築する。
論文参考訳（メタデータ） (2024-08-25T09:31:22Z)
VISTA3D: A Unified Segmentation Foundation Model For 3D Medical Imaging [18.111368889931885]
VISTA3D,Versatile Imaging SegmenTation,voxel modelを提案する。確立された3Dセグメンテーションパイプライン上に構築されている。これは、3D自動(127クラスのサポート)と3Dインタラクティブセグメンテーションの両方で最先端のパフォーマンスを達成する最初のモデルである。
論文参考訳（メタデータ） (2024-06-07T22:41:39Z)
Leveraging Large-Scale Pretrained Vision Foundation Models for Label-Efficient 3D Point Cloud Segmentation [67.07112533415116]
本稿では3Dポイントクラウドセグメンテーションタスクに様々な基礎モデルを適用する新しいフレームワークを提案する。我々のアプローチでは、異なる大きな視覚モデルを用いて2次元セマンティックマスクの初期予測を行う。本研究では,ロバストな3Dセマンティックな擬似ラベルを生成するために,投票による全ての結果を効果的に組み合わせたセマンティックなラベル融合戦略を提案する。
論文参考訳（メタデータ） (2023-11-03T15:41:15Z)
PonderV2: Pave the Way for 3D Foundation Model with A Universal Pre-training Paradigm [114.47216525866435]
本稿では,効率的な3D表現の獲得を容易にするために,新しいユニバーサル3D事前学習フレームワークを提案する。 PonderV2は、11の室内および屋外ベンチマークで最先端のパフォーマンスを達成したことで、その効果が示唆された。
論文参考訳（メタデータ） (2023-10-12T17:59:57Z)
Take-A-Photo: 3D-to-2D Generative Pre-training of Point Cloud Models [97.58685709663287]
生成事前学習は、2次元視覚における基本モデルの性能を高めることができる。 3Dビジョンでは、トランスフォーマーベースのバックボーンの過度な信頼性と、点雲の秩序のない性質により、生成前のトレーニングのさらなる発展が制限されている。本稿では,任意の点クラウドモデルに適用可能な3D-to-2D生成事前学習法を提案する。
論文参考訳（メタデータ） (2023-07-27T16:07:03Z)
AG3D: Learning to Generate 3D Avatars from 2D Image Collections [96.28021214088746]
本稿では,2次元画像から現実的な3次元人物の新たな逆生成モデルを提案する。本手法は, 全身型3Dジェネレータを用いて, 体の形状と変形を捉える。提案手法は, 従来の3次元・調音認識手法よりも幾何的, 外観的に優れていた。
論文参考訳（メタデータ） (2023-05-03T17:56:24Z)
HoloDiffusion: Training a 3D Diffusion Model using 2D Images [71.1144397510333]
我々は,2次元画像のみを監督のために配置した,エンドツーエンドでトレーニング可能な新しい拡散装置を導入する。我々の拡散モデルはスケーラブルで、頑健に訓練されており、既存の3次元生成モデルへのアプローチに対して、サンプルの品質と忠実さの点で競争力があることを示す。
論文参考訳（メタデータ） (2023-03-29T07:35:56Z)
Oral-3Dv2: 3D Oral Reconstruction from Panoramic X-Ray Imaging with Implicit Neural Representation [3.8215162658168524]
Oral-3Dv2は、単一のパノラマX線画像から3Dラジオロジーを再構成する非逆学習モデルである。本モデルは,2次元座標を3次元空間内のボクセルの密度値にマッピングすることにより,暗黙的に3次元口腔構造を表現することを学習する。我々の知る限りでは、これは1枚のパノラマX線画像から3Dラジオグラフィ再構成における非逆学習モデルの最初の作品である。
論文参考訳（メタデータ） (2023-03-21T18:17:27Z)
Transferring Models Trained on Natural Images to 3D MRI via Position Encoded Slice Models [14.42534860640976]
2D-Slice-CNNアーキテクチャは、すべてのMRIスライスを2Dエンコーダに埋め込む。トレーニング済みのモデルが2Dエンコーダとして機能できるという知見を得て、2DエンコーダをImageNetで初期化し、2つのニューロイメージングタスクでそれらを上回り、スクラッチからトレーニングする。
論文参考訳（メタデータ） (2023-03-02T18:52:31Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。