Fugu-MT 論文翻訳(概要): SynFundus-1M: A High-quality Million-scale Synthetic fundus images Dataset with Fifteen Types of Annotation

論文の概要: SynFundus-1M: A High-quality Million-scale Synthetic fundus images Dataset with Fifteen Types of Annotation

arxiv url: http://arxiv.org/abs/2312.00377v4
Date: Thu, 14 Mar 2024 12:29:29 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-16 02:02:44.517982
Title: SynFundus-1M: A High-quality Million-scale Synthetic fundus images Dataset with Fifteen Types of Annotation
Title（参考訳）: SynFundus-1M:15種類のアノテーションを用いた高品質な100万規模の合成基礎画像
Authors: Fangxin Shang, Jie Fu, Yehui Yang, Haifeng Huang, Junwei Liu, Lei Ma,
Abstract要約: 我々は100万画素以上の画像を含む高品質な合成データセットであるSynFundus-1Mをリリースした。我々の知る限り、SynFundus-1Mは現在、最も洗練されたアノテーションを備えた最大のファンドデータセットです。
参考スコア（独自算出の注目度）: 27.785630580561573
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Large-scale public datasets with high-quality annotations are rarely available for intelligent medical imaging research, due to data privacy concerns and the cost of annotations. In this paper, we release SynFundus-1M, a high-quality synthetic dataset containing over one million fundus images in terms of \textbf{eleven disease types}. Furthermore, we deliberately assign four readability labels to the key regions of the fundus images. To the best of our knowledge, SynFundus-1M is currently the largest fundus dataset with the most sophisticated annotations. Leveraging over 1.3 million private authentic fundus images from various scenarios, we trained a powerful Denoising Diffusion Probabilistic Model, named SynFundus-Generator. The released SynFundus-1M are generated by SynFundus-Generator under predefined conditions. To demonstrate the value of SynFundus-1M, extensive experiments are designed in terms of the following aspect: 1) Authenticity of the images: we randomly blend the synthetic images with authentic fundus images, and find that experienced annotators can hardly distinguish the synthetic images from authentic ones. Moreover, we show that the disease-related vision features (e.g. lesions) are well simulated in the synthetic images. 2) Effectiveness for down-stream fine-tuning and pretraining: we demonstrate that retinal disease diagnosis models of either convolutional neural networks (CNN) or Vision Transformer (ViT) architectures can benefit from SynFundus-1M, and compared to the datasets commonly used for pretraining, models trained on SynFundus-1M not only achieve superior performance but also demonstrate faster convergence on various downstream tasks. SynFundus-1M is already public available for the open-source community.
Abstract（参考訳）: 高品質なアノテーションを備えた大規模な公開データセットは、データのプライバシー上の懸念とアノテーションのコストのために、インテリジェントな医療画像研究にはほとんど利用できない。本稿では,良質な合成データセットであるSynFundus-1Mをリリースする。さらに,4つの可読性ラベルを眼底画像のキー領域に意図的に割り当てる。我々の知る限り、SynFundus-1Mは現在、最も洗練されたアノテーションを備えた最大のファンドデータセットです。さまざまなシナリオから130万以上の個人認証イメージを活用して、SynFundus-Generatorという強力なDenoising Diffusion Probabilistic Modelをトレーニングしました。リリースされたSynFundus-1Mは、事前に定義された条件下でSynFundus-Generatorによって生成される。 SynFundus-1Mの価値を示すために、以下の点から広範な実験が設計されている。 1) 画像の正当性: 合成画像と真基底画像とをランダムにブレンドし, 経験者アノテータが合成画像と真基底画像とを区別することがほとんどないことを見出した。また, 疾患関連視覚特徴(eg病変)は, 合成画像において十分にシミュレートされている。 2) 畳み込みニューラルネットワーク (CNN) または視覚変換器 (ViT) アーキテクチャの網膜疾患診断モデルが,SynFundus-1M の恩恵を受けることを示すとともに,SynFundus-1M でトレーニングされたモデルでは,SynFundus-1M でトレーニングされたモデルが優れた性能を得るだけでなく,様々なダウンストリームタスクに対してより高速な収束を示す。 SynFundus-1Mはすでにオープンソースコミュニティで公開されている。

関連論文リスト

SynthFM: Training Modality-agnostic Foundation Models for Medical Image Segmentation without Real Medical Data [0.5242869847419834]
Segment Anything Model (SAM)のような基礎モデルでは、自然画像のゼロショットセグメンテーションが優れている。しかし、テクスチャ、コントラスト、ノイズの違いにより、医療画像のセグメンテーションに苦しむ。医用画像のアノテートには費用がかかり、ドメインの専門知識が必要で、大規模なアノテートされたデータの可用性が制限される。医用画像の複雑さを模倣する合成データ生成フレームワークであるSynthFMを提案する。
論文参考訳（メタデータ） (2025-04-11T00:14:28Z)
LEGION: Learning to Ground and Explain for Synthetic Image Detection [49.958951540410816]
提案するSynthScarsは,12,236個の完全合成画像からなる高品質で多様なデータセットである。 4つの異なる画像コンテンツタイプ、3つのアーティファクトカテゴリ、ピクセルレベルのセグメンテーション、詳細なテキスト説明、アーティファクトカテゴリラベルを含んでいる。人工物の検出,分割,説明を統合するマルチモーダル大規模言語モデル(MLLM)に基づく画像偽造解析フレームワークであるLEGIONを提案する。
論文参考訳（メタデータ） (2025-03-19T14:37:21Z)
SynthVLM: High-Efficiency and High-Quality Synthetic Data for Vision Language Models [39.21242589835842]
本稿では,画像キャプチャペアを生成するための新しいデータ合成とキュレーション手法であるSynthVLMを紹介する。 SynthVLMのパワーを実証するため,SynthVLM-100Kを導入した。モデルと人両方の評価において、SynthVLM-100Kは従来の実世界のデータセットよりも優れています。
論文参考訳（メタデータ） (2024-07-30T11:57:40Z)
MediSyn: A Generalist Text-Guided Latent Diffusion Model For Diverse Medical Image Synthesis [4.541407789437896]
MediSynは6つの専門医と10種類の画像から合成画像を生成することができるテキスト誘導潜在拡散モデルである。合成画像と実画像との直接比較により,本モデルが新規画像の合成を行い,患者のプライバシを重要視する可能性が確認された。本研究は,一般画像生成モデルが医学におけるアルゴリズム研究と開発を加速する大きな可能性を浮き彫りにした。
論文参考訳（メタデータ） (2024-05-16T04:28:44Z)
Learning Vision from Models Rivals Learning Vision from Data [54.43596959598465]
合成画像と合成キャプションのみから視覚表現を学習するための新しいアプローチであるSynCLRを紹介する。 LLMを用いて画像キャプションの大規模なデータセットを合成し,既製のテキスト・ツー・イメージモデルを用いて合成キャプションに対応する複数の画像を生成する。比較学習によって合成画像の視覚的表現学習を行い、同じ字幕を共有するイメージを正のペアとして扱う。
論文参考訳（メタデータ） (2023-12-28T18:59:55Z)
UAV-Sim: NeRF-based Synthetic Data Generation for UAV-based Perception [62.71374902455154]
ニューラルレンダリングの最近の進歩を利用して、静的および動的ノベルビューUAVベースの画像レンダリングを改善する。本研究では,主に実データと合成データのハイブリッドセットに基づいて最先端検出モデルが最適化された場合,性能が大幅に向上することを示す。
論文参考訳（メタデータ） (2023-10-25T00:20:37Z)
Augmenting medical image classifiers with synthetic data from latent diffusion models [12.077733447347592]
我々は,潜伏拡散モデルが皮膚疾患の画像を生成することを実証した。我々は,複数の生成戦略を用いて生成した458,920個の合成画像の新しいデータセットを生成し,解析する。
論文参考訳（メタデータ） (2023-08-23T22:34:49Z)
You Don't Have to Be Perfect to Be Amazing: Unveil the Utility of Synthetic Images [2.0790547421662064]
我々は、忠実さ、多様性、プライバシー、実用性など、総合的な合成画像評価ツールを確立した。 100k以上の胸部X線画像とその合成コピーを分析し、合成画像の忠実度、多様性、プライバシーの間に必然的なトレードオフがあることを実証した。
論文参考訳（メタデータ） (2023-05-25T13:47:04Z)
The Beauty or the Beast: Which Aspect of Synthetic Medical Images Deserves Our Focus? [1.6305276867803995]
医療AIアルゴリズムのトレーニングには、大量の正確なラベル付きデータセットが必要である。深層生成モデルから生成された合成画像は、データの不足問題を緩和するのに役立つが、それらの有効性は実世界の画像への忠実さに依存している。
論文参考訳（メタデータ） (2023-05-03T09:09:54Z)
Mask-conditioned latent diffusion for generating gastrointestinal polyp images [2.027538200191349]
本研究では,与えられたセグメンテーションマスクに条件付き合成GIポリプ画像を生成する条件付きDPMフレームワークを提案する。本システムでは,ポリプの接地真実マスクを用いて,無限個の高忠実度合成ポリプ画像を生成することができる。以上の結果から,実データと合成データの両方からなるトレーニングデータから,DeepLabv3+から0.7751の最適マイクロイモージョンIOUが得られた。
論文参考訳（メタデータ） (2023-04-11T14:11:17Z)
Differentially Private Diffusion Models Generate Useful Synthetic Images [53.94025967603649]
近年の研究では、いくつかの拡散モデルの出力がトレーニングデータのプライバシを保持していないことが報告されている。 CIFAR-10 と Camelyon17 のSOTA 結果を得た。以上の結果から,差分プライバシーで微調整された拡散モデルが有用かつ実証可能なプライベートな合成データを生成できることが示唆された。
論文参考訳（メタデータ） (2023-02-27T15:02:04Z)
High-fidelity Direct Contrast Synthesis from Magnetic Resonance Fingerprinting [28.702553164811473]
本稿では,MRFデータからコントラスト強調画像を直接合成する教師あり学習手法を提案する。 In-vivo実験は、シミュレーションベースのコントラスト合成や従来のDCS法と比較して、視覚的にも定量的にも優れた画質を示す。
論文参考訳（メタデータ） (2022-12-21T07:11:39Z)
IntraQ: Learning Synthetic Images with Intra-Class Heterogeneity for Zero-Shot Network Quantization [118.39791787743401]
IntraQと呼ばれる新しいゼロショット量子化法を提案する。まず,合成画像の異なるスケールと位置で対象物を特定する局所的物体補強法を提案する。第2に、粗い領域に分布するクラス関連特徴を形成するために、限界距離制約を導入する。第3に,軟弱な先行ラベルを注入するソフトロスを考案し,合成画像が固定対象物に過度に収まらないようにした。
論文参考訳（メタデータ） (2021-11-17T14:17:19Z)
You Only Need Adversarial Supervision for Semantic Image Synthesis [84.83711654797342]
我々は,高品質な結果を得るためには敵対的監督のみを必要とする,新しい簡易ganモデルを提案する。本モデルによって合成された画像はより多様であり,実画像の色やテクスチャに密接に従っている。
論文参考訳（メタデータ） (2020-12-08T23:00:48Z)
Multimodal Image Synthesis with Conditional Implicit Maximum Likelihood Estimation [54.17177006826262]
我々はImplicit Maximum Likelihood Estimation (IMLE)に基づく新しい一般条件画像合成法を開発した。我々は,シーンレイアウトからの単一画像超解像と画像合成という,2つのタスクにおけるマルチモーダル画像合成性能の改善を実証した。
論文参考訳（メタデータ） (2020-04-07T03:06:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。