論文の概要: RDFace: A Benchmark Dataset for Rare Disease Facial Image Analysis under Extreme Data Scarcity and Phenotype-Aware Synthetic Generation
- arxiv url: http://arxiv.org/abs/2604.03454v1
- Date: Fri, 03 Apr 2026 20:56:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:18.588064
- Title: RDFace: A Benchmark Dataset for Rare Disease Facial Image Analysis under Extreme Data Scarcity and Phenotype-Aware Synthetic Generation
- Title(参考訳): RDFace: 極端データスカシティとフェノタイプ認識合成生成による希少疾患顔画像解析のためのベンチマークデータセット
- Authors: Ganlin Feng, Yuxi Long, Hafsa Ali, Erin Lou, Fahad Butt, Qian Liu, Yang Wang, Pingzhao Hu,
- Abstract要約: RDFaceは103の稀な遺伝状態にまたがる小児顔面画像のベンチマークデータセットである。
RDFaceは、まれな疾患診断のためのデータ効率の良いAIモデルの開発と評価を可能にする。
- 参考スコア(独自算出の注目度): 7.261858220545029
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Rare diseases often manifest with distinctive facial phenotypes in children, offering valuable diagnostic cues for clinicians and AI-assisted screening systems. However, progress in this field is severely limited by the scarcity of curated, ethically sourced facial data and the high similarity among phenotypes across different conditions. To address these challenges, we introduce RDFace, a curated benchmark dataset comprising 456 pediatric facial images spanning 103 rare genetic conditions (average 4.4 samples per condition). Each ethically verified image is paired with standardized metadata. RDFace enables the development and evaluation of data-efficient AI models for rare disease diagnosis under real-world low-data constraints. We benchmark multiple pretrained vision backbones using cross-validation and explore synthetic augmentation with DreamBooth and FastGAN. Generated images are filtered via facial landmark similarity to maintain phenotype fidelity and merged with real data, improving diagnostic accuracy by up to 13.7% in ultra-low-data regimes. To assess semantic validity, phenotype descriptions generated by a vision-language model from real and synthetic images achieve a report similarity score of 0.84. RDFace establishes a transparent, benchmark-ready dataset for equitable rare disease AI research and presents a scalable framework for evaluating both diagnostic performance and the integrity of synthetic medical imagery.
- Abstract(参考訳): 小児に特徴的な顔の表現型を呈する希少な疾患は、臨床医やAI支援スクリーニングシステムに貴重な診断手段を提供する。
しかし、この分野での進歩は、キュレートされた倫理的に引き起こされた顔データの不足と、異なる条件における表現型間の高い類似性によって著しく制限されている。
これらの課題に対処するために、RDFaceは、まれな103の遺伝的条件(平均4.4サンプル)にまたがる456の小児顔面画像からなる、キュレートされたベンチマークデータセットである。
倫理的に検証された各画像は、標準化されたメタデータとペアリングされる。
RDFaceは、実世界の低データ制約下での希少な疾患診断のためのデータ効率のよいAIモデルの開発と評価を可能にする。
我々は、クロスバリデーションを用いて、事前訓練された複数の視覚バックボーンをベンチマークし、DreamBoothとFastGANで合成強化を探索する。
生成した画像は顔のランドマークの類似性を通じてフィルタリングされ、表現型の忠実さを維持し、実際のデータとマージされる。
意味論的妥当性を評価するため、実画像及び合成画像から視覚言語モデルによって生成された表現型記述は、報告類似度スコア0.84を得る。
RDFaceは、公平なレア疾患AI研究のための透過的でベンチマーク可能なデータセットを確立し、診断性能と合成医療画像の整合性の両方を評価するスケーラブルなフレームワークを提供する。
関連論文リスト
- A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - Bridging the Gap Between Ideal and Real-world Evaluation: Benchmarking AI-Generated Image Detection in Challenging Scenarios [54.07895223545793]
本稿では,実世界ロバストネスデータセット(RRDataset)を導入し,3次元にわたる検出モデルの包括的評価を行う。
RRDatasetには7つの主要なシナリオの高品質なイメージが含まれている。
我々はRRDataset上で17の検出器と10の視覚言語モデル(VLM)をベンチマークし、大規模な人間実験を行った。
論文 参考訳(メタデータ) (2025-09-11T06:15:52Z) - Perceptual Evaluation of GANs and Diffusion Models for Generating X-rays [0.7578439720012189]
生成画像モデルは、自然画像と医療画像の両方において顕著な進歩を遂げている。
4つの異常を条件に胸部X線を合成するための最先端生成モデル-GAN(Generative Adversarial Networks)と拡散モデル(Diffusion Models)の有効性を評価する。
論文 参考訳(メタデータ) (2025-08-10T00:32:18Z) - SkinDualGen: Prompt-Driven Diffusion for Simultaneous Image-Mask Generation in Skin Lesions [0.0]
本稿では, トレーニング済み安定拡散2.0モデルを用いて, 高品質な合成皮膚病変画像を生成する手法を提案する。
実データと合成データを組み合わせたハイブリッドデータセットは、分類とセグメンテーションモデルの性能を著しく向上させる。
論文 参考訳(メタデータ) (2025-07-26T15:00:37Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - CFCPalsy: Facial Image Synthesis with Cross-Fusion Cycle Diffusion Model for Facial Paralysis Individuals [6.9859169233703104]
本研究の目的は、このギャップに対処するために、高品質な顔面麻痺データセットを合成することである。
拡散モデルに基づく新しいクロスフュージョンサイクルPalsy式生成モデル(PalsyCFC)を提案する。
顔面麻痺の一般的な臨床データセットについて, 定性的, 定量的に検討した。
論文 参考訳(メタデータ) (2024-09-11T13:46:35Z) - RadFusion: Benchmarking Performance and Fairness for Multimodal
Pulmonary Embolism Detection from CT and EHR [14.586822005217485]
肺塞栓症と診断されたEHRデータとCTを併用した1794例のベンチマークデータセットであるRadFusionを報告する。
以上の結果から,画像とEHRデータの統合により,集団間での正の正の比率に大きな差が生じることなく,分類性能が向上することが示唆された。
論文 参考訳(メタデータ) (2021-11-23T06:10:07Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。