論文の概要: MieDB-100k: A Comprehensive Dataset for Medical Image Editing
- arxiv url: http://arxiv.org/abs/2602.09587v1
- Date: Tue, 10 Feb 2026 09:37:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-11 20:17:43.476157
- Title: MieDB-100k: A Comprehensive Dataset for Medical Image Editing
- Title(参考訳): MieDB-100k: 医用画像編集のための総合データセット
- Authors: Yongfan Lai, Wen Qian, Bo Liu, Hongyan Li, Hao Luo, Fan Wang, Bohan Zhuang, Shenda Hong,
- Abstract要約: 既存の医用画像編集データセットは、限られた多様性、医療用画像理解の欠如、品質とスケーラビリティのバランスの取れないことがしばしばある。
テキスト誘導医療画像編集のための大規模で高品質で多様なデータセットであるMieDB-100kを提案する。
編集作業は、理解能力と生成能力の両方を考慮して、知覚、修正、変換の観点に分類する。
- 参考スコア(独自算出の注目度): 41.846794649076514
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The scarcity of high-quality data remains a primary bottleneck in adapting multimodal generative models for medical image editing. Existing medical image editing datasets often suffer from limited diversity, neglect of medical image understanding and inability to balance quality with scalability. To address these gaps, we propose MieDB-100k, a large-scale, high-quality and diverse dataset for text-guided medical image editing. It categorizes editing tasks into perspectives of Perception, Modification and Transformation, considering both understanding and generation abilities. We construct MieDB-100k via a data curation pipeline leveraging both modality-specific expert models and rule-based data synthetic methods, followed by rigorous manual inspection to ensure clinical fidelity. Extensive experiments demonstrate that model trained with MieDB-100k consistently outperform both open-source and proprietary models while exhibiting strong generalization ability. We anticipate that this dataset will serve as a cornerstone for future advancements in specialized medical image editing.
- Abstract(参考訳): 高品質なデータの不足は、医用画像編集にマルチモーダル生成モデルを適用する上で、依然として主要なボトルネックとなっている。
既存の医用画像編集データセットは、限られた多様性、医療用画像理解の欠如、品質とスケーラビリティのバランスの取れないことがしばしばある。
これらのギャップに対処するため,テキスト誘導医療画像編集のための大規模かつ高品質で多様なデータセットであるMieDB-100kを提案する。
編集作業は、理解能力と生成能力の両方を考慮して、知覚、修正、変換の観点に分類する。
我々は、モダリティ固有の専門家モデルとルールベースのデータ合成手法の両方を活用するデータキュレーションパイプラインを介して、MieDB-100kを構築し、その後、厳密な手動検査を行い、臨床忠実性を確保する。
大規模な実験では、MieDB-100kでトレーニングされたモデルは、強力な一般化能力を示しながら、オープンソースモデルとプロプライエタリモデルの両方を一貫して上回っている。
我々は,このデータセットが,医用画像編集の今後の進歩の基盤となることを期待する。
関連論文リスト
- Med-Banana-50K: A Cross-modality Large-Scale Dataset for Text-guided Medical Image Editing [10.156463079664134]
Med-Banana-50Kは、胸部X線、脳MRI、23の疾患を含む50万以上の画像編集の包括的なデータセットである。
私たちのデータセットの重要な差別化要因は、医学的に基盤とした品質管理プロトコルです。
Med-Banana-50Kには、完全な評価ログによる編集の試みが約37,000回失敗している。
論文 参考訳(メタデータ) (2025-11-02T04:46:43Z) - MedGemma Technical Report [75.88152277443179]
MedGemmaは、Gemma 3 4Bと27Bをベースとした医療ビジョン言語基盤モデルの集合体である。
MedGemmaは、画像とテキストの高度な医学的理解と推論を実証する。
また、SigLIPから派生した医用目視エンコーダであるMedSigLIPを紹介する。
論文 参考訳(メタデータ) (2025-07-07T17:01:44Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - RadEdit: stress-testing biomedical vision models via diffusion image editing [45.43408333243842]
本研究は、生成画像編集を用いて、バイオメディカルビジョンモデルのデータセットシフトをシミュレートし、障害モードを診断することを提案する。
既存の編集手法は、疾患や治療介入の共起によって学習された、望ましくない変化をもたらす可能性がある。
そこで我々は,複数のマスクを用いた新しい編集手法RadEditを導入し,変更を制約し,編集画像の一貫性を確保する。
論文 参考訳(メタデータ) (2023-12-20T09:27:41Z) - Medical diffusion on a budget: Textual Inversion for medical image generation [3.0826983115939823]
スクラッチからトレーニングするには、大きなキャプション付きデータセットと重要な計算リソースが必要である。
本研究は, 予め訓練した安定拡散モデルを医用画像モダリティに適応させることが, テキスト埋め込みの訓練によって達成可能であることを示す。
トレーニングされた埋め込みはコンパクト(1MB未満)で、プライバシー上の懸念を減らしてデータ共有を容易にする。
論文 参考訳(メタデータ) (2023-03-23T16:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。