論文の概要: Evaluating the Clinical Impact of Generative Inpainting on Bone Age Estimation
- arxiv url: http://arxiv.org/abs/2511.23066v1
- Date: Fri, 28 Nov 2025 10:48:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.8621
- Title: Evaluating the Clinical Impact of Generative Inpainting on Bone Age Estimation
- Title(参考訳): 骨年齢推定における生成的塗布の臨床効果の評価
- Authors: Felipe Akio Matsuoka, Eduardo Moreno J. M. Farina, Augusto Sarquis Serpa, Soraya Monteiro, Rodrigo Ragazzini, Nitamar Abdala, Marcelo Straus Takahashi, Felipe Campos Kitamura,
- Abstract要約: 生成基盤モデルは、リアルなイメージのインペイントによって視覚的アーティファクトを除去することができる。
人工物除去のための生成モデルによる塗布の信頼性について検討した。
視覚的には現実的ではあるが、基礎モデルに基づく塗り絵は微妙だが臨床的に関連性がある。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative foundation models can remove visual artifacts through realistic image inpainting, but their impact on medical AI performance remains uncertain. Pediatric hand radiographs often contain non-anatomical markers, and it is unclear whether inpainting these regions preserves features needed for bone age and gender prediction. To evaluate the clinical reliability of generative model-based inpainting for artifact removal, we used the RSNA Bone Age Challenge dataset, selecting 200 original radiographs and generating 600 inpainted versions with gpt-image-1 using natural language prompts to target non-anatomical artifacts. Downstream performance was assessed with deep learning ensembles for bone age estimation and gender classification, using mean absolute error (MAE) and area under the ROC curve (AUC) as metrics, and pixel intensity distributions to detect structural alterations. Inpainting markedly degraded model performance: bone age MAE increased from 6.26 to 30.11 months, and gender classification AUC decreased from 0.955 to 0.704. Inpainted images displayed pixel-intensity shifts and inconsistencies, indicating structural modifications not corrected by simple calibration. These findings show that, although visually realistic, foundation model-based inpainting can obscure subtle but clinically relevant features and introduce latent bias even when edits are confined to non-diagnostic regions, underscoring the need for rigorous, task-specific validation before integrating such generative tools into clinical AI workflows.
- Abstract(参考訳): 生成ファウンデーションモデルは、現実的なイメージインペイントによって視覚的アーティファクトを除去することができるが、医療AIのパフォーマンスへの影響は依然として不明である。
小児手X線写真は非解剖学的マーカーをしばしば含んでいるが、これらの領域の塗布が骨年齢や性別予測に必要な特徴を保っているかどうかは不明である。
人工物除去のための生成モデルによる塗布の臨床的信頼性を評価するため, RSNA Bone Age Challengeデータセットを用いて, 200個のオリジナルのX線写真を選択し, gpt-image-1を用いた600個の塗布版を生成し, 非解剖学的アーティファクトを標的とした自然言語プロンプトを用いた。
骨年齢推定および性別分類のための深層学習アンサンブル,平均絶対誤差 (MAE) とROC曲線 (AUC) 以下の領域を指標として, および構造変化を検出する画素強度分布を用いて, 下流性能を評価した。
骨年齢MAEは6.26から30.11ヶ月に増加し、AUCは0.955から0.704に減少した。
Inpainted image showed pixel-intensity shifts and inconsistency, showing structure modifieds not corrected by simple calibration。
これらの結果は、視覚的に現実的ではあるが、基礎モデルに基づく塗り絵は、微妙だが臨床的に関係のある特徴を曖昧にし、編集が非診断領域に限定されている場合でも潜伏バイアスを生じさせ、そのような生成ツールを臨床AIワークフローに統合する前に、厳密でタスク固有の検証の必要性を強調していることを示している。
関連論文リスト
- A Modified VGG19-Based Framework for Accurate and Interpretable Real-Time Bone Fracture Detection [0.0]
本稿では,VGG-19モデルを用いた骨骨折の自動検出フレームワークを提案する。
コントラスト限定適応ヒストグラム等化(CLAHE)、大津のしきい値設定、カニーエッジ検出など、高度な前処理技術が組み込まれている。
医療専門家はX線画像をアップロードし、0.5秒以内に診断フィードバックを受け取ることができる。
論文 参考訳(メタデータ) (2025-07-31T19:22:58Z) - GRASP-PsONet: Gradient-based Removal of Spurious Patterns for PsOriasis Severity Classification [0.0]
本稿では,突発的な相関を導入し,問題のあるトレーニングイメージを自動的にフラグするフレームワークを提案する。
フラグ付き画像の8.2%は、保持されたテストセットでモデルAUC-ROCを5%(85%から90%)改善する。
2人の皮膚科医によって評価された訓練データのサブセットに適用した場合、この方法は、レイター間不一致の90%以上を識別する。
論文 参考訳(メタデータ) (2025-06-27T03:42:09Z) - A Deep Learning-Driven Inhalation Injury Grading Assistant Using Bronchoscopy Images [2.7440389071148386]
吸入障害は、従来のグレーディング法が主観的であるため、臨床診断とグレーディングにおいて課題となる。
そこで本研究では,気管支鏡による吸入外傷の診断支援ツールについて紹介した。
論文 参考訳(メタデータ) (2025-05-13T12:48:36Z) - Trustworthy image-to-image translation: evaluating uncertainty calibration in unpaired training scenarios [0.0]
マンモグラフィスクリーニングは乳がんの検出に有効な方法であり、早期診断を容易にする。
ディープニューラルネットワークはいくつかの研究で有効であることが示されているが、その傾向は一般化と誤診のリスクをかなり残している。
汎用性を向上させるために、未ペア型ニューラルスタイル転送モデルに基づくデータ拡張スキームが提案されている。
3つのオープンアクセスマンモグラフィーデータセットと1つの非医療画像データセットから解析した画像パッチを用いて、それらの性能を評価する。
論文 参考訳(メタデータ) (2025-01-29T11:09:50Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Significantly improving zero-shot X-ray pathology classification via fine-tuning pre-trained image-text encoders [50.689585476660554]
本稿では,正対損失緩和とランダムな文サンプリングを含む新たな微調整手法を提案する。
提案手法は,胸部X線データセットと3つの事前訓練モデル間のゼロショット病理分類を一貫して改善する。
論文 参考訳(メタデータ) (2022-12-14T06:04:18Z) - Faint Features Tell: Automatic Vertebrae Fracture Screening Assisted by
Contrastive Learning [11.944282446506396]
長期の脊椎骨折は患者の生活の質に深刻な影響を与え、気胸、腰椎変形、さらには麻痺を引き起こしている。
特に、深層学習モデルや経験の浅い医師では、軽度の骨折と正常なコントロールを区別することは極めて困難である。
そこで本研究では,CTスキャンを用いてGenentの脊椎骨折度を推定するための教師付きコントラスト学習ベースモデルを提案する。
両分類では99%,感度は85%,マクロF1は77%であった。
論文 参考訳(メタデータ) (2022-08-23T02:39:08Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Malignancy Prediction and Lesion Identification from Clinical
Dermatological Images [65.1629311281062]
臨床皮膚画像から機械学習に基づく悪性度予測と病変の同定を検討する。
まず, サブタイプや悪性度に関わらず画像に存在するすべての病変を同定し, その悪性度を推定し, 凝集により, 画像レベルの悪性度も生成する。
論文 参考訳(メタデータ) (2021-04-02T20:52:05Z) - Variational Knowledge Distillation for Disease Classification in Chest
X-Rays [102.04931207504173]
我々は,X線に基づく疾患分類のための新しい確率的推論フレームワークである反復的知識蒸留(VKD)を提案する。
提案手法の有効性を,X線画像とEHRを用いた3つの公開ベンチマークデータセットに示す。
論文 参考訳(メタデータ) (2021-03-19T14:13:56Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。