論文の概要: Anatomy of a failure: When, how, and why deep vision fails in scientific domains
- arxiv url: http://arxiv.org/abs/2605.04231v1
- Date: Tue, 05 May 2026 19:17:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.505802
- Title: Anatomy of a failure: When, how, and why deep vision fails in scientific domains
- Title(参考訳): 失敗の解剖 : 科学的領域において、いつ、どのように、なぜ深いビジョンが失敗するのか
- Authors: Ji-Hun Oh, Dou Hoon Kwark, Kianoush Falahkheirkhah, Kevin Yeh, John Cheville, Volodymyr Kindratenko, Rohit Bhargava,
- Abstract要約: ディープラーニングフレームワークを科学画像に適用することは、重大な失敗につながる可能性があることを示す。
病理学におけるDLの有用性について検討し, 染色組織のRGB画像と赤外画像の定量的および情報豊富な生化学的特徴を比較した。
我々は、この不一致を調査し、IRデータ先行がDLの単純さバイアスと不十分に相互作用し、モデルが1次元の予測に崩壊することを確認する。
- 参考スコア(独自算出の注目度): 1.3602996101213884
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mirroring its ubiquity in popular media and all human activities, the use of deep learning (DL) is rapidly growing in scientific imaging modalities. However, unlike everyday RGB pictures, pixels encode precise physicochemical properties in scientific imaging across potentially thousands of channels. While DL is well validated on human-centric RGB perceptual tasks, its effectiveness for scientific imaging remains uncertain. Here, we show that the naive application of DL frameworks to scientific images can lead to critical failures. We evaluate the use of DL for pathology, comparing RGB images of stained tissue with the quantitative and information-rich biochemical signatures of infrared (IR) imaging. Despite this informational advantage, DL models trained on IR data paradoxically underperform. We investigate this discrepancy to find that IR data priors interact poorly with the simplicity bias of DL, causing models to collapse to one-dimensional predictions. This constitutes a catastrophic DL failure because the model's representational capacity remains largely unused, while furthermore raising AI safety concerns and undermining the advantages of such scientific modalities. Notably, this problem persists even with state-of-the-art DL robustification strategies, which are primarily designed and validated for RGB imagery and thus inherit the same prior-bias mismatch. This work establishes a framework for understanding the limitations of generic DL in science and advocates for the study of modality-specific failure modes to guide the development of specialized, safe AI algorithms.
- Abstract(参考訳): 大衆メディアやすべての人間の活動にそのユビキタスさを反映して、深層学習(DL)の利用は、科学的な画像モダリティにおいて急速に増加している。
しかし、通常のRGB画像とは異なり、ピクセルは何千ものチャネルにわたる科学的画像の正確な物理化学的特性を符号化している。
DLは、人間中心のRGB知覚タスクで十分に検証されているが、科学的画像化の有効性は未だ不明である。
ここでは, DLフレームワークの科学画像への適用は, 致命的な失敗に繋がる可能性があることを示す。
病理診断にDLを用い, 染色組織のRGB画像と赤外画像の定量的, 情報豊富な生化学的特徴を比較検討した。
このような情報的優位性にもかかわらず、DLモデルは赤外線データで訓練され、パラドックス的に性能が劣る。
我々は、この不一致を調査し、IRデータ先行がDLの単純さバイアスと不十分に相互作用し、モデルが1次元の予測に崩壊することを確認する。
これは、モデルの表現能力がほとんど使われていない一方で、AIの安全性に関する懸念を高め、そのような科学的モダリティの利点を損なうため、破滅的なDL障害を構成する。
特に、この問題は、主にRGB画像用に設計され、検証され、従って同じ事前バイアスミスマッチを継承する最先端のDLロバスト化戦略でも継続する。
この研究は、科学における汎用DLの限界を理解するための枠組みを確立し、特別で安全なAIアルゴリズムの開発を導くために、モダリティ固有の障害モードの研究を提唱する。
関連論文リスト
- AdvBlur: Adversarial Blur for Robust Diabetic Retinopathy Classification and Cross-Domain Generalization [0.0]
糖尿病網膜症(DR)は、世界中の視覚障害の主要な原因である。
基礎画像からDRを予測するためのディープラーニング(DL)モデルが開発されている。
取得装置の違い、人口格差、画像条件の違いによる分布変動によるロバスト性維持における多くの課題に直面している。
本稿では,AdvBlurと呼ばれる新しいDR分類手法を提案する。
論文 参考訳(メタデータ) (2025-10-28T02:10:54Z) - Perceptual Evaluation of GANs and Diffusion Models for Generating X-rays [0.7578439720012189]
生成画像モデルは、自然画像と医療画像の両方において顕著な進歩を遂げている。
4つの異常を条件に胸部X線を合成するための最先端生成モデル-GAN(Generative Adversarial Networks)と拡散モデル(Diffusion Models)の有効性を評価する。
論文 参考訳(メタデータ) (2025-08-10T00:32:18Z) - Latent Drifting in Diffusion Models for Counterfactual Medical Image Synthesis [55.959002385347645]
遅延ドリフトにより、医療画像に対して拡散モデルを条件付けし、反ファクト画像生成の複雑なタスクに適合させることができる。
我々は,脳MRIと胸部X線による3つの時系列的ベンチマークデータセットを用いて,対物画像生成法について検討した。
論文 参考訳(メタデータ) (2024-12-30T01:59:34Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Unsupervised contrastive analysis for anomaly detection in brain MRIs via conditional diffusion models [13.970483987621135]
本研究では、健康な画像に対して自己教師付きコントラストエンコーダを訓練することにより、再建品質を改善するための教師なしフレームワークを提案する。
これらの特徴は、拡散モデルを用いて、与えられた画像の健全な外観を再構成し、画素ワイド比較による解釈可能な異常な局所化を可能にする。
論文 参考訳(メタデータ) (2024-06-02T15:19:07Z) - Gadolinium dose reduction for brain MRI using conditional deep learning [66.99830668082234]
これらの手法の主な課題は、コントラスト強調の正確な予測と現実的な画像の合成である。
コントラスト前の画像対とコントラスト後の画像対のサブトラクション画像に符号化されたコントラスト信号を利用することで、両課題に対処する。
各種スキャナー,フィールド強度,コントラストエージェントを用いた合成および実データに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2024-03-06T08:35:29Z) - Exposing Image Splicing Traces in Scientific Publications via Uncertainty-guided Refinement [30.698359275889363]
画像操作の疑いのある科学出版物の急増は、多くの撤回につながった。
画像スプライシング検出は、参照画像の欠如と典型的には小さな改ざんされた領域のため、より困難である。
本稿では,破壊要因の影響を軽減するために,不確実性誘導型リファインメントネットワーク(URN)を提案する。
論文 参考訳(メタデータ) (2023-09-28T12:36:12Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。