論文の概要: Pathology-Aware Adaptive Watermarking for Text-Driven Medical Image Synthesis
- arxiv url: http://arxiv.org/abs/2503.08346v1
- Date: Tue, 11 Mar 2025 11:55:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-12 15:42:51.487385
- Title: Pathology-Aware Adaptive Watermarking for Text-Driven Medical Image Synthesis
- Title(参考訳): テキスト駆動型医用画像合成のための病的適応型透かし
- Authors: Chanyoung Kim, Dayun Ju, Jinyeong Kim, Woojung Han, Roberto Alcover-Couso, Seong Jae Hwang,
- Abstract要約: MedSignは、テキストから医療画像の合成に特化したディープラーニングベースの透かしフレームワークである。
医療用テキストトークンと拡散復調ネットワーク間の相互注意を用いた病的局所化マップを生成する。
LDMデコーダを最適化し、画像合成中に透かしを組み込む。
- 参考スコア(独自算出の注目度): 4.817131062470421
- License:
- Abstract: As recent text-conditioned diffusion models have enabled the generation of high-quality images, concerns over their potential misuse have also grown. This issue is critical in the medical domain, where text-conditioned generated medical images could enable insurance fraud or falsified records, highlighting the urgent need for reliable safeguards against unethical use. While watermarking techniques have emerged as a promising solution in general image domains, their direct application to medical imaging presents significant challenges. A key challenge is preserving fine-grained disease manifestations, as even minor distortions from a watermark may lead to clinical misinterpretation, which compromises diagnostic integrity. To overcome this gap, we present MedSign, a deep learning-based watermarking framework specifically designed for text-to-medical image synthesis, which preserves pathologically significant regions by adaptively adjusting watermark strength. Specifically, we generate a pathology localization map using cross-attention between medical text tokens and the diffusion denoising network, aggregating token-wise attention across layers, heads, and time steps. Leveraging this map, we optimize the LDM decoder to incorporate watermarking during image synthesis, ensuring cohesive integration while minimizing interference in diagnostically critical regions. Experimental results show that our MedSign preserves diagnostic integrity while ensuring watermark robustness, achieving state-of-the-art performance in image quality and detection accuracy on MIMIC-CXR and OIA-ODIR datasets.
- Abstract(参考訳): 最近のテキスト条件拡散モデルにより高品質な画像の生成が可能になったため、その潜在的な誤用に対する懸念も高まっている。
この問題は、テキスト・コンディショニングされた医療画像が保険詐欺や偽造記録を可能にし、非倫理的使用に対する信頼性の高い保護の必要性を強調している医療領域において重要な問題である。
透かし技術は一般的な画像領域において有望な解決策として現れてきたが、医療画像への直接的応用は大きな課題を呈している。
重要な課題は、微粒な疾患の症状を保存することであり、透かしからの小さな歪みでさえ、臨床的な誤解釈を招き、診断の整合性を損なう可能性がある。
このギャップを克服するために、我々は、テキストから医療画像の合成に特化して設計された深層学習ベースの透かしフレームワークであるMedSignを紹介し、透かし強度を適応的に調整することで、病理学的に重要な領域を保存する。
具体的には,医療用テキストトークンと拡散復調ネットワークの相互アテンションを用いて,レイヤ,ヘッド,タイムステップ間のトークンワイドアテンションを集約して,病的局所化マップを生成する。
このマップを利用することで、画像合成中に透かしを組み込むようにLCMデコーダを最適化し、診断上重要な領域での干渉を最小限に抑えながら凝集性の統合を確保する。
その結果,MIMIC-CXRおよびOIA-ODIRデータセットにおける画像品質と検出精度が向上し,透かしの堅牢性を確保しつつ診断の整合性を保っていることがわかった。
関連論文リスト
- Spatial-aware Attention Generative Adversarial Network for Semi-supervised Anomaly Detection in Medical Image [63.59114880750643]
本稿では,一級半教師付き健康画像生成のための空間意識生成ネットワーク(SAGAN)について紹介する。
SAGANは、正常な画像の復元と擬似異常画像の復元によって導かれる、ラベルのないデータに対応する高品質な健康画像を生成する。
3つの医学データセットに対する大規模な実験は、提案されたSAGANが最先端の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-05-21T15:41:34Z) - Vision-Language Synthetic Data Enhances Echocardiography Downstream Tasks [4.1942958779358674]
本稿では,近年の視覚言語モデルを用いて,多彩でリアルな人工心エコー画像データを作成する。
合成データに含まれるリッチな文脈情報は、下流タスクの精度と解釈可能性を高める可能性があることを示す。
論文 参考訳(メタデータ) (2024-03-28T23:26:45Z) - Synthetic Medical Imaging Generation with Generative Adversarial Networks For Plain Radiographs [34.98319691651471]
本研究の目的は、再利用可能なオープンソースの合成画像生成パイプラインであるGAN画像合成ツール(GIST)を開発することである。
このパイプラインは、特定の患者に関連付けられていない高品質な合成画像データを生成することによって、デジタルヘルス空間におけるAIアルゴリズムの改善と標準化を支援する。
論文 参考訳(メタデータ) (2024-03-28T02:51:33Z) - Assessing the Efficacy of Invisible Watermarks in AI-Generated Medical Images [13.255732324562398]
見えない透かしは画像のピクセルの中に埋め込まれていて、人間の目からは見えないが、検出性は保たれている。
我々のゴールは、合成医療画像の検出可能性の向上、倫理基準の強化、データ汚染や潜在的な詐欺に対する保護などにおいて、このような透かしの有効性に関する議論の道を開くことである。
論文 参考訳(メタデータ) (2024-02-05T19:32:10Z) - T2IW: Joint Text to Image & Watermark Generation [74.20148555503127]
画像と透かし(T2IW)への共同テキスト生成のための新しいタスクを提案する。
このT2IWスキームは、意味的特徴と透かし信号が画素内で互換性を持つように強制することにより、複合画像を生成する際に、画像品質に最小限のダメージを与える。
提案手法により,画像品質,透かしの可視性,透かしの堅牢性などの顕著な成果が得られた。
論文 参考訳(メタデータ) (2023-09-07T16:12:06Z) - Preventing Unauthorized AI Over-Analysis by Medical Image Adversarial
Watermarking [43.17275405041853]
医用画像適応型透かし(MIAD-MARK)という先駆的手法を提案する。
提案手法では,不許可なAI診断モデルを戦略的に誤解させ,視覚的コンテンツの完全性を損なうことなく誤った予測を誘導する透かしを導入している。
本手法は,高度な透かし除去網が存在する場合でも,医用画像の不正利用を効果的に軽減する。
論文 参考訳(メタデータ) (2023-03-17T09:37:41Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z) - A Deep Discontinuity-Preserving Image Registration Network [73.03885837923599]
ほとんどの深層学習に基づく登録法は、所望の変形場が全世界的に滑らかで連続的であると仮定する。
本稿では、より優れた登録性能とリアルな変形場を得るために、弱い教師付き深部不連続保存画像登録ネットワーク(DDIR)を提案する。
本研究では, 心臓磁気共鳴(MR)画像の登録実験において, 登録精度を大幅に向上し, より現実的な変形を予測できることを実証した。
論文 参考訳(メタデータ) (2021-07-09T13:35:59Z) - Collaborative Unsupervised Domain Adaptation for Medical Image Diagnosis [102.40869566439514]
我々は、Unsupervised Domain Adaptation (UDA)を通じて、対象タスクにおける学習を支援するために、関連ドメインからの豊富なラベル付きデータを活用しようとしている。
クリーンなラベル付きデータやサンプルを仮定するほとんどのUDAメソッドが等しく転送可能であるのとは異なり、協調的教師なしドメイン適応アルゴリズムを革新的に提案する。
提案手法の一般化性能を理論的に解析し,医用画像と一般画像の両方で実験的に評価する。
論文 参考訳(メタデータ) (2020-07-05T11:49:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。