論文の概要: UI-Styler: Ultrasound Image Style Transfer with Class-Aware Prompts for Cross-Device Diagnosis Using a Frozen Black-Box Inference Network
- arxiv url: http://arxiv.org/abs/2511.17155v1
- Date: Fri, 21 Nov 2025 11:19:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:18.988433
- Title: UI-Styler: Ultrasound Image Style Transfer with Class-Aware Prompts for Cross-Device Diagnosis Using a Frozen Black-Box Inference Network
- Title(参考訳): UI-Styler:凍結ブラックボックス推論ネットワークを用いたクロスデバイス診断のためのクラス認識プロンプトを用いた超音波画像スタイル転送
- Authors: Nhat-Tuong Do-Tran, Ngoc-Hoang-Lam Le, Ching-Chun Huang,
- Abstract要約: そこで本稿では,UI-Styler を用いた新しい超音波画像転送フレームワークを提案する。
パターンマッチング機構を使用して、ターゲット画像に埋め込まれたテクスチャパターンをソースイメージに転送する。
対象ドメインの擬似ラベルで案内されるクラス認識プロンプト戦略を導入し,診断カテゴリとの正確なセマンティックアライメントを実現する。
- 参考スコア(独自算出の注目度): 9.491149907444616
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The appearance of ultrasound images varies across acquisition devices, causing domain shifts that degrade the performance of fixed black-box downstream inference models when reused. To mitigate this issue, it is practical to develop unpaired image translation (UIT) methods that effectively align the statistical distributions between source and target domains, particularly under the constraint of a reused inference-blackbox setting. However, existing UIT approaches often overlook class-specific semantic alignment during domain adaptation, resulting in misaligned content-class mappings that can impair diagnostic accuracy. To address this limitation, we propose UI-Styler, a novel ultrasound-specific, class-aware image style transfer framework. UI-Styler leverages a pattern-matching mechanism to transfer texture patterns embedded in the target images onto source images while preserving the source structural content. In addition, we introduce a class-aware prompting strategy guided by pseudo labels of the target domain, which enforces accurate semantic alignment with diagnostic categories. Extensive experiments on ultrasound cross-device tasks demonstrate that UI-Styler consistently outperforms existing UIT methods, achieving state-of-the-art performance in distribution distance and downstream tasks, such as classification and segmentation.
- Abstract(参考訳): 超音波画像の出現は、取得装置によって異なるため、使用時に固定されたブラックボックス下流推論モデルの性能を低下させるドメインシフトを引き起こす。
この問題を緩和するために、特に再利用可能な推論ブラックボックス設定の制約の下で、ソースとターゲットドメイン間の統計的分布を効果的に整合させる、未ペア画像変換(UIT)手法を開発することが実用的である。
しかし、既存のUITアプローチは、ドメイン適応中にクラス固有のセマンティックアライメントを見落とし、診断精度を損なう可能性のあるコンテンツクラスのマッピングを誤調整することがある。
この制限に対処するために,新しい超音波特化クラス対応画像転送フレームワークであるUI-Stylerを提案する。
UI-Stylerはパターンマッチング機構を利用して、ターゲットイメージに埋め込まれたテクスチャパターンをソースイメージに転送し、ソース構造内容を保存する。
さらに,対象ドメインの擬似ラベルで案内されるクラス認識促進戦略を導入し,診断カテゴリとの正確なセマンティックアライメントを実現する。
超音波クロスデバイスタスクに関する大規模な実験により、UI-Stylerは既存のUITメソッドよりも一貫して優れており、分類やセグメンテーションのような分散距離や下流タスクにおける最先端のパフォーマンスを実現している。
関連論文リスト
- Bézier Meets Diffusion: Robust Generation Across Domains for Medical Image Segmentation [18.618250617122392]
異なる医用画像モダリティにわたる堅牢な学習アルゴリズムのトレーニングは、大きなドメインギャップのために困難である。
教師なしドメイン適応(UDA)は、ソースドメインからの注釈付きイメージとターゲットドメインからのラベルなしイメージを使用して、ディープモデルをトレーニングすることでこの問題を軽減する。
既存のアプローチは、しばしばGANベースのスタイル転送に依存しているが、これらの手法は、高い可変性を持つ領域におけるクロスドメインマッピングの取得に苦慮している。
論文 参考訳(メタデータ) (2025-09-26T15:23:17Z) - OFFSET: Segmentation-based Focus Shift Revision for Composed Image Retrieval [59.377821673653436]
Composed Image Retrieval (CIR)は、ユーザの複雑な検索要求を柔軟に表現することができる。
1) 視覚データにおける支配的部分とノイズ的部分の不均一性は無視され、クエリー特徴が劣化する。
本研究は、主部分分割と二重焦点写像という2つのモジュールからなる集中写像に基づく特徴抽出器を提案する。
論文 参考訳(メタデータ) (2025-07-08T03:27:46Z) - Contrastive Learning with Diffusion Features for Weakly Supervised Medical Image Segmentation [12.530950480385554]
条件拡散モデル (CDM) は, セグメンテーションマスク生成の代替手段として用いられている。
拡散特徴量を用いたコントラスト学習(CLDF)を導入し,凍結したCDMからセグメンテーションのための低次元埋め込み空間へ拡散特徴量をマッピングするために画素デコーダを訓練する。
論文 参考訳(メタデータ) (2025-06-30T01:43:50Z) - Prototype-Based Image Prompting for Weakly Supervised Histopathological Image Segmentation [13.640757848445835]
画素レベルのアノテーションのコストが高いため,画像レベルのラベル付き画像セグメント化の弱さが注目されている。
クラスアクティベーションマップ(CAM)を用いた伝統的な手法は、しばしば最も差別的な領域のみをハイライトする。
論文 参考訳(メタデータ) (2025-03-15T09:55:31Z) - SQ-GAN: Semantic Image Communications Using Masked Vector Quantization [54.35918290143049]
本研究はSQ-GAN(Semantically Masked Vector Quantized Generative Adversarial Network)を紹介する。
これは、セマンティック駆動画像符号化とベクトル量子化を統合して、セマンティック/タスク指向通信のための画像圧縮を最適化する新しいアプローチである。
SQ-GANはJPEG2000、BPG、ディープラーニングベースの手法など、最先端の画像圧縮方式よりも優れています。
論文 参考訳(メタデータ) (2025-02-13T17:35:57Z) - MoreStyle: Relax Low-frequency Constraint of Fourier-based Image Reconstruction in Generalizable Medical Image Segmentation [53.24011398381715]
MoreStyleと呼ばれるデータ拡張のためのPlug-and-Playモジュールを紹介します。
MoreStyleは、フーリエ空間の低周波制約を緩和することで、イメージスタイルを多様化する。
敵対的学習の助けを借りて、MoreStyleは潜在機能の中で最も複雑なスタイルの組み合わせを指差している。
論文 参考訳(メタデータ) (2024-03-18T11:38:47Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Optimal transport meets noisy label robust loss and MixUp regularization
for domain adaptation [13.080485957000462]
ソーストレーニングセットでトレーニングされたディープニューラルネットワークは、トレーニングドメインに属さないターゲットイメージに対して不十分に動作します。
これらの性能を改善するための1つの戦略は、最適なトランスポート(OT)を使用して、埋め込み空間におけるソースとターゲットの画像分布を調整することである。
我々は、MixUp正規化のcitepzhang 2018mixupを、ドメイン適応性能を改善するために、ノイズの多いラベルに対して堅牢な損失と組み合わせることを提案する。
論文 参考訳(メタデータ) (2022-06-22T15:40:52Z) - TBNet:Two-Stream Boundary-aware Network for Generic Image Manipulation
Localization [49.521622399483846]
汎用画像操作のローカライゼーションのための新しいエンド・ツー・エンド2ストリーム境界対応ネットワーク(TBNet)を提案する。
提案したTBNetは、MCCとF1の両方の観点から、最先端の汎用画像操作のローカライズ手法を大幅に上回ることができる。
論文 参考訳(メタデータ) (2021-08-10T08:22:05Z) - Graph Neural Networks for UnsupervisedDomain Adaptation of
Histopathological ImageAnalytics [22.04114134677181]
組織像解析のための教師なし領域適応のための新しい手法を提案する。
特徴空間に画像を埋め込むバックボーンと、ラベルで画像の監視信号をプロパゲートするグラフニューラルネットワーク層に基づいている。
実験では、4つの公開データセット上での最先端のパフォーマンスを評価する。
論文 参考訳(メタデータ) (2020-08-21T04:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。