論文の概要: Efficient and robust 3D blind harmonization for large domain gaps
- arxiv url: http://arxiv.org/abs/2505.00133v1
- Date: Wed, 30 Apr 2025 19:00:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:55.157145
- Title: Efficient and robust 3D blind harmonization for large domain gaps
- Title(参考訳): 大きな領域ギャップに対する高能率かつ頑健な3次元ブラインドハーモニゼーション
- Authors: Hwihun Jeong, Hayeon Lee, Se Young Chun, Jongho Lee,
- Abstract要約: 視覚障害者のための新しい3D調和フレームワークであるBlindHarmonyDiffを紹介する。
本フレームワークでは,対象の領域画像に基づいてトレーニングした3次元補正フローを用いて,エッジマップから元のイメージを再構成し,ソース領域画像のエッジから調和した画像を生成する。
- 参考スコア(独自算出の注目度): 16.11365154990601
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Blind harmonization has emerged as a promising technique for MR image harmonization to achieve scale-invariant representations, requiring only target domain data (i.e., no source domain data necessary). However, existing methods face limitations such as inter-slice heterogeneity in 3D, moderate image quality, and limited performance for a large domain gap. To address these challenges, we introduce BlindHarmonyDiff, a novel blind 3D harmonization framework that leverages an edge-to-image model tailored specifically to harmonization. Our framework employs a 3D rectified flow trained on target domain images to reconstruct the original image from an edge map, then yielding a harmonized image from the edge of a source domain image. We propose multi-stride patch training for efficient 3D training and a refinement module for robust inference by suppressing hallucination. Extensive experiments demonstrate that BlindHarmonyDiff outperforms prior arts by harmonizing diverse source domain images to the target domain, achieving higher correspondence to the target domain characteristics. Downstream task-based quality assessments such as tissue segmentation and age prediction on diverse MR scanners further confirm the effectiveness of our approach and demonstrate the capability of our robust and generalizable blind harmonization.
- Abstract(参考訳): ブラインド調和は、スケール不変表現を実現するためのMR画像調和のための有望な手法として出現し、ターゲットドメインデータのみを必要とする(すなわち、ソースドメインデータを必要としない)。
しかし、既存の手法では、3次元におけるスライス間不均一性、中程度の画質、大きな領域ギャップに対する限られた性能といった制限に直面している。
BlindHarmonyDiff(ブラインド・ハーモニー・ディフ)は、ハーモニゼーションに特化したエッジ・ツー・イメージ・モデルを活用する新しい3Dハーモニゼーション・フレームワークである。
本フレームワークでは,対象の領域画像に基づいてトレーニングした3次元補正フローを用いて,エッジマップから元のイメージを再構成し,ソース領域画像のエッジから調和した画像を生成する。
本稿では,効率的な3次元トレーニングのためのマルチストライドパッチトレーニングと,幻覚の抑制による頑健な推論のための改良モジュールを提案する。
BlindHarmonyDiffは、様々なソースドメインイメージをターゲットドメインに調和させ、ターゲットドメイン特性に高い対応性を持たせることで、先行技術より優れていることを示す。
様々なMRスキャナーにおける組織分節や年齢予測などの下流タスクベースの品質評価は、我々のアプローチの有効性をさらに確認し、我々の堅牢で一般化可能なブラインドハーモニゼーションの有効性を実証する。
関連論文リスト
- GCA-3D: Towards Generalized and Consistent Domain Adaptation of 3D Generators [24.67369444661137]
GCA-3Dはデータ生成の複雑なパイプラインを使わずに汎用的で一貫した3Dドメイン適応法である。
我々は,非逆方向の3次元生成モデルに効率よく適応するために,多モード深度対応型スコア蒸留サンプリング損失を導入する。
実験により, GCA-3Dは, 効率, 一般化, 精度, アイデンティティの整合性の観点から, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-12-20T02:13:11Z) - Visual Foundation Models Boost Cross-Modal Unsupervised Domain Adaptation for 3D Semantic Segmentation [17.875516787157018]
本研究では,2次元視覚基礎モデルから得られた知識を活用して,ラベルのない対象ドメインのより正確なラベルを生成する方法について検討する。
本手法は, 各種自律走行データセットを用いて評価し, 3次元セグメンテーションタスクにおいて有意な改善が得られた。
論文 参考訳(メタデータ) (2024-03-15T03:58:17Z) - CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D
Object Detection [14.063365469339812]
LiDARベースの3Dオブジェクト検出法は、ソース(またはトレーニング)データ配布の外部のターゲットドメインにうまく一般化しないことが多い。
画像のモダリティから視覚的セマンティックキューを活用する,CMDA (unsupervised domain adaptation) と呼ばれる新しい手法を提案する。
また、自己学習に基づく学習戦略を導入し、モデルが逆向きに訓練され、ドメイン不変の機能を生成する。
論文 参考訳(メタデータ) (2024-03-06T14:12:38Z) - Unified Frequency-Assisted Transformer Framework for Detecting and
Grounding Multi-Modal Manipulation [109.1912721224697]
本稿では、DGM4問題に対処するため、UFAFormerという名前のUnified Frequency-Assisted TransFormerフレームワークを提案する。
離散ウェーブレット変換を利用して、画像を複数の周波数サブバンドに分解し、リッチな顔偽造品をキャプチャする。
提案する周波数エンコーダは、帯域内およびバンド間自己アテンションを組み込んだもので、多種多様なサブバンド内および多種多様なフォージェリー特徴を明示的に集約する。
論文 参考訳(メタデータ) (2023-09-18T11:06:42Z) - IT3D: Improved Text-to-3D Generation with Explicit View Synthesis [71.68595192524843]
本研究では、これらの問題に対処するために、明示的に合成されたマルチビュー画像を活用する新しい戦略を提案する。
我々のアプローチは、高画質画像を生成するために、LCDによって強化されたイメージ・ツー・イメージ・パイプラインを活用することである。
組込み判別器では、合成したマルチビュー画像は実データと見なされ、最適化された3Dモデルのレンダリングは偽データとして機能する。
論文 参考訳(メタデータ) (2023-08-22T14:39:17Z) - BlindHarmony: "Blind" Harmonization for MR Images via Flow model [1.765282368080009]
MRIでは、同一の被験者と同一のコントラストの画像は、異なるハードウェア、シーケンス、スキャンパラメータを使用して取得した場合、顕著な違いを示す。
これらの違いは、画像の調和によってブリッジされる必要があるドメインギャップを生み出します。
画像調和を実現するための深層学習に基づくアプローチが提案されている。
BlindHarmonyは、ターゲットドメインデータのみをトレーニングに使用するが、未確認領域からのイメージを調和させる機能を持つ。
論文 参考訳(メタデータ) (2023-05-18T06:04:24Z) - Domain Generalisation via Domain Adaptation: An Adversarial Fourier
Amplitude Approach [13.642506915023871]
最悪の対象ドメインを逆向きに合成し、その最悪の対象ドメインにモデルを適用する。
DomainBedNetデータセットでは、提案手法により、ドメインの一般化性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-23T14:19:07Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training [57.25828870799331]
我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
論文 参考訳(メタデータ) (2022-04-25T12:23:07Z) - Unsupervised Domain Adaptation with Contrastive Learning for OCT
Segmentation [49.59567529191423]
本稿では,新しい未ラベル領域からのボリューム画像のセグメンテーションのための,新しい半教師付き学習フレームワークを提案する。
教師付き学習とコントラスト学習を併用し、3次元の近傍スライス間の類似性を利用したコントラストペア方式を導入する。
論文 参考訳(メタデータ) (2022-03-07T19:02:26Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。