論文の概要: Uncertainty-Aware ControlNet: Bridging Domain Gaps with Synthetic Image Generation
- arxiv url: http://arxiv.org/abs/2510.11346v1
- Date: Mon, 13 Oct 2025 12:41:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.364823
- Title: Uncertainty-Aware ControlNet: Bridging Domain Gaps with Synthetic Image Generation
- Title(参考訳): 不確実性認識制御ネット:合成画像生成によるブリッジング領域ギャップ
- Authors: Joshua Niemeijer, Jan Ehrhardt, Heinz Handels, Hristina Uzunova,
- Abstract要約: この作業では、ラベルのないドメインからデータを使用して、コントロールネットをトレーニングする手法を導入している。
この不確実性は、ある画像が下流タスクのトレーニング分布の一部ではないことを示している。
ControlNetによって、ターゲットドメインから高い不確実性を持つ注釈付きデータを作成することができます。
- 参考スコア(独自算出の注目度): 0.9509895098323274
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Models are a valuable tool for the controlled creation of high-quality image data. Controlled diffusion models like the ControlNet have allowed the creation of labeled distributions. Such synthetic datasets can augment the original training distribution when discriminative models, like semantic segmentation, are trained. However, this augmentation effect is limited since ControlNets tend to reproduce the original training distribution. This work introduces a method to utilize data from unlabeled domains to train ControlNets by introducing the concept of uncertainty into the control mechanism. The uncertainty indicates that a given image was not part of the training distribution of a downstream task, e.g., segmentation. Thus, two types of control are engaged in the final network: an uncertainty control from an unlabeled dataset and a semantic control from the labeled dataset. The resulting ControlNet allows us to create annotated data with high uncertainty from the target domain, i.e., synthetic data from the unlabeled distribution with labels. In our scenario, we consider retinal OCTs, where typically high-quality Spectralis images are available with given ground truth segmentations, enabling the training of segmentation networks. The recent development in Home-OCT devices, however, yields retinal OCTs with lower quality and a large domain shift, such that out-of-the-pocket segmentation networks cannot be applied for this type of data. Synthesizing annotated images from the Home-OCT domain using the proposed approach closes this gap and leads to significantly improved segmentation results without adding any further supervision. The advantage of uncertainty-guidance becomes obvious when compared to style transfer: it enables arbitrary domain shifts without any strict learning of an image style. This is also demonstrated in a traffic scene experiment.
- Abstract(参考訳): 生成モデル(Generative Models)は、高品質な画像データを作成するための貴重なツールである。
ControlNetのような制御された拡散モデルは、ラベル付きディストリビューションの作成を可能にした。
このような合成データセットは、セマンティックセグメンテーションのような識別モデルがトレーニングされたときに、元のトレーニング分布を増大させることができる。
しかし、ControlNetsはオリジナルのトレーニング分布を再現する傾向があるため、この拡張効果は制限されている。
本研究では、制御機構に不確実性の概念を導入することにより、ラベルのないドメインからのデータを制御ネットのトレーニングに利用する手法を導入する。
この不確実性は、ある画像が下流タスク、例えばセグメンテーションのトレーニング分布の一部ではないことを示している。
これにより、ラベル付きデータセットからの不確実性制御とラベル付きデータセットからのセマンティック制御という、2種類の制御が最終ネットワークに係わる。
ControlNetによって、ターゲットドメインから高い不確実性、すなわちラベルのないディストリビューションからラベル付きで合成されたデータを生成することができる。
我々のシナリオでは、高画質のSpectralis画像が与えられた真実のセグメンテーションで利用でき、セグメンテーションネットワークのトレーニングを可能にする網膜OCTを考察する。
しかし、最近のHome-OCTデバイスの開発により、低品質で大きな領域シフトの網膜OCTが得られ、例えば、オフ・オブ・ザ・ポケットのセグメンテーションネットワークはこの種のデータには適用できない。
提案手法を用いたHome-OCTドメインからの注釈付き画像の合成は、このギャップを埋め、さらなる監視を加えることなく、セグメンテーション結果を大幅に改善する。
画像スタイルの厳密な学習なしに任意のドメインシフトを可能にする。
これは交通現場の実験でも実証されている。
関連論文リスト
- Unsupervised Domain Adaptation for 3D LiDAR Semantic Segmentation Using Contrastive Learning and Multi-Model Pseudo Labeling [0.7373617024876725]
セグメントレベルでの教師なしのコントラスト学習は、バックボーンネットワークを事前訓練するために使用される。
多様な最先端アーキテクチャのアンサンブルを利用して、マルチモデル擬似ラベル戦略を導入する。
Semantic KITTIからラベルのないターゲットデータセットに適応する実験は、セグメンテーション精度を大幅に改善したことを示している。
論文 参考訳(メタデータ) (2025-07-24T08:21:43Z) - SiamSeg: Self-Training with Contrastive Learning for Unsupervised Domain Adaptation Semantic Segmentation in Remote Sensing [13.549403813487022]
教師なしドメイン適応(Unsupervised domain adapt, UDA)は、ラベル付けされたソースドメインデータを活用しながら、ラベル付けされていないターゲットドメインデータからモデルを学習することを可能にする。
対照的な学習を UDA に統合し,対象領域における意味情報を捕捉するモデルの能力を高めることを提案する。
我々の手法であるSimSegは既存の手法より優れ、最先端の結果が得られます。
論文 参考訳(メタデータ) (2024-10-17T11:59:39Z) - Domain-knowledge Inspired Pseudo Supervision (DIPS) for Unsupervised
Image-to-Image Translation Models to Support Cross-Domain Classification [16.4151067682813]
本稿ではDIPS(Domain-knowledge Inspired Pseudo Supervision)と呼ばれる新しい手法を提案する。
DIPSはドメインインフォームド・ガウス混合モデルを使用して疑似アノテーションを生成し、従来の教師付きメトリクスの使用を可能にする。
最適保存チェックポイントモデルを選択する際に、FIDを含む様々なGAN評価指標を上回り、その効果を実証する。
論文 参考訳(メタデータ) (2023-03-18T02:42:18Z) - Semantic Image Synthesis via Diffusion Models [174.24523061460704]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に事実上のGANベースのアプローチに従っている。
意味画像合成のためのDDPMに基づく新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Unsupervised Foggy Scene Understanding via Self Spatial-Temporal Label
Diffusion [51.11295961195151]
運転シーンの霧画像列の特徴を利用して、自信ある擬似ラベルを密度化する。
局所的な空間的類似性と逐次画像データの隣接時間対応の2つの発見に基づいて,新たなターゲット・ドメイン駆動擬似ラベル拡散方式を提案する。
本手法は,2つの天然霧のデータセット上で51.92%,53.84%の平均交叉結合(mIoU)を達成するのに有効である。
論文 参考訳(メタデータ) (2022-06-10T05:16:50Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Semi-weakly Supervised Contrastive Representation Learning for Retinal
Fundus Images [0.2538209532048867]
本稿では,半弱化アノテーションを用いた表現学習のための,半弱化教師付きコントラスト学習フレームワークを提案する。
SWCLの移動学習性能を7つの公立網膜眼底データセットで実証的に検証した。
論文 参考訳(メタデータ) (2021-08-04T15:50:09Z) - Semi-Supervised Domain Adaptation with Prototypical Alignment and
Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。
ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。
具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文 参考訳(メタデータ) (2021-04-19T08:46:08Z) - A Free Lunch for Unsupervised Domain Adaptive Object Detection without
Source Data [69.091485888121]
教師なしドメイン適応(unsupervised domain adaptation) ソースとターゲットのドメインデータは自由に利用でき、通常、ドメイン間のギャップを減らすために一緒に訓練される。
ノイズの多いラベルで学習する問題にモデル化することで,ソースデータのないドメイン適応オブジェクト検出(SFOD)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-10T01:42:35Z) - Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。
画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。
特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文 参考訳(メタデータ) (2020-12-09T12:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。