論文の概要: Quality-Driven and Diversity-Aware Sample Expansion for Robust Marine Obstacle Segmentation
- arxiv url: http://arxiv.org/abs/2512.13970v1
- Date: Tue, 16 Dec 2025 00:16:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.525066
- Title: Quality-Driven and Diversity-Aware Sample Expansion for Robust Marine Obstacle Segmentation
- Title(参考訳): ロバストな海洋性障害物セグメンテーションのための品質駆動型および多様性を考慮したサンプル展開
- Authors: Miaohua Zhang, Mohammad Ali Armin, Xuesong Li, Sisi Liang, Lars Petersson, Changming Sun, David Ahmedt-Aristizabal, Zeeshan Hayder,
- Abstract要約: 海上障害物検出は、困難な条件下での堅牢なセグメンテーションを要求する。
マスク条件拡散モデルは、レイアウト整列したサンプルを合成できるが、低エントロピーマスクとプロンプトで条件付けられた場合、低多様性の出力を生成する。
本稿では,学習データを完全に推論時に生成する品質駆動型,多様性を考慮したサンプル拡張パイプラインを提案する。
- 参考スコア(独自算出の注目度): 27.150241776777307
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Marine obstacle detection demands robust segmentation under challenging conditions, such as sun glitter, fog, and rapidly changing wave patterns. These factors degrade image quality, while the scarcity and structural repetition of marine datasets limit the diversity of available training data. Although mask-conditioned diffusion models can synthesize layout-aligned samples, they often produce low-diversity outputs when conditioned on low-entropy masks and prompts, limiting their utility for improving robustness. In this paper, we propose a quality-driven and diversity-aware sample expansion pipeline that generates training data entirely at inference time, without retraining the diffusion model. The framework combines two key components:(i) a class-aware style bank that constructs high-entropy, semantically grounded prompts, and (ii) an adaptive annealing sampler that perturbs early conditioning, while a COD-guided proportional controller regulates this perturbation to boost diversity without compromising layout fidelity. Across marine obstacle benchmarks, augmenting training data with these controlled synthetic samples consistently improves segmentation performance across multiple backbones and increases visual variation in rare and texture-sensitive classes.
- Abstract(参考訳): 海洋障害物検出は、太陽の輝き、霧、急速に変化する波のパターンなどの困難な条件下で、堅牢なセグメンテーションを要求する。
これらの要因は、画像の品質を低下させ、海洋データセットの不足と構造的反復は、利用可能なトレーニングデータの多様性を制限する。
マスク条件拡散モデルは、レイアウト整列されたサンプルを合成することができるが、低エントロピーマスクやプロンプトで条件付けされた場合、しばしば低ダイバーシティ出力を生成し、堅牢性を改善するためにその実用性を制限する。
本稿では,拡散モデルを再学習することなく,推論時に完全にトレーニングデータを生成する品質駆動型,多様性を考慮したサンプル拡張パイプラインを提案する。
このフレームワークには2つの重要なコンポーネントが組み合わさっている。
(i)高エントロピー、意味論的根拠のあるプロンプトを構成するクラス対応型銀行、及び
(II)初期条件を乱す適応型アニーリングサンプリング装置、一方COD誘導比例制御器は、レイアウトの忠実さを損なうことなく多様性を高めるために、この摂動を調節する。
海洋障害物ベンチマーク全体において、これらの制御された合成サンプルによるトレーニングデータの増加は、複数のバックボーン間のセグメンテーション性能を一貫して改善し、稀でテクスチャに敏感なクラスにおける視覚的変化を増大させる。
関連論文リスト
- Training-Free Generation of Diverse and High-Fidelity Images via Prompt Semantic Space Optimization [50.5332987313297]
本稿では,トレーニングフリーでモデルに依存しないモジュールであるToken-Prompt Embedding Space Optimization (TPSO)を提案する。
TPSOは、トークン埋め込み空間の未表現領域を探索するために学習可能なパラメータを導入し、学習された分布の強いモードからサンプルを繰り返し生成する傾向を減少させる。
MS-COCOと3つの拡散バックボーンの実験では、TPSOは画像品質を犠牲にすることなく、生成多様性を著しく向上し、ベースライン性能を1.10から4.18ポイントに改善した。
論文 参考訳(メタデータ) (2025-11-25T00:42:09Z) - Learning Robust Diffusion Models from Imprecise Supervision [75.53546939251146]
DMISは、Imrecise Supervisionから堅牢な条件拡散モデルをトレーニングするための統一されたフレームワークである。
我々のフレームワークは、可能性から派生し、その目的を生成的および分類的構成要素に分解する。
画像生成、弱教師付き学習、データセットの凝縮をカバーし、様々な形の不正確な監視実験を行い、DMISが常に高品質でクラス差別的なサンプルを生成することを示した。
論文 参考訳(メタデータ) (2025-10-03T14:00:32Z) - Learning from Heterogeneity: Generalizing Dynamic Facial Expression Recognition via Distributionally Robust Optimization [23.328511708942045]
Heterogeneity-Aware Distributional Framework (HDF) は、時間周波数モデリングを強化し、ハードサンプルによる不均衡を軽減するために設計された。
時間周波数分散アテンションモジュール(DAM)は、時間的一貫性と周波数ロバスト性の両方をキャプチャする。
適応最適化モジュール 分散対応スケーリングモジュール (DSM) は、動的に分類と対照的な損失のバランスをとるために導入された。
論文 参考訳(メタデータ) (2025-07-21T16:21:47Z) - Generate Aligned Anomaly: Region-Guided Few-Shot Anomaly Image-Mask Pair Synthesis for Industrial Inspection [53.137651284042434]
異常検査は製造業において重要な役割を担っているが、異常サンプルの不足は既存の方法の有効性を制限している。
本稿では,GAA (Generate grained Anomaly) を提案する。
GAAは少数のサンプルのみを用いて現実的で多様で意味的に整合した異常を発生させる。
論文 参考訳(メタデータ) (2025-07-13T12:56:59Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - One-Step Diffusion Model for Image Motion-Deblurring [85.76149042561507]
本稿では,脱臭過程を1段階に短縮する新しいフレームワークである脱臭拡散モデル(OSDD)を提案する。
拡散モデルにおける忠実度損失に対処するために,構造復元を改善する改良された変分オートエンコーダ(eVAE)を導入する。
提案手法は,実測値と非参照値の両方で高い性能を達成する。
論文 参考訳(メタデータ) (2025-03-09T09:39:57Z) - CADS: Unleashing the Diversity of Diffusion Models through Condition-Annealed Sampling [27.795088366122297]
Condition-Annealed Diffusion Sampler (CADS) は任意の事前学習モデルとサンプリングアルゴリズムで使用することができる。
本研究では,様々な条件生成タスクにおける拡散モデルの多様性を向上することを示す。
論文 参考訳(メタデータ) (2023-10-26T12:27:56Z) - Generative Modeling Helps Weak Supervision (and Vice Versa) [87.62271390571837]
本稿では,弱い監督と生成的敵ネットワークを融合したモデルを提案する。
弱い監督によるラベル推定と並行して、データの離散変数をキャプチャする。
これは、弱い教師付き合成画像と擬似ラベルによるデータ拡張を可能にする最初のアプローチである。
論文 参考訳(メタデータ) (2022-03-22T20:24:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。