論文の概要: Contour Refinement using Discrete Diffusion in Low Data Regime
- arxiv url: http://arxiv.org/abs/2602.05880v1
- Date: Thu, 05 Feb 2026 16:55:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-06 18:49:09.063663
- Title: Contour Refinement using Discrete Diffusion in Low Data Regime
- Title(参考訳): 低データレジームにおける離散拡散を用いた輪郭微細化
- Authors: Fei Yu Guan, Ian Keefe, Sophie Wilkinson, Daniel D. B. Perrakis, Steven Waslander,
- Abstract要約: 低データ構造におけるロバストな境界検出のための軽量な離散拡散輪郭改善パイプラインを提案する。
我々は、パイプラインのコアとして自己アテンション層を持つ畳み込みニューラルネットワーク(CNN)アーキテクチャと、スパース輪郭表現を反復的に装飾するセグメンテーションマスクの条件を用いる。
本手法は医用画像データセットKVASIRのSOTAベースラインよりも優れており,HAM10Kや独自の山火事データセットSmokeと競合するが,推論フレームレートは3.5倍向上する。
- 参考スコア(独自算出の注目度): 0.15393457051344298
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Boundary detection of irregular and translucent objects is an important problem with applications in medical imaging, environmental monitoring and manufacturing, where many of these applications are plagued with scarce labeled data and low in situ computational resources. While recent image segmentation studies focus on segmentation mask alignment with ground-truth, the task of boundary detection remains understudied, especially in the low data regime. In this work, we present a lightweight discrete diffusion contour refinement pipeline for robust boundary detection in the low data regime. We use a Convolutional Neural Network(CNN) architecture with self-attention layers as the core of our pipeline, and condition on a segmentation mask, iteratively denoising a sparse contour representation. We introduce multiple novel adaptations for improved low-data efficacy and inference efficiency, including using a simplified diffusion process, a customized model architecture, and minimal post processing to produce a dense, isolated contour given a dataset of size <500 training images. Our method outperforms several SOTA baselines on the medical imaging dataset KVASIR, is competitive on HAM10K and our custom wildfire dataset, Smoke, while improving inference framerate by 3.5X.
- Abstract(参考訳): 不規則かつ半透明な物体の境界検出は、医療画像、環境モニタリング、製造において重要な問題であり、これらの応用の多くはラベル付きデータの不足と計算資源の不足に悩まされている。
近年のイメージセグメンテーション研究は、地中構造とセグメンテーションマスクのアライメントに焦点を当てているが、境界検出の課題は、特に低データ体制において検討されている。
本研究では,低データ状態におけるロバストな境界検出のための軽量な離散拡散輪郭改善パイプラインを提案する。
我々は、パイプラインのコアとして自己アテンション層を持つ畳み込みニューラルネットワーク(CNN)アーキテクチャと、スパース輪郭表現を反復的に装飾するセグメンテーションマスクの条件を用いる。
本稿では, 簡易な拡散プロセス, カスタマイズされたモデルアーキテクチャ, 最小限のポストプロセッシングを用いて, 500個のトレーニング画像のデータセットから, より高密度で孤立した輪郭を生成することを含む, 低データの有効性と推論効率を向上させるための新しい適応手法を提案する。
本手法は医用画像データセットKVASIRのSOTAベースラインよりも優れており,HAM10Kや独自の山火事データセットSmokeと競合するが,推論フレームレートは3.5倍向上する。
関連論文リスト
- CRISP: A Framework for Cryo-EM Image Segmentation and Processing with Conditional Random Field [0.0]
本稿では,Cryo-EMデータから高品質なセグメンテーションマップを自動生成するパイプラインを提案する。
我々のモジュラーフレームワークは、様々なセグメンテーションモデルと損失関数の選択を可能にする。
限られたマイクログラフでトレーニングすると、合成データ上で90%以上の精度、リコール、精度、インターセクション・オーバー・ユニオン(IoU)、F1スコアを達成することができる。
論文 参考訳(メタデータ) (2025-02-12T10:44:45Z) - FCDM: A Physics-Guided Bidirectional Frequency Aware Convolution and Diffusion-Based Model for Sinogram Inpainting [14.043383277622874]
フルビューのシノグラムは高い放射線線量と長いスキャン時間を必要とする。
スパースビューCTは、この負担を軽減するが、構造的な信号損失を伴う不完全なシノグラムを生じる。
本研究では,Ninogram に適した拡散型フレームワークであるmodelnameを提案する。
論文 参考訳(メタデータ) (2024-08-26T12:31:38Z) - Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。
FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。
限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文 参考訳(メタデータ) (2024-03-27T02:24:00Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - ArSDM: Colonoscopy Images Synthesis with Adaptive Refinement Semantic
Diffusion Models [69.9178140563928]
大腸内視鏡検査は臨床診断や治療に不可欠である。
注釈付きデータの不足は、既存の手法の有効性と一般化を制限する。
本稿では, 下流作業に有用な大腸内視鏡画像を生成するために, 適応Refinement Semantic Diffusion Model (ArSDM)を提案する。
論文 参考訳(メタデータ) (2023-09-03T07:55:46Z) - CamoDiffusion: Camouflaged Object Detection via Conditional Diffusion
Models [72.93652777646233]
カモフラーゲ型物体検出(COD)は、カモフラーゲ型物体とその周囲の類似性が高いため、コンピュータビジョンにおいて難しい課題である。
本研究では,CODを拡散モデルを利用した条件付きマスク生成タスクとして扱う新しいパラダイムを提案する。
カモ拡散(CamoDiffusion)と呼ばれる本手法では,拡散モデルのデノナイズプロセスを用いてマスクの雑音を反復的に低減する。
論文 参考訳(メタデータ) (2023-05-29T07:49:44Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [61.62861063776813]
我々は, 正規サンプルの分布を低次元多様体で支持する異常検出において, 特定のユースケースに焦点を当てた。
我々は、訓練中に識別情報を活用する自己指導型学習体制に適応するが、通常の例のサブ多様体に焦点をあてる。
製造領域における視覚異常検出のための挑戦的なベンチマークであるMVTec ADデータセットで、最先端の新たな結果を達成する。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Pre-training via Denoising for Molecular Property Prediction [53.409242538744444]
本稿では,3次元分子構造の大規模データセットを平衡に利用した事前学習手法について述べる。
近年のノイズレギュラー化の進展に触発されて, 事前学習の目的は, 雑音の除去に基づくものである。
論文 参考訳(メタデータ) (2022-05-31T22:28:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。