論文の概要: Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets
- arxiv url: http://arxiv.org/abs/2407.08209v1
- Date: Thu, 11 Jul 2024 06:25:26 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-12 18:48:48.794578
- Title: Enriching Information and Preserving Semantic Consistency in Expanding Curvilinear Object Segmentation Datasets
- Title(参考訳): 曲線オブジェクトセグメンテーションデータセットの拡張における情報強化とセマンティック一貫性の保存
- Authors: Qin Lei, Jiang Zhong, Qizhu Dai,
- Abstract要約: カービ線形オブジェクトセグメンテーションは、様々なアプリケーションにおいて重要な役割を果たすが、この領域のデータセットは、しばしば小さなスケールに悩まされる。
本稿では,カービリニアオブジェクトセグメンテーションデータセットを拡張するための新しいアプローチを提案する。
本手法は,複数のテキスト特徴量からカービリニアオブジェクトを生成することによって,合成データの情報性が向上する。
- 参考スコア(独自算出の注目度): 1.0104586293349587
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Curvilinear object segmentation plays a crucial role across various applications, yet datasets in this domain often suffer from small scale due to the high costs associated with data acquisition and annotation. To address these challenges, this paper introduces a novel approach for expanding curvilinear object segmentation datasets, focusing on enhancing the informativeness of generated data and the consistency between semantic maps and generated images. Our method enriches synthetic data informativeness by generating curvilinear objects through their multiple textual features. By combining textual features from each sample in original dataset, we obtain synthetic images that beyond the original dataset's distribution. This initiative necessitated the creation of the Curvilinear Object Segmentation based on Text Generation (COSTG) dataset. Designed to surpass the limitations of conventional datasets, COSTG incorporates not only standard semantic maps but also some textual descriptions of curvilinear object features. To ensure consistency between synthetic semantic maps and images, we introduce the Semantic Consistency Preserving ControlNet (SCP ControlNet). This involves an adaptation of ControlNet with Spatially-Adaptive Normalization (SPADE), allowing it to preserve semantic information that would typically be washed away in normalization layers. This modification facilitates more accurate semantic image synthesis. Experimental results demonstrate the efficacy of our approach across three types of curvilinear objects (angiography, crack and retina) and six public datasets (CHUAC, XCAD, DCA1, DRIVE, CHASEDB1 and Crack500). The synthetic data generated by our method not only expand the dataset, but also effectively improves the performance of other curvilinear object segmentation models. Source code and dataset are available at \url{https://github.com/tanlei0/COSTG}.
- Abstract(参考訳): キュビリニアオブジェクトセグメンテーションは、様々なアプリケーションにおいて重要な役割を果たすが、この領域のデータセットは、データ取得やアノテーションに関連するコストが高いため、小さなスケールで悩まされることが多い。
これらの課題に対処するため,本論文では,生成したデータの情報性の向上と意味マップと生成した画像との整合性に着目し,カービリニアオブジェクトセグメンテーションデータセットを拡張するための新しいアプローチを提案する。
本手法は,複数のテキスト特徴量からカービリニアオブジェクトを生成することによって,合成データの情報性が向上する。
原データセットの各サンプルのテキスト特徴を組み合わせることで,原データセットの分布を超える合成画像を得る。
このイニシアチブは、テキスト生成(COSTG)データセットに基づいたCurvilinear Object Segmentationの作成を必要とした。
COSTGは従来のデータセットの制限を超えるように設計されており、標準的なセマンティックマップだけでなく、カービ線形オブジェクトの特徴のテキスト記述も含んでいる。
合成意味マップと画像の整合性を確保するために,セマンティック一貫性保存制御ネット(SCP ControlNet)を導入する。
ControlNetをSPADE(Spatially-Adaptive Normalization)に適応させることで、通常、正規化層に洗い流されるセマンティック情報を保存できる。
この修正により、より正確なセマンティック画像合成が容易になる。
実験の結果,3種類の曲線オブジェクト(血管造影,クラック,網膜)と6つの公開データセット(CHUAC,XCAD,DCA1,DRIVE,CHASEDB1,Crack500)に対するアプローチの有効性が示された。
提案手法により生成された合成データは,データセットを拡大するだけでなく,他の曲線オブジェクトセグメンテーションモデルの性能も効果的に向上する。
ソースコードとデータセットは \url{https://github.com/tanlei0/COSTG} で入手できる。
関連論文リスト
- Towards Natural Image Matting in the Wild via Real-Scenario Prior [69.96414467916863]
我々は,COCOデータセット,すなわちCOCO-Mattingに基づく新しいマッチングデータセットを提案する。
構築されたCOCO-Mattingは、複雑な自然シナリオにおける38,251人のインスタンスレベルのアルファマットの広範なコレクションを含む。
ネットワークアーキテクチャにおいて、提案する特徴整合変換器は、きめ細かいエッジと透過性を抽出することを学ぶ。
提案したマットアライメントデコーダは、マット固有のオブジェクトを分割し、粗いマスクを高精度なマットに変換することを目的としている。
論文 参考訳(メタデータ) (2024-10-09T06:43:19Z) - Entropic Optimal Transport Eigenmaps for Nonlinear Alignment and Joint Embedding of High-Dimensional Datasets [11.105392318582677]
本稿では,理論的保証付きデータセットの整列と共同埋め込みの原理的アプローチを提案する。
提案手法は,2つのデータセット間のEOT計画行列の先頭特異ベクトルを利用して,それらの共通基盤構造を抽出する。
EOT計画では,高次元状態において,潜伏変数の位置で評価されたカーネル関数を近似することにより,共有多様体構造を復元する。
論文 参考訳(メタデータ) (2024-07-01T18:48:55Z) - Hierarchical Features Matter: A Deep Exploration of GAN Priors for Improved Dataset Distillation [51.44054828384487]
階層的生成潜在蒸留(H-GLaD)と呼ばれる新しいパラメータ化法を提案する。
本手法はGAN内の階層層を系統的に探索する。
さらに,合成データセット評価に伴う計算負担を軽減するために,新しいクラス関連特徴距離尺度を導入する。
論文 参考訳(メタデータ) (2024-06-09T09:15:54Z) - Modified CycleGAN for the synthesization of samples for wheat head
segmentation [0.09999629695552192]
注釈付きデータセットがない場合は、モデル開発に合成データを使用することができる。
そこで我々は,小麦頭部分割のための現実的な注釈付き合成データセットを開発した。
その結果、Diceのスコアは内部データセットで83.4%、外部のGlobal Wheat Head Detectionデータセットで83.6%に達した。
論文 参考訳(メタデータ) (2024-02-23T06:42:58Z) - DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion
Models [61.906934570771256]
多様な合成画像や知覚アノテーションを生成できる汎用データセット生成モデルを提案する。
本手法は,事前学習した拡散モデルに基づいて,テキスト誘導画像合成を知覚データ生成に拡張する。
拡散モデルのリッチ潜時コードはデコーダモジュールを用いて正確な認識アノテーションとして効果的に復号できることを示す。
論文 参考訳(メタデータ) (2023-08-11T14:38:11Z) - FreeCOS: Self-Supervised Learning from Fractals and Unlabeled Images for
Curvilinear Object Segmentation [7.078356641689271]
本稿では, フラクタルや未ラベル画像から頑健で独特な特徴を学習する自己教師型カービリニアオブジェクトセグメンテーション法を提案する。
主な貢献は、新しいフラクタル-FDA合成(FFS)モジュールと幾何情報アライメント(GIA)アプローチである。
GIAは、与えられたピクセルの強度次数と近隣のピクセルの値を比較することで、合成画像とラベルなし画像の強度差を低減する。
論文 参考訳(メタデータ) (2023-07-14T09:38:08Z) - GIPSO: Geometrically Informed Propagation for Online Adaptation in 3D
LiDAR Segmentation [60.07812405063708]
3Dポイントクラウドセマンティックセグメンテーションは、自動運転に基本である。
文学におけるほとんどのアプローチは、動的シーンを扱う際に、ドメインシフトをどのように扱うかという重要な側面を無視している。
本稿では,本研究分野における最先端技術について述べる。
論文 参考訳(メタデータ) (2022-07-20T09:06:07Z) - BGT-Net: Bidirectional GRU Transformer Network for Scene Graph
Generation [0.15469452301122172]
シーングラフ生成(SGG)は、オブジェクトとその関係を識別することを目的としている。
画像のシーングラフ生成のための双方向GRU(BiGRU)トランスフォーマーネットワーク(BGT-Net)を提案する。
このモデルは、BiGRU層を用いたオブジェクト情報を強化するために、新しいオブジェクトオブジェクト通信を実装している。
論文 参考訳(メタデータ) (2021-09-11T19:14:40Z) - SynLiDAR: Learning From Synthetic LiDAR Sequential Point Cloud for
Semantic Segmentation [37.00112978096702]
SynLiDARは、正確な幾何学的形状と包括的なセマンティッククラスを備えた合成LiDARポイントクラウドデータセットである。
PCT-Netは、現実世界のポイントクラウドデータとのギャップを狭めることを目的としたポイントクラウド翻訳ネットワークである。
複数のデータ拡張および半教師付きセマンティックセグメンテーションタスクに対する実験は、非常に肯定的な結果を示す。
論文 参考訳(メタデータ) (2021-07-12T12:51:08Z) - Polygonal Point Set Tracking [50.445151155209246]
本稿では,学習に基づく多角形点集合追跡手法を提案する。
私たちのゴールは、ターゲットの輪郭上の対応する点を追跡することです。
本稿では,部分歪みとテキストマッピングに対する本手法の視覚効果について述べる。
論文 参考訳(メタデータ) (2021-05-30T17:12:36Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。