論文の概要: Modified CycleGAN for the synthesization of samples for wheat head
segmentation
- arxiv url: http://arxiv.org/abs/2402.15135v1
- Date: Fri, 23 Feb 2024 06:42:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-26 15:30:54.161051
- Title: Modified CycleGAN for the synthesization of samples for wheat head
segmentation
- Title(参考訳): コムギ頭部分節用試料の合成のための改良サイクルGAN
- Authors: Jaden Myers, Keyhan Najafian, Farhad Maleki, and Katie Ovens
- Abstract要約: 注釈付きデータセットがない場合は、モデル開発に合成データを使用することができる。
そこで我々は,小麦頭部分割のための現実的な注釈付き合成データセットを開発した。
その結果、Diceのスコアは内部データセットで83.4%、外部のGlobal Wheat Head Detectionデータセットで83.6%に達した。
- 参考スコア(独自算出の注目度): 0.09999629695552192
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning models have been used for a variety of image processing tasks.
However, most of these models are developed through supervised learning
approaches, which rely heavily on the availability of large-scale annotated
datasets. Developing such datasets is tedious and expensive. In the absence of
an annotated dataset, synthetic data can be used for model development;
however, due to the substantial differences between simulated and real data, a
phenomenon referred to as domain gap, the resulting models often underperform
when applied to real data. In this research, we aim to address this challenge
by first computationally simulating a large-scale annotated dataset and then
using a generative adversarial network (GAN) to fill the gap between simulated
and real images. This approach results in a synthetic dataset that can be
effectively utilized to train a deep-learning model. Using this approach, we
developed a realistic annotated synthetic dataset for wheat head segmentation.
This dataset was then used to develop a deep-learning model for semantic
segmentation. The resulting model achieved a Dice score of 83.4\% on an
internal dataset and Dice scores of 79.6% and 83.6% on two external Global
Wheat Head Detection datasets. While we proposed this approach in the context
of wheat head segmentation, it can be generalized to other crop types or, more
broadly, to images with dense, repeated patterns such as those found in
cellular imagery.
- Abstract(参考訳): ディープラーニングモデルは、さまざまな画像処理タスクに使用されている。
しかし、これらのモデルのほとんどは、大規模アノテートデータセットの可用性に大きく依存する教師付き学習アプローチによって開発されている。
このようなデータセットの開発は面倒で費用がかかる。
注釈付きデータセットが存在しない場合、合成データはモデル開発に使用できるが、シミュレーションデータと実データの間に大きな違いがあるため、ドメインギャップと呼ばれる現象があり、実際のデータに適用すると結果のモデルの性能が低下することが多い。
本研究では,まず大規模アノテートデータセットを計算的にシミュレートし,次にGANを用いてシミュレーション画像と実画像のギャップを埋めることにより,この問題に対処することを目的とする。
このアプローチは、ディープラーニングモデルのトレーニングに効果的に使用できる合成データセットを生成する。
この手法を用いて,小麦頭部セグメンテーションのためのリアルな注釈合成データセットを開発した。
このデータセットは、セマンティックセグメンテーションのためのディープラーニングモデルの開発に使用された。
その結果、内部データセットで83.4\%、外部の小麦ヘッド検出データセットで79.6%、83.6%のサイススコアが得られた。
本手法はコムギの頭部分画の文脈において提案されているが、他の作物種や、より広範に、細胞画像に見られるような高密度かつ反復的なパターンの画像に一般化することができる。
関連論文リスト
- Diffusion Models as Data Mining Tools [87.77999285241219]
本稿では、画像合成のために訓練された生成モデルを視覚データマイニングのツールとして利用する方法について述べる。
特定のデータセットから画像を合成するために条件拡散モデルを微調整した後、これらのモデルを用いて典型性尺度を定義することができることを示す。
この尺度は、地理的位置、タイムスタンプ、セマンティックラベル、さらには病気の存在など、異なるデータラベルに対する典型的な視覚的要素がどのように存在するかを評価する。
論文 参考訳(メタデータ) (2024-07-20T17:14:31Z) - Generative Expansion of Small Datasets: An Expansive Graph Approach [13.053285552524052]
最小限のサンプルから大規模で情報豊富なデータセットを生成する拡張合成モデルを提案する。
自己アテンション層と最適なトランスポートを持つオートエンコーダは、分散一貫性を洗練させる。
結果は同等のパフォーマンスを示し、モデルがトレーニングデータを効果的に増強する可能性を示している。
論文 参考訳(メタデータ) (2024-06-25T02:59:02Z) - Domain-Transferred Synthetic Data Generation for Improving Monocular Depth Estimation [9.812476193015488]
本稿では,3次元合成環境とCycleGANドメイン転送を用いたシミュレーションデータ生成手法を提案する。
本研究では,DenseDepth構造に基づく深度推定モデルを実データと模擬データの異なるトレーニングセットを用いて学習することにより,このデータ生成手法を,人気のNYUDepth V2データセットと比較する。
本稿では,Huskyロボットによる新たに収集した画像とLiDAR深度データを用いたモデルの性能評価を行い,GAN変換データを実世界のデータ,特に深度推定の有効な代替手段として有効であることを示す。
論文 参考訳(メタデータ) (2024-05-02T09:21:10Z) - Towards Theoretical Understandings of Self-Consuming Generative Models [56.84592466204185]
本稿では,自己消費ループ内で生成モデルを訓練する新たな課題に取り組む。
我々は,このトレーニングが将来のモデルで学習したデータ分布に与える影響を厳格に評価するための理論的枠組みを構築した。
カーネル密度推定の結果は,混合データトレーニングがエラー伝播に与える影響など,微妙な洞察を与える。
論文 参考訳(メタデータ) (2024-02-19T02:08:09Z) - Learning Defect Prediction from Unrealistic Data [57.53586547895278]
事前訓練されたコードのモデルは、コード理解と生成タスクに人気がある。
このようなモデルは大きい傾向があり、訓練データの総量を必要とする。
人工的に注入されたバグのある関数など、はるかに大きくてもより現実的なデータセットを持つモデルをトレーニングすることが一般的になった。
このようなデータで訓練されたモデルは、実際のプログラムでは性能が劣りながら、同様のデータでのみうまく機能する傾向にある。
論文 参考訳(メタデータ) (2023-11-02T01:51:43Z) - DatasetDM: Synthesizing Data with Perception Annotations Using Diffusion
Models [61.906934570771256]
多様な合成画像や知覚アノテーションを生成できる汎用データセット生成モデルを提案する。
本手法は,事前学習した拡散モデルに基づいて,テキスト誘導画像合成を知覚データ生成に拡張する。
拡散モデルのリッチ潜時コードはデコーダモジュールを用いて正確な認識アノテーションとして効果的に復号できることを示す。
論文 参考訳(メタデータ) (2023-08-11T14:38:11Z) - RADiff: Controllable Diffusion Models for Radio Astronomical Maps
Generation [6.128112213696457]
RADiffは、注釈付き無線データセット上でトレーニングされた条件拡散モデルに基づく生成的アプローチである。
完全合成画像アノテーションペアを生成して,任意のアノテートデータセットを自動的に拡張できることを示す。
論文 参考訳(メタデータ) (2023-07-05T16:04:44Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - The Big Data Myth: Using Diffusion Models for Dataset Generation to
Train Deep Detection Models [0.15469452301122172]
本研究では, 微調整型安定拡散モデルによる合成データセット生成のための枠組みを提案する。
本研究の結果から, 合成データを用いた物体検出モデルは, ベースラインモデルと同じような性能を示すことが明らかとなった。
論文 参考訳(メタデータ) (2023-06-16T10:48:52Z) - Data from Model: Extracting Data from Non-robust and Robust Models [83.60161052867534]
この研究は、データとモデルの関係を明らかにするために、モデルからデータを生成する逆プロセスについて検討する。
本稿では,データ・トゥ・モデル(DtM)とデータ・トゥ・モデル(DfM)を連続的に処理し,特徴マッピング情報の喪失について検討する。
以上の結果から,DtMとDfMの複数シーケンスの後にも,特にロバストモデルにおいて精度低下が制限されることが示唆された。
論文 参考訳(メタデータ) (2020-07-13T05:27:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。