論文の概要: Multi-Spectral Image Synthesis for Crop/Weed Segmentation in Precision
Farming
- arxiv url: http://arxiv.org/abs/2009.05750v2
- Date: Mon, 6 Sep 2021 12:33:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 08:25:28.915960
- Title: Multi-Spectral Image Synthesis for Crop/Weed Segmentation in Precision
Farming
- Title(参考訳): 精密農業における作物・雑草セグメンテーションのためのマルチスペクトル画像合成
- Authors: Mulham Fawakherji, Ciro Potena, Alberto Pretto, Domenico D. Bloisi,
Daniele Nardi
- Abstract要約: 本稿では, 精密農業における作物・雑草の分枝化問題に適用し, 共通データ増分法に関する代替手法を提案する。
我々は、最も関連性の高いオブジェクトクラス(作物や雑草)を合成されたクラスに置き換えることで、半人工的なサンプルを作成する。
RGBデータに加えて、近赤外(NIR)情報も考慮し、4つのチャネルマルチスペクトル合成画像を生成する。
- 参考スコア(独自算出の注目度): 3.4788711710826083
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: An effective perception system is a fundamental component for farming robots,
as it enables them to properly perceive the surrounding environment and to
carry out targeted operations. The most recent methods make use of
state-of-the-art machine learning techniques to learn a valid model for the
target task. However, those techniques need a large amount of labeled data for
training. A recent approach to deal with this issue is data augmentation
through Generative Adversarial Networks (GANs), where entire synthetic scenes
are added to the training data, thus enlarging and diversifying their
informative content. In this work, we propose an alternative solution with
respect to the common data augmentation methods, applying it to the fundamental
problem of crop/weed segmentation in precision farming. Starting from real
images, we create semi-artificial samples by replacing the most relevant object
classes (i.e., crop and weeds) with their synthesized counterparts. To do that,
we employ a conditional GAN (cGAN), where the generative model is trained by
conditioning the shape of the generated object. Moreover, in addition to RGB
data, we take into account also near-infrared (NIR) information, generating
four channel multi-spectral synthetic images. Quantitative experiments, carried
out on three publicly available datasets, show that (i) our model is capable of
generating realistic multi-spectral images of plants and (ii) the usage of such
synthetic images in the training process improves the segmentation performance
of state-of-the-art semantic segmentation convolutional networks.
- Abstract(参考訳): 効果的な認識システムは農業ロボットにとって基本的な要素であり、周囲の環境を適切に認識し、目標とする操作を行うことができる。
最新の手法では、最先端の機械学習技術を使用して、ターゲットタスクの有効なモデルを学ぶ。
しかし、これらのテクニックはトレーニングに大量のラベル付きデータを必要とする。
この問題に対処する最近のアプローチは、GAN(Generative Adversarial Networks)によるデータ拡張であり、トレーニングデータに全合成シーンを追加して、情報内容の拡大と多様化を行う。
本研究では, 精密農業における作物・雑草の分節化の根本的問題に適用し, 共通データ増分法に対する代替手法を提案する。
実画像から始めると、最も関連性の高いオブジェクトクラス(作物や雑草)を合成したクラスに置き換えることで、半人工的なサンプルを作成する。
そこで我々は、生成したオブジェクトの形状を条件付けして生成モデルを訓練する条件付きGAN(cGAN)を用いる。
さらに、RGBデータに加えて、近赤外(NIR)情報も考慮し、4つのチャネル多重スペクトル合成画像を生成する。
公開されている3つのデータセットで 定量的な実験が行われました
(i)我々のモデルは、植物の実写多スペクトル画像を生成することができる。
(ii)学習過程における合成画像の使用は、最先端意味セマンティクスセグメンテーション畳み込みネットワークのセグメンテーション性能を向上させる。
関連論文リスト
- Analysis of Classifier Training on Synthetic Data for Cross-Domain Datasets [4.696575161583618]
本研究は、高度な運転支援システムと自律運転のためのカメラベースの交通標識認識アプリケーションに焦点を当てた。
合成データセットの増補パイプラインは、構造化影やガウスの特異なハイライトのような新しい増補プロセスを含む。
実験の結果、クロスドメインテストデータセットに適用した場合、ほとんどの場合、合成画像ベースアプローチは実際の画像ベーストレーニングよりも優れていた。
論文 参考訳(メタデータ) (2024-10-30T07:11:41Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - A survey of synthetic data augmentation methods in computer vision [0.0]
本稿では,合成データ拡張技術について概観する。
我々は、重要なデータ生成と拡張技術、アプリケーション全般の範囲、および特定のユースケースに焦点を当てる。
コンピュータビジョンモデルをトレーニングするための一般的な合成データセットの要約を提供する。
論文 参考訳(メタデータ) (2024-03-15T07:34:08Z) - Improving the Effectiveness of Deep Generative Data [5.856292656853396]
下流の画像処理タスクのための純粋合成画像のモデルを訓練すると、実際のデータに対するトレーニングに比べ、望ましくない性能低下が生じる。
本稿では,この現象に寄与する要因を記述した新しい分類法を提案し,CIFAR-10データセットを用いて検討する。
本手法は,合成データと合成データの混合による学習と合成データのみの学習において,下流分類タスクのベースラインに優れる。
論文 参考訳(メタデータ) (2023-11-07T12:57:58Z) - Generalizing Surgical Instruments Segmentation to Unseen Domains with
One-to-Many Synthesis [18.830738606514736]
ディープラーニングの手法は、実世界の外科的応用への展開を妨げることが多い。
データ収集、アノテーション、ドメインシフトは、最も一般的な障害である。
我々は、最小限のソースイメージを効率よく活用して、合成外科用機器セグメンテーションデータセットを生成することにより、データ関連の問題を緩和する。
論文 参考訳(メタデータ) (2023-06-28T15:06:44Z) - Generalizing Dataset Distillation via Deep Generative Prior [75.9031209877651]
本稿では,データセット全体の知識をいくつかの合成画像に抽出することを提案する。
このアイデアは、学習アルゴリズムにトレーニングデータとして与えられる少数の合成データポイントを合成し、結果として元のデータに基づいてトレーニングされたデータを近似するモデルを構築する。
生成モデルの潜在空間における複数の中間特徴ベクトルに多数の画像を蒸留する新しい最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-02T17:59:31Z) - Inside Out: Transforming Images of Lab-Grown Plants for Machine Learning
Applications in Agriculture [0.0]
我々は,室内の植物像をフィールド画像として解釈するために,コントラッシブ・アンペア変換 (CUT) 生成敵ネットワーク (GAN) を用いる。
我々は,1つの植物のみを含むイメージを翻訳するようにネットワークを訓練する一方で,複数の植物野画像を生成するために容易に拡張可能であることを示す。
また, 人工マルチプラント画像を用いて, いくつかのYoloV5ナノオブジェクト検出モデルを訓練し, 植物検出を行う。
論文 参考訳(メタデータ) (2022-11-05T20:51:45Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。