論文の概要: Semi-Self-Supervised Domain Adaptation: Developing Deep Learning Models with Limited Annotated Data for Wheat Head Segmentation
- arxiv url: http://arxiv.org/abs/2405.07157v1
- Date: Sun, 12 May 2024 04:35:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-14 18:08:19.412845
- Title: Semi-Self-Supervised Domain Adaptation: Developing Deep Learning Models with Limited Annotated Data for Wheat Head Segmentation
- Title(参考訳): 半自己監督型ドメイン適応:小麦頭セグメンテーションのための限定アノテートデータを用いたディープラーニングモデルの開発
- Authors: Alireza Ghanbari, Gholamhassan Shirdel, Farhad Maleki,
- Abstract要約: 本稿では,確率的拡散過程を持つ深層畳み込みニューラルネットワークに基づく半自己制御型ドメイン適応手法を提案する。
合成画像-マスク対と無注釈画像の両方を利用する2分岐畳み込みエンコーダ・デコーダモデルアーキテクチャを開発した。
提案されたモデルは、内部テストデータセットで80.7%のDiceスコア、外部テストセットで64.8%のDiceスコアを達成した。
- 参考スコア(独自算出の注目度): 0.10923877073891444
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precision agriculture involves the application of advanced technologies to improve agricultural productivity, efficiency, and profitability while minimizing waste and environmental impact. Deep learning approaches enable automated decision-making for many visual tasks. However, in the agricultural domain, variability in growth stages and environmental conditions, such as weather and lighting, presents significant challenges to developing deep learning-based techniques that generalize across different conditions. The resource-intensive nature of creating extensive annotated datasets that capture these variabilities further hinders the widespread adoption of these approaches. To tackle these issues, we introduce a semi-self-supervised domain adaptation technique based on deep convolutional neural networks with a probabilistic diffusion process, requiring minimal manual data annotation. Using only three manually annotated images and a selection of video clips from wheat fields, we generated a large-scale computationally annotated dataset of image-mask pairs and a large dataset of unannotated images extracted from video frames. We developed a two-branch convolutional encoder-decoder model architecture that uses both synthesized image-mask pairs and unannotated images, enabling effective adaptation to real images. The proposed model achieved a Dice score of 80.7\% on an internal test dataset and a Dice score of 64.8\% on an external test set, composed of images from five countries and spanning 18 domains, indicating its potential to develop generalizable solutions that could encourage the wider adoption of advanced technologies in agriculture.
- Abstract(参考訳): 精密農業は、廃棄物や環境への影響を最小限に抑えつつ、農業の生産性、効率、利益性を向上させるための先進技術の適用を含む。
ディープラーニングアプローチは、多くの視覚的タスクに対して自動意思決定を可能にする。
しかし、農業領域では、成長段階の変動と天候や照明などの環境条件が、異なる条件をまたいで一般化する深層学習技術を開発する上で大きな課題となっている。
これらの変数をキャプチャする広範なアノテートデータセットを作成するというリソース集約的な性質は、これらのアプローチの広範な採用を妨げる。
これらの課題に対処するために,確率的拡散過程を持つ深層畳み込みニューラルネットワークに基づく半自己教師付きドメイン適応手法を導入し,手動データアノテーションの最小化を求める。
3つの手動アノテート画像とコムギ畑からのビデオクリップの選択を用いて,画像マスク対の大規模アノテートデータセットとビデオフレームから抽出した非アノテート画像の大規模データセットを生成した。
合成画像-マスクペアと無注釈画像の両方を用いた2分岐畳み込みエンコーダ・デコーダモデルアーキテクチャを開発し,実画像への効果的な適応を実現した。
提案したモデルは、内部テストデータセットのDiceスコア80.7\%、外部テストセットのDiceスコア64.8\%を達成し、5つの国からの画像で構成され、18のドメインにまたがる。
関連論文リスト
- Self-supervised Vision Transformer are Scalable Generative Models for Domain Generalization [0.13108652488669734]
病理組織像における領域一般化のための新しい生成法を提案する。
本手法では,画像パッチの特徴を動的に抽出するために,生成型自己教師型視覚変換器を用いる。
2つの異なる病理組織学的データセットを用いて行った実験は,提案手法の有効性を示した。
論文 参考訳(メタデータ) (2024-07-03T08:20:27Z) - Robust Disaster Assessment from Aerial Imagery Using Text-to-Image Synthetic Data [66.49494950674402]
航空画像からの損傷評価のタスクのための大規模合成監視を作成する際に,新たなテキスト・画像生成モデルを活用する。
低リソース領域から何千ものポストディスアスター画像を生成するために、効率的でスケーラブルなパイプラインを構築しています。
我々は,xBDおよびSKAI画像のクロスジオグラフィー領域転送設定におけるフレームワークの強度を,単一ソースとマルチソースの両方で検証する。
論文 参考訳(メタデータ) (2024-05-22T16:07:05Z) - Generating Diverse Agricultural Data for Vision-Based Farming Applications [74.79409721178489]
このモデルは, 植物の成長段階, 土壌条件の多様性, 照明条件の異なるランダム化フィールド配置をシミュレートすることができる。
我々のデータセットにはセマンティックラベル付き12,000の画像が含まれており、精密農業におけるコンピュータビジョンタスクの包括的なリソースを提供する。
論文 参考訳(メタデータ) (2024-03-27T08:42:47Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Pre-training Contextualized World Models with In-the-wild Videos for
Reinforcement Learning [54.67880602409801]
本稿では,視覚制御タスクの学習を効率的に行うために,Wild 動画を多用した事前学習型世界モデルの課題について検討する。
本稿では、コンテキストと動的モデリングを明確に分離したContextualized World Models(ContextWM)を紹介する。
実験により,ContextWMを内蔵したWildビデオ事前学習は,モデルベース強化学習のサンプル効率を大幅に向上できることが示された。
論文 参考訳(メタデータ) (2023-05-29T14:29:12Z) - Extended Agriculture-Vision: An Extension of a Large Aerial Image
Dataset for Agricultural Pattern Analysis [11.133807938044804]
農業ビジョンデータセットの改良版(Chiu et al., 2020b)をリリースする。
このデータセットは,3600大,高解像度(10cm/ピクセル),フルフィールド,赤緑色,近赤外画像の事前トレーニングにより拡張する。
下流分類とセマンティックセグメンテーションの両タスクにおいて、異なるコントラスト学習アプローチをベンチマークすることで、このデータの有用性を実証する。
論文 参考訳(メタデータ) (2023-03-04T17:35:24Z) - Enlisting 3D Crop Models and GANs for More Data Efficient and
Generalizable Fruit Detection [0.0]
本稿では,合成3次元作物モデルドメインから実世界の作物ドメインへの農業画像生成手法を提案する。
本手法は, 果実の位置と形状を保存するために, 意味的に制約されたGAN (generative adversarial network) を用いる。
ブドウ品種検出タスクにおける増分訓練実験により,本手法から生成した画像がドメインプロセスを大幅に高速化できることが判明した。
論文 参考訳(メタデータ) (2021-08-30T16:11:59Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z) - A Robust Illumination-Invariant Camera System for Agricultural
Applications [7.349727826230863]
オブジェクト検出とセマンティックセグメンテーションは、農業アプリケーションで最も広く採用されているディープラーニングアルゴリズムの2つです。
我々は,全ての照明条件下で一貫した画像を生成する,高スループットな能動照明カメラシステムを提案する。
平均して、オブジェクト検出のためのディープネットは、一貫性のあるデータで訓練され、同様の精度を達成するために4倍近いデータを必要としました。
論文 参考訳(メタデータ) (2021-01-06T18:50:53Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。