論文の概要: D4: Text-guided diffusion model-based domain adaptive data augmentation for vineyard shoot detection
- arxiv url: http://arxiv.org/abs/2409.04060v1
- Date: Fri, 6 Sep 2024 07:04:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-09 16:36:07.811692
- Title: D4: Text-guided diffusion model-based domain adaptive data augmentation for vineyard shoot detection
- Title(参考訳): D4: テキスト誘導拡散モデルに基づくブドウ園撮影検出のためのドメイン適応データ拡張(D4.情報ネットワーク,一般セッション)
- Authors: Kentaro Hirahara, Chikahito Nakane, Hajime Ebisawa, Tsuyoshi Kuroda, Yohei Iwaki, Tomoyoshi Utsumi, Yuichiro Nomura, Makoto Koike, Hiroshi Mineno,
- Abstract要約: 本研究では,ブドウ園の撮影検出のための生成データ拡張法(D4)を提案する。
D4は、無人地上車両や他の手段によって収集されたビデオデータから得られた多数のオリジナル画像と、少量の注釈付きデータセットに基づいて、事前訓練されたテキスト誘導拡散モデルを使用する。
本手法により,BBox検出タスクの平均平均精度が28.65%向上し,Vineyard shoot検出のキーポイント検出タスクの平均精度が13.73%向上したことを確認した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an agricultural field, plant phenotyping using object detection models is gaining attention. However, collecting the training data necessary to create generic and high-precision models is extremely challenging due to the difficulty of annotation and the diversity of domains. Furthermore, it is difficult to transfer training data across different crops, and although machine learning models effective for specific environments, conditions, or crops have been developed, they cannot be widely applied in actual fields. In this study, we propose a generative data augmentation method (D4) for vineyard shoot detection. D4 uses a pre-trained text-guided diffusion model based on a large number of original images culled from video data collected by unmanned ground vehicles or other means, and a small number of annotated datasets. The proposed method generates new annotated images with background information adapted to the target domain while retaining annotation information necessary for object detection. In addition, D4 overcomes the lack of training data in agriculture, including the difficulty of annotation and diversity of domains. We confirmed that this generative data augmentation method improved the mean average precision by up to 28.65% for the BBox detection task and the average precision by up to 13.73% for the keypoint detection task for vineyard shoot detection. Our generative data augmentation method D4 is expected to simultaneously solve the cost and domain diversity issues of training data generation in agriculture and improve the generalization performance of detection models.
- Abstract(参考訳): 農業分野では, 対象検出モデルを用いた植物表現型化が注目されている。
しかし、アノテーションの難しさやドメインの多様性のため、汎用的かつ高精度なモデルを作成するのに必要なトレーニングデータを集めることは極めて困難である。
さらに、異なる作物間でトレーニングデータを転送することは困難であり、特定の環境、条件、作物に有効な機械学習モデルが開発されているが、実際の分野において広く適用することはできない。
本研究では,ブドウ園の撮影検出のための生成データ拡張法(D4)を提案する。
D4は、無人地上車両や他の手段によって収集されたビデオデータから得られた多数のオリジナル画像と、少量の注釈付きデータセットに基づいて、事前訓練されたテキスト誘導拡散モデルを使用する。
提案手法は,オブジェクト検出に必要なアノテーション情報を保持しつつ,対象領域に適合する背景情報を含む新たな注釈付き画像を生成する。
さらにD4は、アノテーションの難しさやドメインの多様性など、農業におけるトレーニングデータの欠如を克服している。
本手法により,BBox検出タスクの平均平均精度が28.65%向上し,Vineyard shoot検出のキーポイント検出タスクの平均精度が13.73%向上したことを確認した。
本手法は,農業におけるトレーニングデータ生成のコストと領域の多様性を同時に解決し,検出モデルの一般化性能を向上させることを目的としている。
関連論文リスト
- From Web Data to Real Fields: Low-Cost Unsupervised Domain Adaptation for Agricultural Robots [3.7619101673213664]
本稿では,Unsupervised Domain Adaptation (UDA) を用いて,特定分野への適応を低コストで行うことを目的とする。
我々は、多様なインターネットソースデータのプールから、特定の場所でロボットが収集した小さなデータセットへの、新たなドメインシフトを探求する。
我々は,マルチレベル注意に基づく適応識別器(MAAD)という新しいモジュールを導入し,任意の検出モデルの特徴抽出器レベルで統合する。
論文 参考訳(メタデータ) (2024-10-31T13:11:09Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Investigating the Impact of Semi-Supervised Methods with Data Augmentation on Offensive Language Detection in Romanian Language [2.2823100315094624]
攻撃的な言語検出は、今日のデジタルランドスケープにおいて重要なタスクです。
堅牢な攻撃的言語検出モデルを構築するには、大量のラベル付きデータが必要である。
半教師付き学習はラベル付きおよびラベルなしのデータを活用することで実現可能なソリューションを提供する。
論文 参考訳(メタデータ) (2024-07-29T15:02:51Z) - Semi-Self-Supervised Domain Adaptation: Developing Deep Learning Models with Limited Annotated Data for Wheat Head Segmentation [0.10923877073891444]
本稿では,確率的拡散過程を持つ深層畳み込みニューラルネットワークに基づく半自己制御型ドメイン適応手法を提案する。
合成画像-マスク対と無注釈画像の両方を利用する2分岐畳み込みエンコーダ・デコーダモデルアーキテクチャを開発した。
提案されたモデルは、内部テストデータセットで80.7%のDiceスコア、外部テストセットで64.8%のDiceスコアを達成した。
論文 参考訳(メタデータ) (2024-05-12T04:35:49Z) - DODA: Diffusion for Object-detection Domain Adaptation in Agriculture [4.549305421261851]
本稿では,農業の新しい領域を対象とした高品質なオブジェクト検出データを生成するデータシンセサイザーであるDODAを提案する。
具体的には、画像としてレイアウトを符号化することでレイアウト・ツー・イメージの制御性を向上し、ラベルの品質を向上させる。
論文 参考訳(メタデータ) (2024-03-27T08:16:33Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - DiffusionEngine: Diffusion Model is Scalable Data Engine for Object
Detection [41.436817746749384]
Diffusion Modelはオブジェクト検出のためのスケーラブルなデータエンジンである。
DiffusionEngine(DE)は、高品質な検出指向のトレーニングペアを単一のステージで提供する。
論文 参考訳(メタデータ) (2023-09-07T17:55:01Z) - Back to the Source: Diffusion-Driven Test-Time Adaptation [77.4229736436935]
テスト時間適応はテスト入力を利用し、シフトしたターゲットデータ上でテストした場合、ソースデータに基づいてトレーニングされたモデルの精度を向上させる。
代わりに、生成拡散モデルを用いて、すべてのテスト入力をソース領域に向けて投影することで、ターゲットデータを更新する。
論文 参考訳(メタデータ) (2022-07-07T17:14:10Z) - Weakly Supervised Change Detection Using Guided Anisotropic Difusion [97.43170678509478]
我々は、このようなデータセットを変更検出の文脈で活用するのに役立つ独自のアイデアを提案する。
まず,意味的セグメンテーション結果を改善する誘導異方性拡散(GAD)アルゴリズムを提案する。
次に、変化検出に適した2つの弱い教師付き学習戦略の可能性を示す。
論文 参考訳(メタデータ) (2021-12-31T10:03:47Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。