論文の概要: DODA: Adapting Object Detectors to Dynamic Agricultural Environments in Real-Time with Diffusion
- arxiv url: http://arxiv.org/abs/2403.18334v2
- Date: Sat, 08 Mar 2025 06:04:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:41:57.293050
- Title: DODA: Adapting Object Detectors to Dynamic Agricultural Environments in Real-Time with Diffusion
- Title(参考訳): DODA:拡散を伴う動的農業環境へのオブジェクト検出器の適応
- Authors: Shuai Xiang, Pieter M. Blok, James Burridge, Haozhou Wang, Wei Guo,
- Abstract要約: DODAは拡散ベースのフレームワークで、検出器を2分で新しいドメインに適応できる。
DODA生成データに対する微調整検出を行うGlobal Wheat Head Detectionデータセットにおいて,DODAの有効性を示す。
- 参考スコア(独自算出の注目度): 4.549305421261851
- License:
- Abstract: Object detection has wide applications in agriculture, but domain shifts of diverse environments limit the broader use of the trained models. Existing domain adaptation methods usually require retraining the model for new domains, which is impractical for agricultural applications due to constantly changing environments. In this paper, we propose DODA ($D$iffusion for $O$bject-detection $D$omain Adaptation in $A$griculture), a diffusion-based framework that can adapt the detector to a new domain in just 2 minutes. DODA incorporates external domain embeddings and an improved layout-to-image approach, allowing it to generate high-quality detection data for new domains without additional training. We demonstrate DODA's effectiveness on the Global Wheat Head Detection dataset, where fine-tuning detectors on DODA-generated data yields significant improvements across multiple domains. DODA provides a simple yet powerful solution for agricultural domain adaptation, reducing the barriers for growers to use detection in personalised environments. The code is available at https://github.com/UTokyo-FieldPhenomics-Lab/DODA.
- Abstract(参考訳): オブジェクト検出は農業に広く応用されているが、多様な環境のドメインシフトは、訓練されたモデルの使用を制限している。
既存のドメイン適応手法では、常に変化する環境のため、農業用途には実用的でない新しいドメインのモデルを再訓練する必要がある。
本稿では,拡散型フレームワークであるDODA$D$iffusion for $O$bject-detection $D$omain Adaptation in $A$gricultureを提案する。
DODAには外部ドメインの埋め込みとレイアウト・ツー・イメージのアプローチの改善が組み込まれており、追加のトレーニングなしに新しいドメインの高品質な検出データを生成することができる。
DODAの生成したデータに対する微調整検出が複数の領域にわたる大幅な改善をもたらすGlobal Wheat Head DetectionデータセットにおけるDODAの有効性を実証する。
DODAは、農業領域適応のためのシンプルだが強力なソリューションを提供し、農家がパーソナライズされた環境で検出する障壁を減らす。
コードはhttps://github.com/UTokyo-FieldPhenomics-Lab/DODAで公開されている。
関連論文リスト
- AeroGen: Enhancing Remote Sensing Object Detection with Diffusion-Driven Data Generation [38.89367726721828]
リモートセンシング画像オブジェクト検出(RSIOD)は、衛星や空中画像内の特定の物体を特定し、特定することを目的としている。
現在のRSIODデータセットにはラベル付きデータが不足しており、現在の検出アルゴリズムのパフォーマンスを著しく制限している。
本稿では,RSIODに適したレイアウト制御可能な拡散生成モデル(AeroGen)を提案する。
論文 参考訳(メタデータ) (2024-11-23T09:04:33Z) - Controlling Human Shape and Pose in Text-to-Image Diffusion Models via Domain Adaptation [1.3654846342364308]
本研究では、事前訓練されたテキスト・画像拡散モデルにおいて、人間の形状とポーズを条件付きで制御する手法を提案する。
これらの拡散モデルを微調整して新しい条件に適合させるには、大きなデータセットと高品質なアノテーションが必要である。
合成条件情報を分離することで画像品質を維持するドメイン適応手法を提案する。
論文 参考訳(メタデータ) (2024-11-07T14:02:41Z) - From Web Data to Real Fields: Low-Cost Unsupervised Domain Adaptation for Agricultural Robots [3.7619101673213664]
本稿では,Unsupervised Domain Adaptation (UDA) を用いて,特定分野への適応を低コストで行うことを目的とする。
我々は、多様なインターネットソースデータのプールから、特定の場所でロボットが収集した小さなデータセットへの、新たなドメインシフトを探求する。
我々は,マルチレベル注意に基づく適応識別器(MAAD)という新しいモジュールを導入し,任意の検出モデルの特徴抽出器レベルで統合する。
論文 参考訳(メタデータ) (2024-10-31T13:11:09Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - ADLDA: A Method to Reduce the Harm of Data Distribution Shift in Data Augmentation [11.887799310374174]
本研究では,データ分散シフトの負の影響を軽減することを目的とした新しいデータ拡張手法であるADLDAを紹介する。
実験により、ADLDAは複数のデータセットにわたるモデル性能を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-05-11T03:20:35Z) - DetDiffusion: Synergizing Generative and Perceptive Models for Enhanced Data Generation and Perception [78.26734070960886]
現在の知覚モデルは、リソース集約的なデータセットに大きく依存している。
セグメンテーションを通じて知覚認識損失(P.A.損失)を導入し、品質と制御性の両方を改善した。
本手法は,世代間における知覚認識属性(P.A. Attr)の抽出と利用により,データ拡張をカスタマイズする。
論文 参考訳(メタデータ) (2024-03-20T04:58:03Z) - DreamDA: Generative Data Augmentation with Diffusion Models [68.22440150419003]
本稿では,新しい分類指向フレームワークDreamDAを提案する。
DreamDAは、オリジナルのデータのトレーニングイメージを種として考慮して、オリジナルのデータ分布に準拠する多様なサンプルを生成する。
また、生成したデータのラベルは、対応するシード画像のラベルと一致しない可能性があるため、擬似ラベルを生成するための自己学習パラダイムを導入する。
論文 参考訳(メタデータ) (2024-03-19T15:04:35Z) - GenFace: A Large-Scale Fine-Grained Face Forgery Benchmark and Cross Appearance-Edge Learning [50.7702397913573]
フォトリアリスティック・ジェネレータの急速な進歩は、真の画像と操作された画像の相違がますます不明瞭になっている臨界点に達している。
公開されている顔の偽造データセットはいくつかあるが、偽造顔は主にGANベースの合成技術を用いて生成される。
我々は,大規模で多様できめ細かな高忠実度データセットであるGenFaceを提案し,ディープフェイク検出の進展を促進する。
論文 参考訳(メタデータ) (2024-02-03T03:13:50Z) - UAV-Sim: NeRF-based Synthetic Data Generation for UAV-based Perception [62.71374902455154]
ニューラルレンダリングの最近の進歩を利用して、静的および動的ノベルビューUAVベースの画像レンダリングを改善する。
本研究では,主に実データと合成データのハイブリッドセットに基づいて最先端検出モデルが最適化された場合,性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-10-25T00:20:37Z) - Generative Modeling Helps Weak Supervision (and Vice Versa) [87.62271390571837]
本稿では,弱い監督と生成的敵ネットワークを融合したモデルを提案する。
弱い監督によるラベル推定と並行して、データの離散変数をキャプチャする。
これは、弱い教師付き合成画像と擬似ラベルによるデータ拡張を可能にする最初のアプローチである。
論文 参考訳(メタデータ) (2022-03-22T20:24:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。