論文の概要: Denoised Diffusion for Object-Focused Image Augmentation
- arxiv url: http://arxiv.org/abs/2510.08955v2
- Date: Tue, 14 Oct 2025 15:47:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-15 16:45:44.44965
- Title: Denoised Diffusion for Object-Focused Image Augmentation
- Title(参考訳): 物体に焦点をあてた画像拡張のための解法拡散法
- Authors: Nisha Pillai, Aditi Virupakshaiah, Harrison W. Smith, Amanda J. Ashworth, Prasanna Gowda, Phillip R. Owens, Adam R. Rivers, Bindu Nanduri, Mahalingam Ramkumar,
- Abstract要約: 本研究では、制約データ設定における動物の健康モニタリングを明確にするためのオブジェクト指向データ拡張フレームワークを提案する。
われわれのアプローチは動物を背景から切り離し、動物を変換と拡散に基づく合成によって強化し、現実的で多様なシーンを作り出す。
ドメイン固有のデータを生成することにより,データ共有シナリオにおいてもリアルタイムの動物健康モニタリングソリューションが有効になる。
- 参考スコア(独自算出の注目度): 0.6109833303919141
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern agricultural operations increasingly rely on integrated monitoring systems that combine multiple data sources for farm optimization. Aerial drone-based animal health monitoring serves as a key component but faces limited data availability, compounded by scene-specific issues such as small, occluded, or partially visible animals. Transfer learning approaches often fail to address this limitation due to the unavailability of large datasets that reflect specific farm conditions, including variations in animal breeds, environments, and behaviors. Therefore, there is a need for developing a problem-specific, animal-focused data augmentation strategy tailored to these unique challenges. To address this gap, we propose an object-focused data augmentation framework designed explicitly for animal health monitoring in constrained data settings. Our approach segments animals from backgrounds and augments them through transformations and diffusion-based synthesis to create realistic, diverse scenes that enhance animal detection and monitoring performance. Our initial experiments demonstrate that our augmented dataset yields superior performance compared to our baseline models on the animal detection task. By generating domain-specific data, our method empowers real-time animal health monitoring solutions even in data-scarce scenarios, bridging the gap between limited data and practical applicability.
- Abstract(参考訳): 現代の農業事業は、農業最適化のために複数のデータソースを組み合わせた統合的なモニタリングシステムにますます依存している。
空中ドローンによる動物の健康モニタリングは重要な要素であるが、小さな、隠蔽された、または部分的に見える動物のようなシーン固有の問題によって、限られたデータ可用性に直面している。
移動学習アプローチは、動物種、環境、行動のバリエーションを含む特定の農場条件を反映する大規模なデータセットが利用できないため、この制限に対処できないことが多い。
したがって、これらの固有の課題に合わせて、問題固有の、動物に焦点を当てたデータ拡張戦略を開発する必要がある。
このギャップに対処するために、制約付きデータ設定における動物の健康モニタリングを明確にするためのオブジェクト指向データ拡張フレームワークを提案する。
われわれのアプローチは動物を背景から切り離し、動物を変換と拡散に基づく合成によって強化し、動物検出とモニタリング性能を高める現実的で多様なシーンを作り出す。
動物検出タスクのベースラインモデルと比較して,我々の拡張データセットが優れた性能を示すことを示す実験を行った。
ドメイン固有のデータを生成することにより、データ共有シナリオにおいてもリアルタイムの動物健康モニタリングソリューションが有効になり、限られたデータと実用性の間のギャップを埋める。
関連論文リスト
- DiffPose-Animal: A Language-Conditioned Diffusion Framework for Animal Pose Estimation [1.1708207558288541]
DiffPose-Animalは,トップダウン動物ポーズ推定のための新しい拡散型フレームワークである。
従来の熱マップ回帰法とは異なり、DiffPose-Animal は拡散モデルの生成的枠組みの下でデノナイジング過程として推定する。
論文 参考訳(メタデータ) (2025-08-12T09:37:09Z) - Benchmarking pig detection and tracking under diverse and challenging conditions [1.865175170209582]
オブジェクト検出のためのPigDetectと、マルチオブジェクト追跡のためのPigTrackの2つのデータセットをキュレートした。
対象物検出では,ランダムなサンプル画像のみを用いて達成可能なものよりも,困難なトレーニング画像により検出が向上することを示す。
マルチオブジェクト追跡において,SORTに基づく手法は,エンドツーエンドのトレーニング可能なモデルに比べて優れた検出性能が得られることを示した。
論文 参考訳(メタデータ) (2025-07-22T14:36:51Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Public Computer Vision Datasets for Precision Livestock Farming: A Systematic Survey [3.3651853492305177]
本研究は,家畜のCVデータセットの公開に関する最初の体系的な調査である。
58の公開データセットのうち、ほぼ半分は牛用で、続いて豚、鶏、その他の動物が続く。
個人の動物検出とカラーイメージングは、家畜にとって主要な応用であり、画像のモダリティである。
論文 参考訳(メタデータ) (2024-06-15T13:22:41Z) - Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - Persistent Animal Identification Leveraging Non-Visual Markers [71.14999745312626]
乱雑なホームケージ環境下で各マウスにユニークな識別子を時間をかけて発見し提供することを目的としている。
これは、(i)各マウスの視覚的特徴の区別の欠如、(ii)一定の閉塞を伴うシーンの密閉性のため、非常に難しい問題である。
本手法は, この動物識別問題に対して77%の精度を達成し, 動物が隠れているときの急激な検出を拒否することができる。
論文 参考訳(メタデータ) (2021-12-13T17:11:32Z) - Livestock Monitoring with Transformer [4.298326853567677]
我々は,集団飼育豚を対象としたエンドツーエンド行動監視システムを開発し,インスタンスレベルのセグメンテーション,トラッキング,行動認識,再識別タスクを同時実施する。
本稿では, トランスフォーマーアーキテクチャを用いて, グループ豚のインスタンスレベルの埋め込みを学習する, エンドツーエンド多目的家畜監視フレームワークであるStarformerについて紹介する。
論文 参考訳(メタデータ) (2021-11-01T10:03:49Z) - Zoo-Tuning: Adaptive Transfer from a Zoo of Models [82.9120546160422]
Zoo-Tuningは、事前訓練されたモデルのパラメータをターゲットタスクに適応的に転送することを学ぶ。
我々は、強化学習、画像分類、顔のランドマーク検出など、様々なタスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-06-29T14:09:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。