論文の概要: Image-Based Sorghum Head Counting When You Only Look Once
- arxiv url: http://arxiv.org/abs/2009.11929v3
- Date: Mon, 13 Jun 2022 15:47:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-10-15 04:21:26.080971
- Title: Image-Based Sorghum Head Counting When You Only Look Once
- Title(参考訳): 画像ベースのソルガムヘッド計数(sorghum head counting)
- Authors: Lawrence Mosley and Hieu Pham and Yogesh Bansal and Eric Hare
- Abstract要約: デジタル農業の最近のトレンドは、作物の品質評価と収量推定のために人工知能にシフトしている。
本研究では,パラメータ調整された単発物体検出アルゴリズムを用いて,空中ドローン画像からソルガム頭部を識別・カウントする方法について述べる。
- 参考スコア(独自算出の注目度): 16.43087660376697
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern trends in digital agriculture have seen a shift towards artificial
intelligence for crop quality assessment and yield estimation. In this work, we
document how a parameter tuned single-shot object detection algorithm can be
used to identify and count sorghum head from aerial drone images. Our approach
involves a novel exploratory analysis that identified key structural elements
of the sorghum images and motivated the selection of parameter-tuned anchor
boxes that contributed significantly to performance. These insights led to the
development of a deep learning model that outperformed the baseline model and
achieved an out-of-sample mean average precision of 0.95.
- Abstract(参考訳): デジタル農業の最近のトレンドは、作物の品質評価と収量推定のために人工知能にシフトしている。
本研究では,パラメータ調整された単発物体検出アルゴリズムを用いて,空中ドローン画像からソルガム頭部を識別・カウントする方法について述べる。
提案手法は,ソルガム画像の重要な構造要素を同定し,性能に大きく寄与するパラメータ調整アンカーボックスの選択を動機付ける,新たな探索分析を含む。
これらの知見は、ベースラインモデルより優れ、サンプル外平均精度0.95を達成したディープラーニングモデルの開発につながった。
関連論文リスト
- Manifold Induced Biases for Zero-shot and Few-shot Detection of Generated Images [4.597145995119321]
我々は,(1)理論的な根拠の欠如,(2)ゼロショットと少数ショットの制度における性能改善のための重要な余地,の2つの主要なギャップを同定する。
具体的には,事前学習した拡散モデルにより得られた暗黙的確率多様体のバイアスについて検討する。
スコア関数解析により、確率多様体上の点に対する曲率、勾配、偏りを近似し、ゼロショット状態における検出基準を確立する。
20個の生成モデルにまたがる実験結果から,本手法はゼロショット設定と少数ショット設定の両方において,現在の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-04-21T22:39:24Z) - A Meaningful Perturbation Metric for Evaluating Explainability Methods [55.09730499143998]
本稿では,画像生成モデルを用いて標的摂動を行う新しい手法を提案する。
具体的には,画像の忠実さを保ちながら,入力画像の高関連画素のみを塗布し,モデルの予測を変更することに焦点を当てる。
これは、しばしばアウト・オブ・ディストリビューションの修正を生み出し、信頼できない結果をもたらす既存のアプローチとは対照的である。
論文 参考訳(メタデータ) (2025-04-09T11:46:41Z) - Forensic Self-Descriptions Are All You Need for Zero-Shot Detection, Open-Set Source Attribution, and Clustering of AI-generated Images [8.167678851224121]
従来の手法では、トレーニング中に既知のソースに特有の機能に依存するため、見えないジェネレータに一般化できない。
本稿では,法医学的微細構造を明示的にモデル化する新しい手法を提案する。
この自己記述により、合成画像のゼロショット検出、画像のオープンセットソース属性、および事前知識のないソースに基づくクラスタリングを行うことができる。
論文 参考訳(メタデータ) (2025-03-26T21:34:37Z) - Revealing the Implicit Noise-based Imprint of Generative Models [71.94916898756684]
本稿では,検出タスクにノイズに基づくモデル固有インプリントを利用する新しいフレームワークを提案する。
様々な生成モデルからのインプリントを集約することにより、将来のモデルのインプリントを外挿してトレーニングデータを拡張することができる。
提案手法は,GenImage,Synthbuster,Chameleonの3つの公開ベンチマークにおいて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2025-03-12T12:04:53Z) - DiffDoctor: Diagnosing Image Diffusion Models Before Treating [57.82359018425674]
DiffDoctorは2段階のパイプラインで、画像拡散モデルがより少ないアーティファクトを生成するのを支援する。
我々は100万以上の欠陥のある合成画像のデータセットを収集し、効率的なHuman-in-the-loopアノテーションプロセスを構築した。
次に、学習したアーティファクト検出器が第2段階に関与し、ピクセルレベルのフィードバックを提供することで拡散モデルを最適化する。
論文 参考訳(メタデータ) (2025-01-21T18:56:41Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Improving Interpretability and Robustness for the Detection of AI-Generated Images [6.116075037154215]
凍結したCLIP埋め込みに基づいて、既存の最先端AIGI検出手法を解析する。
さまざまなAIジェネレータが生成する画像が実際の画像とどのように異なるかを示す。
論文 参考訳(メタデータ) (2024-06-21T10:33:09Z) - Gait Recognition from Highly Compressed Videos [3.1049440318608568]
一般的な緩和戦略は、頑健性を改善するためにノイズデータ上の微調整ポーズ推定モデルを含む。
本稿では,監視映像の事前処理と改善を目的としたタスク対象のアーティファクト修正モデルを組み込んだ処理パイプラインを提案する。
本実験は歩行解析性能の向上を図り,提案手法の有効性を裏付けるものである。
論文 参考訳(メタデータ) (2024-04-18T13:46:16Z) - RANRAC: Robust Neural Scene Representations via Random Ray Consensus [12.161889666145127]
RANRAC(RANdom RAy Consensus)は、一貫性のないデータの影響を排除するための効率的な手法である。
我々はRANSACパラダイムのファジィ適応を定式化し、大規模モデルへの適用を可能にした。
その結果, 新規な視点合成のための最先端のロバストな手法と比較して, 顕著な改善が見られた。
論文 参考訳(メタデータ) (2023-12-15T13:33:09Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Learning Robust Multi-Scale Representation for Neural Radiance Fields
from Unposed Images [65.41966114373373]
コンピュータビジョンにおけるニューラルイメージベースのレンダリング問題に対する改善された解決策を提案する。
提案手法は,テスト時に新たな視点からシーンのリアルなイメージを合成することができる。
論文 参考訳(メタデータ) (2023-11-08T08:18:23Z) - On quantifying and improving realism of images generated with diffusion [50.37578424163951]
与えられた画像の5つの統計的測度から算出した画像リアリズムスコア(IRS)と呼ばれるメトリクスを提案する。
IRSは、与えられた画像を実または偽のものとして分類する手段として容易に利用できる。
我々は,安定拡散モデル (SDM) , Dalle2, Midjourney, BigGAN による偽画像の検出に成功して,提案したIRSのモデルおよびデータに依存しない性質を実験的に確立した。
このデータセットは、高品質の4つのモデルによって生成される100のクラスに対して1,000のサンプルを提供します。
論文 参考訳(メタデータ) (2023-09-26T08:32:55Z) - End-to-end deep learning for directly estimating grape yield from
ground-based imagery [53.086864957064876]
本研究は, ブドウ畑の収量推定に深層学習と併用した近位画像の応用を実証する。
オブジェクト検出、CNN回帰、トランスフォーマーモデルという3つのモデルアーキテクチャがテストされた。
本研究は,ブドウの収量予測における近位画像と深層学習の適用性を示した。
論文 参考訳(メタデータ) (2022-08-04T01:34:46Z) - On the Exploitation of Deepfake Model Recognition [0.0]
ディープフェイク画像を生成する特定のGANモデルの認識は、最先端技術においてまだ完全に対処されていないタスクである。
ディープフェイクモデル認識のための分析指紋のポイントアウトの可能性を評価する頑健な処理パイプラインを示す。
この研究は、Deepfake現象に対抗する重要な一歩を踏み出し、ある種のシグネチャをある種の意味で導入する。
論文 参考訳(メタデータ) (2022-04-09T16:48:23Z) - Information-Theoretic Odometry Learning [83.36195426897768]
生体計測推定を目的とした学習動機付け手法のための統合情報理論フレームワークを提案する。
提案フレームワークは情報理論言語の性能評価と理解のためのエレガントなツールを提供する。
論文 参考訳(メタデータ) (2022-03-11T02:37:35Z) - Potato Crop Stress Identification in Aerial Images using Deep
Learning-based Object Detection [60.83360138070649]
本稿では, 深層ニューラルネットワークを用いたジャガイモの空中画像解析手法を提案する。
主な目的は、植物レベルでの健康作物とストレス作物の自動空間認識を実証することである。
実験により、フィールド画像中の健康植物とストレス植物を識別し、平均Dice係数0.74を達成できることを示した。
論文 参考訳(メタデータ) (2021-06-14T21:57:40Z) - Learning to Recognize Patch-Wise Consistency for Deepfake Detection [39.186451993950044]
パッチワイド一貫性学習(PCL)という,このタスクのための表現学習手法を提案する。
PCLは、画像のソース機能の一貫性を測定し、複数の偽造方法に対する優れた解釈性と堅牢性で表現することを学びます。
7つの一般的なDeepfake検出データセットに対するアプローチを評価します。
論文 参考訳(メタデータ) (2020-12-16T23:06:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。