論文の概要: Exploring Model Quantization in GenAI-based Image Inpainting and Detection of Arable Plants
- arxiv url: http://arxiv.org/abs/2503.02420v1
- Date: Tue, 04 Mar 2025 09:05:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:24:01.018973
- Title: Exploring Model Quantization in GenAI-based Image Inpainting and Detection of Arable Plants
- Title(参考訳): GenAIを用いたイメージインペインティングにおけるモデル量子化の探索と可観測植物の検出
- Authors: Sourav Modak, Ahmet Oğuz Saltık, Anthony Stein,
- Abstract要約: 安定ディフュージョンベースのインペインティングを利用して、10%のインクリメントでトレーニングデータを段階的に増加させ、最大200%まで増やすフレームワークを提案する。
本手法は,mAP50測定値を用いて,最先端物体検出モデルであるYOLO11(l)とRT-DETR(l)の2つを用いて評価を行った。
Jetson Orin Nano上での下流モデルの展開は、リソース制約のある環境での我々のフレームワークの実用可能性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Deep learning-based weed control systems often suffer from limited training data diversity and constrained on-board computation, impacting their real-world performance. To overcome these challenges, we propose a framework that leverages Stable Diffusion-based inpainting to augment training data progressively in 10% increments -- up to an additional 200%, thus enhancing both the volume and diversity of samples. Our approach is evaluated on two state-of-the-art object detection models, YOLO11(l) and RT-DETR(l), using the mAP50 metric to assess detection performance. We explore quantization strategies (FP16 and INT8) for both the generative inpainting and detection models to strike a balance between inference speed and accuracy. Deployment of the downstream models on the Jetson Orin Nano demonstrates the practical viability of our framework in resource-constrained environments, ultimately improving detection accuracy and computational efficiency in intelligent weed management systems.
- Abstract(参考訳): ディープラーニングベースの雑草制御システムは、トレーニングデータの多様性の制限や、オンボードでの計算の制限に悩まされ、実際のパフォーマンスに影響を与えます。
これらの課題を克服するため、我々は、安定拡散に基づくインペインティングを利用して、10%のインクリメントでトレーニングデータを漸進的に増加させるフレームワークを提案します。
本手法は,mAP50測定値を用いて,最先端物体検出モデルであるYOLO11(l)とRT-DETR(l)の2つを用いて評価を行った。
本研究では, 予測速度と精度のバランスをとるために, 生成インペイントモデルと検出モデルの両方に対する量子化戦略(FP16, INT8)について検討する。
Jetson Orin Nano上での下流モデルの展開は、資源制約のある環境での我々のフレームワークの実用可能性を示し、最終的には知的雑草管理システムにおける検出精度と計算効率を向上させる。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Enhancing weed detection performance by means of GenAI-based image augmentation [0.0]
本稿では、安定拡散モデルを用いて、雑草検出モデルのための多様な合成画像を生成する、生成AIベースの拡張手法について検討する。
その結果、生成AI拡張データセットでトレーニングしたYOLOモデルの平均精度が大幅に向上した。
論文 参考訳(メタデータ) (2024-11-27T17:00:34Z) - Generative AI-based Pipeline Architecture for Increasing Training Efficiency in Intelligent Weed Control Systems [0.0]
本研究は,知的雑草制御のための深層学習に基づく物体検出モデルを改善するために,合成画像を生成する新しいアプローチを提案する。
我々のGenAIベースの画像生成パイプラインは、ゼロショットドメイン適応のためのSegment Anything Model(SAM)と、テキストから画像への安定拡散モデルを統合する。
我々は、これらの合成データセットを軽量YOLOモデルを用いて評価し、mAP50とmAP50-95スコアを用いてデータ効率を測定した。
論文 参考訳(メタデータ) (2024-11-01T12:58:27Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Developing Gridded Emission Inventory from High-Resolution Satellite Object Detection for Improved Air Quality Forecasts [1.4238093681454425]
本研究では, 気象研究・予測モデルと化学(WRF Chem)を併用した, ダイナミックなAIベースの排出在庫システム構築のための革新的なアプローチを提案する。
このシステムは、エミッション推定において前例のない時間的および空間的な解決を提供し、より正確な短期的な空気質予測と都市エミッションのダイナミクスに関する深い洞察を促進する。
今後の研究は、システムの能力を非車両に拡張し、環境条件に挑戦する際の検出精度をさらに向上することに焦点を当てる。
論文 参考訳(メタデータ) (2024-10-14T01:32:45Z) - A Simple Background Augmentation Method for Object Detection with Diffusion Model [53.32935683257045]
コンピュータビジョンでは、データの多様性の欠如がモデル性能を損なうことはよく知られている。
本稿では, 生成モデルの進歩を生かして, 単純かつ効果的なデータ拡張手法を提案する。
背景強化は、特にモデルの堅牢性と一般化能力を大幅に改善する。
論文 参考訳(メタデータ) (2024-08-01T07:40:00Z) - Diffusion-Based Neural Network Weights Generation [80.89706112736353]
D2NWGは拡散に基づくニューラルネットワーク重み生成技術であり、転送学習のために高性能な重みを効率よく生成する。
本稿では,ニューラルネットワーク重み生成のための遅延拡散パラダイムを再放送するために,生成的ハイパー表現学習を拡張した。
我々のアプローチは大規模言語モデル(LLM)のような大規模アーキテクチャにスケーラブルであり、現在のパラメータ生成技術の限界を克服しています。
論文 参考訳(メタデータ) (2024-02-28T08:34:23Z) - On Efficient Uncertainty Estimation for Resource-Constrained Mobile
Applications [0.0]
予測の不確実性は、モデル予測を補完し、下流タスクの機能を改善します。
Axolotlフレームワークを用いてモンテカルロ・ドロップアウト(MCDO)モデルを構築することでこの問題に対処する。
我々は,(1)CIFAR10データセットを用いた多クラス分類タスク,(2)より複雑な人体セグメンテーションタスクについて実験を行った。
論文 参考訳(メタデータ) (2021-11-11T22:24:15Z) - GOAT: GPU Outsourcing of Deep Learning Training With Asynchronous
Probabilistic Integrity Verification Inside Trusted Execution Environment [0.0]
Deep Neural Networks(DNN)に基づく機械学習モデルは、自動運転車から新型コロナウイルスの治療発見まで、さまざまなアプリケーションにますます導入されている。
DNNを学習するために必要な計算能力をサポートするために、専用のハードウェアサポートを備えたクラウド環境が重要なインフラストラクチャとして登場した。
これらの課題に対処する様々なアプローチが開発され、信頼できる実行環境(TEE)上に構築されている。
論文 参考訳(メタデータ) (2020-10-17T20:09:05Z) - SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier
Detection [63.253850875265115]
外乱検出(OD)は、一般的なサンプルから異常物体を識別するための機械学習(ML)タスクである。
そこで我々は,SUODと呼ばれるモジュール型加速度システムを提案する。
論文 参考訳(メタデータ) (2020-03-11T00:22:50Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。