論文の概要: Reliable Detection of Minute Targets in High-Resolution Aerial Imagery across Temporal Shifts
- arxiv url: http://arxiv.org/abs/2512.11360v1
- Date: Fri, 12 Dec 2025 08:20:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.700037
- Title: Reliable Detection of Minute Targets in High-Resolution Aerial Imagery across Temporal Shifts
- Title(参考訳): 高分解能空中画像における時間変化による微小物体の信頼性検出
- Authors: Mohammad Sadegh Gholizadeh, Amir Arsalan Rezapour, Hamidreza Shayegh, Ehsan Pazouki,
- Abstract要約: 本稿では,移動学習による高速R-CNNアーキテクチャを活用することにより,水田におけるイネの苗の検出に対処する。
トレーニングのために重要なUAVデータセットをキュレートし、モデルの一般化能力を厳格に評価する。
- 参考スコア(独自算出の注目度): 1.0499611180329804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient crop detection via Unmanned Aerial Vehicles is critical for scaling precision agriculture, yet it remains challenging due to the small scale of targets and environmental variability. This paper addresses the detection of rice seedlings in paddy fields by leveraging a Faster R-CNN architecture initialized via transfer learning. To overcome the specific difficulties of detecting minute objects in high-resolution aerial imagery, we curate a significant UAV dataset for training and rigorously evaluate the model's generalization capabilities. Specifically, we validate performance across three distinct test sets acquired at different temporal intervals, thereby assessing robustness against varying imaging conditions. Our empirical results demonstrate that transfer learning not only facilitates the rapid convergence of object detection models in agricultural contexts but also yields consistent performance despite domain shifts in image acquisition.
- Abstract(参考訳): 無人航空機による効率的な作物検出は、精密農業のスケールアップに不可欠であるが、小型の目標と環境変動のため、依然として困難である。
本稿では,移動学習によって初期化される高速なR-CNNアーキテクチャを活用することにより,水田におけるイネの苗の検出に対処する。
高解像度空中画像における微小物体の検出の難しさを克服するため、トレーニング用の重要なUAVデータセットをキュレートし、モデルの一般化能力を厳格に評価する。
具体的には、異なる時間間隔で取得した3つの異なるテストセットのパフォーマンスを検証し、異なる撮像条件に対するロバスト性を評価する。
実証実験の結果, 移動学習は, 農業環境における物体検出モデルの迅速な収束を促進するだけでなく, 画像取得における領域シフトにもかかわらず一貫した性能が得られることがわかった。
関連論文リスト
- Foundation Visual Encoders Are Secretly Few-Shot Anomaly Detectors [58.75916798814376]
FoundADと呼ばれる数発の異常検出装置を開発した。
画像中の異常量は学習した埋め込みの差と直接相関する。
簡単な演算子は、画像中の分布外領域を特徴付け識別する異常検出の有効なツールとして機能する。
論文 参考訳(メタデータ) (2025-10-02T11:53:20Z) - YOLOatr : Deep Learning Based Automatic Target Detection and Localization in Thermal Infrared Imagery [0.0]
そこで我々は, YOLOatrと呼ばれるアンカー型単段検出器を改良し, 検出ヘッドを最適に修正し, 首の核融合, カスタム拡張プロファイルを提案する。
相関テストプロトコルと非相関テストプロトコルの両方を用いたリアルタイムATRのための総合的DSIAC MWIRデータセットの性能評価を行った。
論文 参考訳(メタデータ) (2025-07-15T12:41:01Z) - FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection [21.38164867490915]
そこで本研究では,FBRT-YOLOと呼ばれる空中画像検出用リアルタイム検出器のファミリーを提案し,検出精度と効率の相違に対処する。
FCMは、ディープネットワークにおける小さなターゲット情報の損失に起因する情報不均衡の問題を軽減することに焦点を当てている。
MKPは異なる大きさのカーネルとの畳み込みを利用して、様々なスケールのターゲット間の関係を強化する。
論文 参考訳(メタデータ) (2025-04-29T11:53:54Z) - A Diffusion-Based Framework for Terrain-Aware Remote Sensing Image Reconstruction [4.824120664293887]
SatelliteMakerは、さまざまなレベルのデータ損失で失われたデータを再構成する拡散ベースの方法である。
条件入力としてのDEM(Digital Elevation Model)は、リアルな画像を生成するために調整されたプロンプトを使用する。
分散損失に基づくVGG-Adapterモジュール。
論文 参考訳(メタデータ) (2025-04-16T14:19:57Z) - Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection [0.0]
無人航空機からの絶縁体欠陥検出のための既存の検出方法は、複雑な背景や小さな物体と競合する。
本稿では,この課題に対処するため,新しい注目基盤アーキテクチャであるYOLO-ELAを提案する。
高分解能UAV画像による実験結果から,本手法は96.9% mAP0.5,リアルタイム検出速度74.63フレーム/秒を実現した。
論文 参考訳(メタデータ) (2024-10-15T16:00:01Z) - Adversarially-Aware Robust Object Detector [85.10894272034135]
本稿では,ロバスト検出器 (RobustDet) を提案する。
本モデルは, クリーン画像の検出能力を維持しながら, 傾きを効果的に解き, 検出堅牢性を著しく向上させる。
論文 参考訳(メタデータ) (2022-07-13T13:59:59Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。