論文の概要: An Artificial Intelligence System for Combined Fruit Detection and
Georeferencing, Using RTK-Based Perspective Projection in Drone Imagery
- arxiv url: http://arxiv.org/abs/2101.00339v1
- Date: Fri, 1 Jan 2021 23:39:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 11:47:46.479441
- Title: An Artificial Intelligence System for Combined Fruit Detection and
Georeferencing, Using RTK-Based Perspective Projection in Drone Imagery
- Title(参考訳): RTKを用いたドローン画像の視点投影を用いた果実検出とジオレファレンスを組み合わせた人工知能システム
- Authors: Angus Baird and Stefano Giani
- Abstract要約: この研究では、商業用果樹園の空中ドローン画像からリンゴを検出してカウントする人工知能(AI)システムを紹介します。
計算コストを低減するため、ネットワークの新たな前駆的段階は、個々の木の切り抜き画像に生画像を前処理するように設計されている。
ユニークな地理空間識別子は、遠近法投影モデルを用いてこれらに割り当てられる。
実験により、より高速なR-CNNの文献に見ることのないk平均クラスタリング手法が、校正されたmAPの最も重要な改善をもたらすことが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work presents an Artificial Intelligence (AI) system, based on the
Faster Region-Based Convolution Neural Network (Faster R-CNN) framework, which
detects and counts apples from oblique, aerial drone imagery of giant
commercial orchards. To reduce computational cost, a novel precursory stage to
the network is designed to preprocess raw imagery into cropped images of
individual trees. Unique geospatial identifiers are allocated to these using
the perspective projection model. This employs Real-Time Kinematic (RTK) data,
Digital Terrain and Surface Models (DTM and DSM), as well as internal and
external camera parameters. The bulk of experiments however focus on tuning
hyperparameters in the detection network itself. Apples which are on trees and
apples which are on the ground are treated as separate classes. A mean Average
Precision (mAP) metric, calibrated by the size of the two classes, is devised
to mitigate spurious results. Anchor box design is of key interest due to the
scale of the apples. As such, a k-means clustering approach, never before seen
in literature for Faster R-CNN, resulted in the most significant improvements
to calibrated mAP. Other experiments showed that the maximum number of box
proposals should be 225; the initial learning rate of 0.001 is best applied to
the adaptive RMS Prop optimiser; and ResNet 101 is the ideal base feature
extractor when considering mAP and, to a lesser extent, inference time. The
amalgamation of the optimal hyperparameters leads to a model with a calibrated
mAP of 0.7627.
- Abstract(参考訳): この研究は、高速領域ベースの畳み込みニューラルネットワーク(Faster R-CNN)フレームワークに基づく人工知能(AI)システムを提示し、巨大な商業用果樹園の斜めのドローン画像からリンゴを検出し、数える。
計算コストを低減するため、ネットワークの新たな前駆的段階は、個々の木の切り抜き画像に生画像を前処理するように設計されている。
ユニークな地理空間識別子は、遠近法投影モデルを用いてこれらに割り当てられる。
これは、リアルタイムキネマティック(rtk)データ、デジタル地形および表面モデル(dtmおよびdsm)、および内部および外部カメラパラメータを使用している。
しかし、多くの実験は検出ネットワーク自体のハイパーパラメータのチューニングに焦点を当てている。
木の上にあるりんごと地面にあるりんごは別個のクラスとして扱われる。
2つのクラスの大きさで校正された平均平均精度(map)メトリックは、散発的な結果を緩和するために考案された。
アンカーボックスのデザインはリンゴの大きさのために重要な関心事である。
したがって、より高速なR-CNNの文献に見ることのないk平均クラスタリングアプローチは、校正されたmAPの最も重要な改善をもたらした。
他の実験では、ボックス提案の最大数は225であり、適応的なRMS Propオプティマイザには0.001の学習率が最も適しており、ResNet 101 は mAP を考慮した場合の理想的な基本特徴抽出器である。
最適なハイパーパラメータのアマルガメーションは、校正されたmAPの0.7627のモデルにつながる。
関連論文リスト
- MPruner: Optimizing Neural Network Size with CKA-Based Mutual Information Pruning [7.262751938473306]
プルーニング(Pruning)は、ニューラルネットワークのサイズを減らし、数学的に精度の保存を保証している、よく確立されたテクニックである。
我々は,ベクトル類似性により相互情報を活用する新しいプルーニングアルゴリズムMPrunerを開発した。
MPrunerはCNNとトランスフォーマーベースのモデルで最大50%のパラメータとメモリ使用量の削減を実現した。
論文 参考訳(メタデータ) (2024-08-24T05:54:47Z) - Memory-efficient particle filter recurrent neural network for object
localization [53.68402839500528]
本研究では、オブジェクトの局所化問題を解決するために、新しいメモリ効率のリカレントニューラルネットワーク(RNN)アーキテクチャを提案する。
古典的粒子フィルタの概念をGRU RNNアーキテクチャと組み合わせる。
我々の実験では、mePFRNNモデルは、考慮された競合相手よりも正確なローカライゼーションを提供し、訓練されたパラメータを少なくする。
論文 参考訳(メタデータ) (2023-10-02T19:41:19Z) - Heuristic Hyperparameter Choice for Image Anomaly Detection [0.3867363075280543]
画像の異常検出は、ディープラーニングニューラルネットワークによる基本的なコンピュータビジョン問題である。
モデルは通常、ImageNetのような分類タスクのための大きなデータセットで事前訓練される。
本研究の目的は,これらの特徴に対してNPCA(Negated principal Component Analysis)の次元削減を行うことである。
論文 参考訳(メタデータ) (2023-07-20T19:20:35Z) - Iterative Soft Shrinkage Learning for Efficient Image Super-Resolution [91.3781512926942]
画像超解像(SR)は、CNNからトランスフォーマーアーキテクチャへの広範なニューラルネットワーク設計を目撃している。
本研究は,市販のネットワーク設計を生かし,基礎となる計算オーバーヘッドを低減するため,超高解像度イテレーションにおけるネットワークプルーニングの可能性について検討する。
本研究では, ランダムネットワークのスパース構造を最適化し, 重要でない重みを小さめに微調整することにより, 反復型軟収縮率(ISS-P)法を提案する。
論文 参考訳(メタデータ) (2023-03-16T21:06:13Z) - On the optimization and pruning for Bayesian deep learning [1.0152838128195467]
重み空間上でニューラルネットワークを学習するための適応型変分ベイズアルゴリズムを提案する。
EM-MCMCアルゴリズムにより,ワンショットで最適化とモデルプルーニングを行うことができる。
我々の密度モデルは最先端の性能に到達でき、スパースモデルは以前提案したプルーニング方式と比較して非常によく機能する。
論文 参考訳(メタデータ) (2022-10-24T05:18:08Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - Core Risk Minimization using Salient ImageNet [53.616101711801484]
私たちは、1000のImagenetクラスのコアとスプリアス機能をローカライズする100万人以上のソフトマスクを備えたSalient Imagenetデータセットを紹介します。
このデータセットを用いて、まず、いくつかのImagenet事前訓練されたモデル(総計42件)の素早い特徴に対する依存度を評価する。
次に、コアリスク最小化(CoRM)と呼ばれる新しい学習パラダイムを導入する。
論文 参考訳(メタデータ) (2022-03-28T01:53:34Z) - New SAR target recognition based on YOLO and very deep multi-canonical
correlation analysis [0.1503974529275767]
本稿では,異なるCNN層から有効な特徴を適応的に融合させることにより,SAR画像ターゲット分類のためのロバストな特徴抽出手法を提案する。
MSTARデータセットの実験により,提案手法が最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T18:10:26Z) - ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked
Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。
提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。
生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文 参考訳(メタデータ) (2021-05-07T11:39:05Z) - Classification of Polarimetric SAR Images Using Compact Convolutional
Neural Networks [24.553598498985796]
PolSAR画像の分類には,新しい,体系的な分類フレームワークが提案されている。
スライドウインドウ分類手法を用いたCNNのコンパクトで適応的な実装に基づいている。
提案手法は深層CNNよりも小さいウィンドウサイズで分類できる。
論文 参考訳(メタデータ) (2020-11-10T17:09:11Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。