論文の概要: Counting dense objects in remote sensing images
- arxiv url: http://arxiv.org/abs/2002.05928v1
- Date: Fri, 14 Feb 2020 09:13:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 04:59:01.870063
- Title: Counting dense objects in remote sensing images
- Title(参考訳): リモートセンシング画像における高密度物体の計数
- Authors: Guangshuai Gao, Qingjie Liu, Yunhong Wang
- Abstract要約: 特定の画像から関心のあるオブジェクトの数を推定するのは、難しいが重要な作業である。
本稿では,リモートセンシング画像から高密度物体を数えることに興味がある。
これらの課題に対処するために,我々はまず,リモートセンシング画像に基づく大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
- 参考スコア(独自算出の注目度): 52.182698295053264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating accurate number of interested objects from a given image is a
challenging yet important task. Significant efforts have been made to address
this problem and achieve great progress, yet counting number of ground objects
from remote sensing images is barely studied. In this paper, we are interested
in counting dense objects from remote sensing images. Compared with object
counting in natural scene, this task is challenging in following factors: large
scale variation, complex cluttered background and orientation arbitrariness.
More importantly, the scarcity of data severely limits the development of
research in this field. To address these issues, we first construct a
large-scale object counting dataset based on remote sensing images, which
contains four kinds of objects: buildings, crowded ships in harbor,
large-vehicles and small-vehicles in parking lot. We then benchmark the dataset
by designing a novel neural network which can generate density map of an input
image. The proposed network consists of three parts namely convolution block
attention module (CBAM), scale pyramid module (SPM) and deformable convolution
module (DCM). Experiments on the proposed dataset and comparisons with state of
the art methods demonstrate the challenging of the proposed dataset, and
superiority and effectiveness of our method.
- Abstract(参考訳): ある画像から興味のあるオブジェクトの正確な数を推定することは、難しいが重要な課題である。
この問題に対処し、大きな進展を達成するための重要な努力がなされているが、リモートセンシング画像からの地上物体の数をほとんど研究していない。
本稿では,リモートセンシング画像から高密度物体を数えることに興味がある。
自然界における対象数と比較すると, 大規模変動, 複雑な乱雑な背景, 配向の任意性など, 課題がある。
さらに重要なことに、データの不足はこの分野の研究の発展を厳しく制限している。
これらの課題に対処するために,我々はまず,ビル,港湾の混雑船,大型車両,駐車場の小型車両の4種類の物体を含む,リモートセンシング画像に基づく大規模物体カウントデータセットを構築した。
次に,入力画像の密度マップを生成する新しいニューラルネットワークを設計することで,データセットのベンチマークを行う。
提案するネットワークは,畳み込みブロックアテンションモジュール(CBAM),スケールピラミッドモジュール(SPM),変形可能な畳み込みモジュール(DCM)の3つの部分から構成される。
提案したデータセットと最先端技術との比較実験により,提案したデータセットの課題と,本手法の優位性と有効性を示す。
関連論文リスト
- MegaScenes: Scene-Level View Synthesis at Scale [69.21293001231993]
NVS (Scene-level novel view synthesis) は多くの視覚やグラフィックスの応用に基礎を置いている。
MegaScenesと呼ばれるインターネット写真コレクションから大規模なシーンレベルのデータセットを作成し、世界中の動き(SfM)から100K以上の構造を復元する。
我々は、最先端NVS手法の故障事例を分析し、生成一貫性を大幅に改善する。
論文 参考訳(メタデータ) (2024-06-17T17:55:55Z) - MegaPose: 6D Pose Estimation of Novel Objects via Render & Compare [84.80956484848505]
MegaPoseは、トレーニング中に見えない新しいオブジェクトの6Dポーズを推定する方法である。
本稿では,新しいオブジェクトに適用可能なR&Compare戦略に基づく6次元ポーズリファインダを提案する。
第2に,合成レンダリングと同一物体の観察画像間のポーズ誤差をリファインダで補正できるか否かを分類するために訓練されたネットワークを利用する,粗いポーズ推定のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-12-13T19:30:03Z) - PoET: Pose Estimation Transformer for Single-View, Multi-Object 6D Pose
Estimation [6.860183454947986]
本稿では、RGB画像を入力とし、画像内の各オブジェクトに対する6Dポーズを予測するトランスフォーマーベースのアプローチを提案する。
画像のほかに、深度マップや3Dオブジェクトモデルなどの追加情報も不要です。
挑戦的なYCB-Vデータセットに対するRGBのみのアプローチの最先端結果を得る。
論文 参考訳(メタデータ) (2022-11-25T14:07:14Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in
High-Resolution Remote Sensing Imagery [21.9319970004788]
我々は,高分解能リモートセンシング画像において,100万以上のインスタンスと15,000以上の画像を含む新しいベンチマークデータセットを提案する。
FAIR1Mデータセットのすべてのオブジェクトは、指向境界ボックスによって5つのカテゴリと37のサブカテゴリに関してアノテートされます。
論文 参考訳(メタデータ) (2021-03-09T17:20:15Z) - Counting from Sky: A Large-scale Dataset for Remote Sensing Object
Counting and A Benchmark Method [52.182698295053264]
リモートセンシング画像から高密度物体をカウントすることに興味がある。自然界における物体のカウントと比較すると、このタスクは、大規模変動、複雑な乱れ背景、配向仲裁といった要因において困難である。
これらの課題に対処するために,我々はまず,4つの重要な地理的対象を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
論文 参考訳(メタデータ) (2020-08-28T03:47:49Z) - A Multi-Level Approach to Waste Object Segmentation [10.20384144853726]
カラー画像とオプションの深度画像から廃棄物を局所化する問題に対処する。
本手法は,複数の空間的粒度レベルでの強度と深度情報を統合する。
我々は, この領域における今後の研究を促進するために, 新たなRGBD廃棄物分節MJU-Wasteを作成している。
論文 参考訳(メタデータ) (2020-07-08T16:49:25Z) - Density Map Guided Object Detection in Aerial Images [18.874882959220887]
高解像度空中画像における物体検出は,1)物体の大きさの大きな変化,2)物体の非一様分布のため,困難な課題である。
一般的な解決策は、大きな空中画像を小さな(一様)作物に分割し、それぞれの小さな作物に物体検出を適用することである。
本研究では、画像の物体密度マップが、地図の画素強度の点で分布する方法を示すという観察から着想を得た、密度マップガイドオブジェクト検出ネットワーク(DMNet)を提案する。
論文 参考訳(メタデータ) (2020-04-12T01:32:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。