論文の概要: Counting from Sky: A Large-scale Dataset for Remote Sensing Object
Counting and A Benchmark Method
- arxiv url: http://arxiv.org/abs/2008.12470v1
- Date: Fri, 28 Aug 2020 03:47:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-24 02:15:04.829109
- Title: Counting from Sky: A Large-scale Dataset for Remote Sensing Object
Counting and A Benchmark Method
- Title(参考訳): 空からのカウント: リモートセンシング対象カウントのための大規模データセットとベンチマーク手法
- Authors: Guangshuai Gao and Qingjie Liu and Yunhong Wang
- Abstract要約: リモートセンシング画像から高密度物体をカウントすることに興味がある。自然界における物体のカウントと比較すると、このタスクは、大規模変動、複雑な乱れ背景、配向仲裁といった要因において困難である。
これらの課題に対処するために,我々はまず,4つの重要な地理的対象を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
- 参考スコア(独自算出の注目度): 52.182698295053264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object counting, whose aim is to estimate the number of objects from a given
image, is an important and challenging computation task. Significant efforts
have been devoted to addressing this problem and achieved great progress, yet
counting the number of ground objects from remote sensing images is barely
studied. In this paper, we are interested in counting dense objects from remote
sensing images. Compared with object counting in a natural scene, this task is
challenging in the following factors: large scale variation, complex cluttered
background, and orientation arbitrariness. More importantly, the scarcity of
data severely limits the development of research in this field. To address
these issues, we first construct a large-scale object counting dataset with
remote sensing images, which contains four important geographic objects:
buildings, crowded ships in harbors, large-vehicles and small-vehicles in
parking lots. We then benchmark the dataset by designing a novel neural network
that can generate a density map of an input image. The proposed network
consists of three parts namely attention module, scale pyramid module and
deformable convolution module to attack the aforementioned challenging factors.
Extensive experiments are performed on the proposed dataset and one crowd
counting datset, which demonstrate the challenges of the proposed dataset and
the superiority and effectiveness of our method compared with state-of-the-art
methods.
- Abstract(参考訳): 与えられた画像からオブジェクトの数を推定することを目的としたオブジェクトカウントは、重要かつ困難な計算タスクである。
この問題に取り組み、大きな進歩を遂げてきたが、リモートセンシング画像からの地上物体の数を数えることはほとんど研究されていない。
本稿では,リモートセンシング画像から高密度物体を数えることに興味がある。
自然界における対象数と比較すると,この課題は,大規模変動,複雑な乱雑な背景,配向の任意性といった要因において困難である。
さらに重要なことに、データの不足はこの分野の研究の発展を厳しく制限している。
これらの問題に対処するために,我々はまず,建物,港内の混み合った船,大型車,駐車場内の小車という,4つの重要な地理的物体を含むリモートセンシング画像を用いた大規模オブジェクトカウントデータセットを構築した。
次に,入力画像の密度マップを生成する新たなニューラルネットワークを設計することで,データセットのベンチマークを行う。
提案するネットワークはアテンションモジュール,スケールピラミッドモジュール,変形可能な畳み込みモジュールの3つの部分から構成され,上記の課題を克服する。
提案したデータセットと1つの群集カウントダットセットを用いて大規模な実験を行い,提案したデータセットの課題と,最先端手法と比較した手法の優位性と有効性を示した。
関連論文リスト
- Local Occupancy-Enhanced Object Grasping with Multiple Triplanar Projection [24.00828999360765]
本稿では,一般的な物体をロボットでつかむという課題に対処する。
提案したモデルはまず、シーン内で最も可能性の高いいくつかの把握ポイントを提案する。
各グリップポイントの周囲に、モジュールはその近傍にある任意のボクセルが空か、ある物体に占有されているかを推測するように設計されている。
モデルはさらに、局所占有力向上した物体形状情報を利用して、6-DoFグリップポーズを推定する。
論文 参考訳(メタデータ) (2024-07-22T16:22:28Z) - Contrastive Lift: 3D Object Instance Segmentation by Slow-Fast
Contrastive Fusion [110.84357383258818]
本稿では,2次元セグメントを3次元に上げ,ニューラルネットワーク表現を用いて融合させる新しい手法を提案する。
このアプローチの中核は、高速なクラスタリング目的関数であり、多数のオブジェクトを持つシーンにスケーラブルで適しています。
我々のアプローチは、ScanNet、Hypersim、Replicaのデータセットからの挑戦的なシーンにおいて、最先端の状況よりも優れています。
論文 参考訳(メタデータ) (2023-06-07T17:57:45Z) - Progressive Domain Adaptation with Contrastive Learning for Object
Detection in the Satellite Imagery [0.0]
最先端のオブジェクト検出手法は、小さくて密度の高いオブジェクトを特定するのにほとんど失敗している。
本稿では,特徴抽出プロセスを改善する小型物体検出パイプラインを提案する。
未確認データセットにおけるオブジェクト識別の劣化を緩和できることを示す。
論文 参考訳(メタデータ) (2022-09-06T15:16:35Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - High-resolution Iterative Feedback Network for Camouflaged Object
Detection [128.893782016078]
カモフラージュされたオブジェクトを背景に視覚的に同化させることは、オブジェクト検出アルゴリズムにとって難しい。
エッジやバウンダリのぼやけた視界を生じさせる細部劣化を避けるために,高分解能テクスチャの詳細を抽出することを目的としている。
我々は,高解像度特徴量による低解像度表現を反復的フィードバック方式で洗練する新しいHitNetを提案する。
論文 参考訳(メタデータ) (2022-03-22T11:20:21Z) - FAIR1M: A Benchmark Dataset for Fine-grained Object Recognition in
High-Resolution Remote Sensing Imagery [21.9319970004788]
我々は,高分解能リモートセンシング画像において,100万以上のインスタンスと15,000以上の画像を含む新しいベンチマークデータセットを提案する。
FAIR1Mデータセットのすべてのオブジェクトは、指向境界ボックスによって5つのカテゴリと37のサブカテゴリに関してアノテートされます。
論文 参考訳(メタデータ) (2021-03-09T17:20:15Z) - Boundary Regularized Building Footprint Extraction From Satellite Images
Using Deep Neural Network [6.371173732947292]
本稿では,1つの衛星画像から構築事例を共同で検出し,ノイズの多い建物の境界形状を規則化する,新しいディープニューラルネットワークを提案する。
本モデルでは,オブジェクトの局所化,認識,セマンティックラベリング,幾何学的形状抽出を同時に行うことができる。
論文 参考訳(メタデータ) (2020-06-23T17:24:09Z) - JHU-CROWD++: Large-Scale Crowd Counting Dataset and A Benchmark Method [92.15895515035795]
我々は、"4,372"イメージと"1.51万"アノテーションを含む、新しい大規模非制約クラウドカウントデータセット(JHU-CROWD++)を導入する。
本稿では, 残差誤差推定により, 群集密度マップを段階的に生成する新しい群集カウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T14:59:35Z) - Counting dense objects in remote sensing images [52.182698295053264]
特定の画像から関心のあるオブジェクトの数を推定するのは、難しいが重要な作業である。
本稿では,リモートセンシング画像から高密度物体を数えることに興味がある。
これらの課題に対処するために,我々はまず,リモートセンシング画像に基づく大規模オブジェクトカウントデータセットを構築した。
次に、入力画像の密度マップを生成する新しいニューラルネットワークを設計することで、データセットをベンチマークする。
論文 参考訳(メタデータ) (2020-02-14T09:13:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。