論文の概要: Revisiting Aerial Scene Classification on the AID Benchmark
- arxiv url: http://arxiv.org/abs/2601.18263v1
- Date: Mon, 26 Jan 2026 08:39:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:08.743115
- Title: Revisiting Aerial Scene Classification on the AID Benchmark
- Title(参考訳): AIDベンチマークによる航空シーン分類の再検討
- Authors: Subhajeet Das, Susmita Ghosh, Abhiroop Chatterjee,
- Abstract要約: 本研究では,航空画像分類のための各種機械学習手法の文献レビューを行う。
私たちの調査では,手作り機能から従来のCNNまで,さまざまなアプローチをカバーしています。
また,マルチスケールな特徴融合機構を備えた空間的注意力向上CNNであるAerial-Y-Netを設計した。
- 参考スコア(独自算出の注目度): 1.529342790344802
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aerial images play a vital role in urban planning and environmental preservation, as they consist of various structures, representing different types of buildings, forests, mountains, and unoccupied lands. Due to its heterogeneous nature, developing robust models for scene classification remains a challenge. In this study, we conduct a literature review of various machine learning methods for aerial image classification. Our survey covers a range of approaches from handcrafted features (e.g., SIFT, LBP) to traditional CNNs (e.g., VGG, GoogLeNet), and advanced deep hybrid networks. In this connection, we have also designed Aerial-Y-Net, a spatial attention-enhanced CNN with multi-scale feature fusion mechanism, which acts as an attention-based model and helps us to better understand the complexities of aerial images. Evaluated on the AID dataset, our model achieves 91.72% accuracy, outperforming several baseline architectures.
- Abstract(参考訳): 航空画像は、様々なタイプの建物、森林、山、無人地を象徴する様々な構造から成り立っているため、都市計画や環境保全において重要な役割を担っている。
不均一な性質のため、シーン分類のための堅牢なモデルの開発は依然として課題である。
本研究では,航空画像分類のための各種機械学習手法の文献レビューを行う。
本調査では,手作り機能(SIFT, LBPなど)から従来のCNN(VGG, GoogLeNetなど),先進的なディープハイブリッドネットワークまで,さまざまなアプローチについて検討した。
また,Aerial-Y-Netを設計した。これは多次元特徴融合機構を備えた空間的注意力向上CNNで,アテンションベースモデルとして機能し,空中画像の複雑さをよりよく理解するのに役立つ。
AIDデータセットに基づいて評価し、91.72%の精度を実現し、いくつかのベースラインアーキテクチャを上回った。
関連論文リスト
- SASP: Strip-Aware Spatial Perception for Fine-Grained Bird Image Classification [5.420786129061269]
本稿では,ストリップ認識型空間知覚に基づく細粒度鳥の画像分類フレームワークを提案する。
提案手法は, 拡張知覚アグリゲータ (EPA) とチャネルセマンティックウィービング (CSW) の2つの新しいモジュールを含む。
ResNet-50のバックボーン上に構築されたこのモデルは、空間領域を越えて拡張された構造的特徴のジャンプワイズ接続を可能にする。
論文 参考訳(メタデータ) (2025-05-30T09:10:12Z) - Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - AerialVG: A Challenging Benchmark for Aerial Visual Grounding by Exploring Positional Relations [51.44608822712786]
ビジュアルグラウンドイングは、自然言語記述に基づいたイメージ内のターゲットオブジェクトのローカライズを目的としている。
AerialVGは、例えば外見に基づく接地は、複数の視覚的に類似した物体を識別するには不十分である。
5Kの空中画像,50Kの注釈付き記述,103Kのオブジェクトからなる,最初のAerialVGデータセットを紹介した。
論文 参考訳(メタデータ) (2025-04-10T15:13:00Z) - Hierarchical Information Flow for Generalized Efficient Image Restoration [108.83750852785582]
画像復元のための階層型情報フロー機構であるHi-IRを提案する。
Hi-IRは、劣化した画像を表す階層的な情報ツリーを3段階にわたって構築する。
7つの共通画像復元タスクにおいて、Hi-IRはその有効性と一般化性を達成する。
論文 参考訳(メタデータ) (2024-11-27T18:30:08Z) - EcoCropsAID: Economic Crops Aerial Image Dataset for Land Use Classification [0.0]
EcoCropsAIDデータセットは、2014年から2018年の間にGoogle Earthアプリケーションを使って撮影された5,400枚の空中画像の包括的なコレクションである。
このデータセットは、タイの5つの主要な経済作物、米、サトウキビ、キャッサバ、ゴム、ロングランに焦点を当てている。
論文 参考訳(メタデータ) (2024-11-05T03:14:36Z) - UW-SDF: Exploiting Hybrid Geometric Priors for Neural SDF Reconstruction from Underwater Multi-view Monocular Images [63.32490897641344]
ニューラルSDFに基づく多視点水中画像から対象物を再構成するフレームワークを提案する。
再建過程を最適化するためのハイブリッドな幾何学的先行手法を導入し、神経SDF再建の質と効率を著しく向上させる。
論文 参考訳(メタデータ) (2024-10-10T16:33:56Z) - Diffusion Model Based Visual Compensation Guidance and Visual Difference Analysis for No-Reference Image Quality Assessment [78.21609845377644]
本稿では, 複雑な関係をモデル化する能力を示す, 最先端(SOTA)生成モデルを提案する。
生成した拡張画像とノイズを含む画像を利用する新しい拡散復元ネットワークを考案する。
2つの視覚評価枝は、得られた高レベル特徴情報を包括的に解析するように設計されている。
論文 参考訳(メタデータ) (2024-02-22T09:39:46Z) - Towards Geospatial Foundation Models via Continual Pretraining [22.825065739563296]
資源コストと炭素の影響を最小限に抑えた高効率基礎モデルを構築するための新しいパラダイムを提案する。
まず、複数のソースからコンパクトだが多様なデータセットを構築し、GeoPileと呼ぶ特徴の多様性を促進する。
次に,大規模なImageNet-22kモデルからの継続事前学習の可能性について検討し,多目的連続事前学習パラダイムを提案する。
論文 参考訳(メタデータ) (2023-02-09T07:39:02Z) - Flood Extent Mapping based on High Resolution Aerial Imagery and DEM: A
Hidden Markov Tree Approach [10.72081512622396]
本稿では,高分解能空中画像のケーススタディにより,提案した地理的隠れマルコフ木モデルを評価する。
2016年のハリケーン・マシューの洪水で、ノースカロライナ州グリムズランド市とキンストン市の近くで、3つのシーンが植林された洪水原で選ばれた。
その結果,提案した隠れマルコフ木モデルは,機械学習アルゴリズムのいくつかの状態よりも優れていた。
論文 参考訳(メタデータ) (2020-08-25T18:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。