論文の概要: Automated Landfill Detection Using Deep Learning: A Comparative Study of Lightweight and Custom Architectures with the AerialWaste Dataset
- arxiv url: http://arxiv.org/abs/2508.18315v1
- Date: Sat, 23 Aug 2025 19:52:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.519087
- Title: Automated Landfill Detection Using Deep Learning: A Comparative Study of Lightweight and Custom Architectures with the AerialWaste Dataset
- Title(参考訳): 深層学習を用いた埋立処分自動検知:軽量・カスタムアーキテクチャとエアリアルウォーターデータセットの比較検討
- Authors: Nowshin Sharmily, Rusab Sarmun, Muhammad E. H. Chowdhury, Mir Hamidul Hussain, Saad Bin Abul Kashem, Molla E Majid, Amith Khandakar,
- Abstract要約: AerialWasteデータセットは、イタリアのロンバルディア地方の10434枚の画像の大規模なコレクションである。
ディープラーニングモデルを使用して、データセットをトレーニングし、検証した。
バイナリ分類は92.33%の精度、92.67%の精度、92.33%の感度、92.41%のF1スコア、92.71%の特異性を持つ。
- 参考スコア(独自算出の注目度): 7.803636044185931
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Illegal landfills are posing as a hazardous threat to people all over the world. Due to the arduous nature of manually identifying the location of landfill, many landfills go unnoticed by authorities and later cause dangerous harm to people and environment. Deep learning can play a significant role in identifying these landfills while saving valuable time, manpower and resources. Despite being a burning concern, good quality publicly released datasets for illegal landfill detection are hard to find due to security concerns. However, AerialWaste Dataset is a large collection of 10434 images of Lombardy region of Italy. The images are of varying qualities, collected from three different sources: AGEA Orthophotos, WorldView-3, and Google Earth. The dataset contains professionally curated, diverse and high-quality images which makes it particularly suitable for scalable and impactful research. As we trained several models to compare results, we found complex and heavy models to be prone to overfitting and memorizing training data instead of learning patterns. Therefore, we chose lightweight simpler models which could leverage general features from the dataset. In this study, Mobilenetv2, Googlenet, Densenet, MobileVit and other lightweight deep learning models were used to train and validate the dataset as they achieved significant success with less overfitting. As we saw substantial improvement in the performance using some of these models, we combined the best performing models and came up with an ensemble model. With the help of ensemble and fusion technique, binary classification could be performed on this dataset with 92.33% accuracy, 92.67% precision, 92.33% sensitivity, 92.41% F1 score and 92.71% specificity.
- Abstract(参考訳): 不法な埋立地は世界中の人々に有害な脅威となっている。
手動で埋め立て場所を特定するという困難な性質のため、多くの埋め立て地は当局に気付かれず、後に人や環境に危害を与えている。
深層学習は、貴重な時間、人力、資源を節約しながら、これらの埋立地を特定する上で重要な役割を果たす。
燃える懸念にもかかわらず、不正な埋立地検出のための高品質な公開データセットは、セキュリティ上の懸念のために見つからない。
しかし、AerialWaste Datasetはイタリアのロンバルディア地方の10434枚の画像の大規模なコレクションである。
画像は、AGEA Orthophotos、WorldView-3、Google Earthの3つの異なるソースから収集された様々な品質である。
このデータセットには、プロフェッショナルにキュレーションされた多彩で高品質な画像が含まれており、特にスケーラブルでインパクトのある研究に適している。
結果を比較するためにいくつかのモデルをトレーニングした結果、学習パターンではなく、トレーニングデータを過度に適合させ、記憶する複雑なモデルや重いモデルを見つけました。
そこで我々は,データセットから一般的な特徴を活用可能な,軽量な簡易モデルを選択した。
本研究では、データセットのトレーニングと検証にMobilenetv2、Googlenet、Densenet、MobileVitなどの軽量ディープラーニングモデルを使用して、オーバーフィッティングを減らして大きな成功を収めた。
これらのモデルのいくつかを使用して性能が大幅に向上したのを見て、最高のパフォーマンスモデルを組み合わせて、アンサンブルモデルを考え出した。
アンサンブルと融合法の助けを借りて、92.33%の精度、92.67%の精度、92.33%の感度、92.41%のF1スコア、92.71%の特異性でバイナリ分類を行うことができた。
関連論文リスト
- AerialMegaDepth: Learning Aerial-Ground Reconstruction and View Synthesis [57.249817395828174]
本研究では,3次元都市規模のメッシュからの擬似合成レンダリングと,実地レベルでのクラウドソース画像を組み合わせたスケーラブルなフレームワークを提案する。
擬似合成データは、幅広い空中視点をシミュレートする一方、実際のクラウドソース画像は、地上レベルの画像の視覚的忠実度を改善するのに役立つ。
このハイブリッドデータセットを使用して、いくつかの最先端のアルゴリズムを微調整し、実世界のゼロショット地上作業において大幅な改善を実現する。
論文 参考訳(メタデータ) (2025-04-17T17:57:05Z) - Community Forensics: Using Thousands of Generators to Train Fake Image Detectors [15.166026536032142]
AI生成画像を検出する上で重要な課題の1つは、これまで目に見えない生成モデルによって作成された画像を見つけることである。
従来よりも大きく,多様である新しいデータセットを提案する。
得られたデータセットには、4803の異なるモデルからサンプリングされた2.7Mイメージが含まれている。
論文 参考訳(メタデータ) (2024-11-06T18:59:41Z) - An evaluation of Deep Learning based stereo dense matching dataset shift
from aerial images and a large scale stereo dataset [2.048226951354646]
そこで本研究では,光検出・ランドング(LiDAR)と画像から直接地中不均質マップを生成する手法を提案する。
多様なシーンタイプ、画像解像度、幾何学的構成を持つデータセット間の11の密マッチング手法を評価した。
論文 参考訳(メタデータ) (2024-02-19T20:33:46Z) - Large-scale Weakly Supervised Learning for Road Extraction from
Satellite Imagery [9.28701721082481]
本稿では,OpenStreetMapの道路データを弱いラベルや大規模衛星画像として活用して,事前学習セマンティックセグメンテーションモデルを提案する。
私たちのモデルは、広く使われているDeepGlobeロードデータセットの最大100倍のデータを使用し、現在のDeepGlobeリーダーボードのトップパフォーマーを超えています。
論文 参考訳(メタデータ) (2023-09-14T16:16:57Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - Vision Models Are More Robust And Fair When Pretrained On Uncurated
Images Without Supervision [38.22842778742829]
差別的な自己教師型学習は、インターネット画像の任意のランダムなグループでのトレーニングモデルを可能にする。
データ前処理や事前の仮定なしで、何十億ものランダムなイメージでモデルをトレーニングします。
フェアネス、分布シフト、地理的多様性、微粒化認識、画像コピー検出、および多くの画像分類データセットを含む50以上のベンチマークにおいて、我々のモデル性能を広範囲に研究し、検証した。
論文 参考訳(メタデータ) (2022-02-16T22:26:47Z) - A Novel Disaster Image Dataset and Characteristics Analysis using
Attention Model [2.1473182295633224]
このデータセットには、火災、水、陸の3つの異なる災害のために様々なソースから収集された画像が含まれている。
このデータセットには13,720の注釈付き画像があり、各画像は3人の個人によって注釈付けされている。
3層アテンションモデル(TLAM)をトレーニングし、平均5倍の検証精度95.88%を達成する。
論文 参考訳(メタデータ) (2021-07-02T21:18:20Z) - Hidden Biases in Unreliable News Detection Datasets [60.71991809782698]
データ収集中の選択バイアスがデータセットの望ましくないアーティファクトにつながることを示す。
クリーンスプリットでテストされたすべてのモデルに対して,列車/テストソースの重なりが無く,精度が大幅に低下した(>10%)。
将来的なデータセット生成には、困難/バイアスプローブとしての単純なモデルと、クリーンな非重複サイトと日付分割を使用する将来のモデル開発が含まれることを提案する。
論文 参考訳(メタデータ) (2021-04-20T17:16:41Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - GraspNet: A Large-Scale Clustered and Densely Annotated Dataset for
Object Grasping [49.777649953381676]
我々は,統合評価システムを用いた大規模グリップポーズ検出データセットに貢献する。
データセットには87,040枚のRGBD画像と3億7000万枚以上のグリップポーズが含まれている。
論文 参考訳(メタデータ) (2019-12-31T18:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。