論文の概要: The Garbage Dataset (GD): A Multi-Class Image Benchmark for Automated Waste Segregation
- arxiv url: http://arxiv.org/abs/2602.10500v1
- Date: Wed, 11 Feb 2026 04:01:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-12 21:44:01.454686
- Title: The Garbage Dataset (GD): A Multi-Class Image Benchmark for Automated Waste Segregation
- Title(参考訳): ごみ自動分離のためのマルチクラス画像ベンチマーク(GD)
- Authors: Suman Kunwar,
- Abstract要約: データセットは、DWasteモバイルアプリやキュレートされたWebソースなど、複数の方法で収集された13,348のラベル付きイメージで構成されている。
データセットは最先端のディープラーニングモデルを使用してベンチマークされた。
実験の結果、効率の良いNetV2Sは96.19%の精度と0.96F1スコアで最高性能を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study introduces the Garbage Dataset (GD), a publicly available image dataset designed to advance automated waste segregation through machine learning and computer vision. It's a diverse dataset covering 10 common household waste categories: metal, glass, biological, paper, battery, trash, cardboard, shoes, clothes, and plastic. The dataset comprises 13,348 labeled images collected through multiple methods, including DWaste mobile app and curated web sources. Methods included rigorous validation through checksums and outlier detection, analysis of class imbalance and visual separability via PCA/t-SNE, and assessment of background complexity using entropy and saliency measures. The dataset was benchmarked using state-of-the-art deep learning models (EfficientNetV2M, EfficientNetV2S, MobileNet, ResNet50, ResNet101) evaluated on performance metrics and operational carbon emissions. Experiment results indicate EfficientNetV2S achieved the highest performance with 96.19% accuracy and a 0.96 F1-score, though with a moderate carbon cost. Analysis revealed inherent dataset characteristics including class imbalance, a skew toward high-outlier classes (plastic, cardboard, paper), and brightness variations that require consideration. The main conclusion is that GD provides a valuable, real-world benchmark for waste classification research while highlighting important challenges such as class imbalance, background complexity, and environmental trade-offs in model selection that must be addressed for practical deployment. The dataset is publicly released to support further research in environmental sustainability applications.
- Abstract(参考訳): 本研究は,機械学習とコンピュータビジョンによる自動廃棄物分離を促進するために設計された,公開画像データセットであるGarbage Dataset(GD)を紹介する。
それは、金属、ガラス、生物、紙、バッテリー、ゴミ、段ボール、靴、服、プラスチックの10種類の一般的な家庭用廃棄物をカバーした、多様なデータセットです。
データセットは、DWasteモバイルアプリやキュレートされたWebソースなど、複数の方法で収集された13,348のラベル付きイメージで構成されている。
PCA/t-SNEによるクラス不均衡と視覚的分離性の分析,エントロピーおよびサリエンシ測定による背景複雑性の評価などであった。
データセットは最先端のディープラーニングモデル(EfficientNetV2M、EfficientNetV2S、MobileNet、ResNet50、ResNet101)を使用してベンチマークされ、パフォーマンスメトリクスと運転二酸化炭素排出量に基づいて評価された。
実験の結果、効率の良いNetV2Sは96.19%の精度と0.96F1スコアで最高性能を達成した。
分析の結果、クラス不均衡、高出力クラス(プラスチック、段ボール、紙)へのスキュー、考慮を要する明るさの変動など固有のデータセット特性が明らかになった。
主な結論は、GDは、クラス不均衡、背景の複雑さ、実践的な展開のために対処しなければならないモデル選択における環境トレードオフといった重要な課題を強調しながら、廃棄物分類研究のための価値ある実世界のベンチマークを提供するということである。
データセットは、環境サステナビリティアプリケーションに関するさらなる研究をサポートするために、一般公開されている。
関連論文リスト
- GlobalWasteData: A Large-Scale, Integrated Dataset for Robust Waste Classification and Environmental Monitoring [5.4998857381465465]
GWD(GlobalWasteData)アーカイブは,14のカテゴリにまたがる89,807イメージの大規模データセットである。
このGWDアーカイブは、一貫性のあるラベル付け、ドメインの多様性の改善、よりバランスの取れたクラス表現を提供する。
全体として、このデータセットは、環境モニタリング、リサイクル自動化、廃棄物の識別において、機械学習(ML)アプリケーションのための強力な基盤を提供する。
論文 参考訳(メタデータ) (2026-02-07T09:36:39Z) - Hybrid Synthetic Data Generation with Domain Randomization Enables Zero-Shot Vision-Based Part Inspection Under Extreme Class Imbalance [3.7696918637188817]
堅牢な機械学習モデルのトレーニングには、大量の高品質なラベル付きデータが必要である。
欠陥サンプルは本質的に稀であり、モデル性能を低下させる深刻なクラス不均衡を引き起こす。
合成データ生成は、大きく、バランスよく、完全に注釈付けされたデータセットの作成を可能にすることで、有望なソリューションを提供する。
論文 参考訳(メタデータ) (2025-11-28T05:30:49Z) - Textile Analysis for Recycling Automation using Transfer Learning and Zero-Shot Foundation Models [6.932314083921248]
本稿では, 標準RGB画像, コスト効率のよいセンシングモダリティを, 自動化システムにおける重要な前処理タスクに利用することを検討する。
本稿では,コンベアベルト構成のためのコンピュータビジョンコンポーネントについて,(a)4種類の一般的な織物の分類と,(b)ボタンやジッパーなどの非繊維の特徴のセグメンテーションを行う。
論文 参考訳(メタデータ) (2025-06-06T22:49:53Z) - Unsupervised Waste Classification By Dual-Encoder Contrastive Learning and Multi-Clustering Voting (DECMCV) [9.828020457690688]
本研究では,マルチクラスタリング投票(DECMCV)を用いた新しい教師なし手法であるデュアルエンコーダコントラスト学習を提案する。
実際の4,169枚の廃画像のデータセットでは、数千の正確なラベル付けを行うには50個のラベル付きサンプルが必要であり、教師付きモデルと比較して分類精度は29.85%向上した。
論文 参考訳(メタデータ) (2025-03-04T03:31:01Z) - Advancing Recycling Efficiency: A Comparative Analysis of Deep Learning Models in Waste Classification [0.0]
本研究は, 各種深層学習モデルの解析により, リサイクルにおける廃棄物分類の押し付け問題に取り組む。
以上の結果から, 複雑な廃棄物カテゴリの精度が著しく向上することが示唆された。
この研究は, 多カテゴリー廃棄物リサイクルの今後の発展への道を開くものである。
論文 参考訳(メタデータ) (2024-11-05T03:44:54Z) - Benchmarking Zero-Shot Robustness of Multimodal Foundation Models: A Pilot Study [61.65123150513683]
CLIPのようなマルチモーダル基盤モデルは、最先端のゼロショット結果を生成する。
これらのモデルは、ImageNetでトレーニングされた教師付きモデルのパフォーマンスを一致させることで、ロバスト性ギャップを埋めることが報告されている。
CLIPは、ベンチマーク上の教師付きImageNetモデルと比較して、かなりの堅牢性低下をもたらすことを示す。
論文 参考訳(メタデータ) (2024-03-15T17:33:49Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Intrinsic Self-Supervision for Data Quality Audits [35.69673085324971]
コンピュータビジョンにおけるベンチマークデータセットは、しばしば、オフトピック画像、ほぼ重複、ラベルエラーを含む。
本稿では,データクリーニングの課題を再考し,ランキング問題やスコアリング問題として定式化する。
文脈認識型自己教師型表現学習と距離に基づく指標の組み合わせは, 適応バイアスのない問題発見に有効であることがわかった。
論文 参考訳(メタデータ) (2023-05-26T15:57:04Z) - ZeroWaste Dataset: Towards Automated Waste Recycling [51.053682077915546]
産業レベルの廃棄物検出・分別データセットZeroWasteについて述べる。
このデータセットには、実際の廃棄物処理工場から収集された1800以上のビデオフレームが含まれている。
最先端のセグメンテーション手法では,対象物を正しく検出・分類することが困難であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:17:09Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - GraspNet: A Large-Scale Clustered and Densely Annotated Dataset for
Object Grasping [49.777649953381676]
我々は,統合評価システムを用いた大規模グリップポーズ検出データセットに貢献する。
データセットには87,040枚のRGBD画像と3億7000万枚以上のグリップポーズが含まれている。
論文 参考訳(メタデータ) (2019-12-31T18:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。