論文の概要: New Benchmark for Household Garbage Image Recognition
- arxiv url: http://arxiv.org/abs/2202.11878v1
- Date: Thu, 24 Feb 2022 03:07:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 16:57:07.542950
- Title: New Benchmark for Household Garbage Image Recognition
- Title(参考訳): 家庭用ゴミ画像認識のための新しいベンチマーク
- Authors: Zhize Wu, Huanyi Li, Xiaofeng Wang, Zijun Wu, Le Zou, Lixiang Xu, and
Ming Tan
- Abstract要約: 我々は、異なる照明、背景、角度、形状をシミュレートすることで、家庭用ゴミ画像分類のための新しいベンチマークデータセットを構築した。
このデータセットはHGI-30(30 Classes of Household Garbage Images)と名付けられ、30世帯のごみの18,000枚の画像を含んでいる。
- 参考スコア(独自算出の注目度): 6.304975225537251
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Household garbage images are usually faced with complex backgrounds, variable
illuminations, diverse angles, and changeable shapes, which bring a great
difficulty in garbage image classification. Due to the ability to discover
problem-specific features, deep learning and especially convolutional neural
networks (CNNs) have been successfully and widely used for image representation
learning. However, available and stable household garbage datasets are
insufficient, which seriously limits the development of research and
application. Besides, the state of the art in the field of garbage image
classification is not entirely clear. To solve this problem, in this study, we
built a new open benchmark dataset for household garbage image classification
by simulating different lightings, backgrounds, angles, and shapes. This
dataset is named 30 Classes of Household Garbage Images (HGI-30), which
contains 18,000 images of 30 household garbage classes. The publicly available
HGI-30 dataset allows researchers to develop accurate and robust methods for
household garbage recognition. We also conducted experiments and performance
analysis of the state-of-the-art deep CNN methods on HGI-30, which serves as
baseline results on this benchmark.
- Abstract(参考訳): ごみ画像は, 複雑な背景, 多様な照度, 多様な角度, 変化可能な形状に面しており, ゴミ画像の分類が困難である。
問題特有の特徴の発見能力により、ディープラーニングと特に畳み込みニューラルネットワーク(cnns)は、画像表現学習に成功し、広く利用されている。
しかし、利用可能な、安定した家庭用のガベージデータセットは不十分であり、研究やアプリケーションの開発を著しく制限している。
さらに、ゴミ画像分類の分野における技術の現状は、完全には明確ではない。
そこで本研究では, 異なる照明, 背景, 角度, 形状をシミュレートして, ごみ画像分類のための新しいオープンベンチマークデータセットを構築した。
このデータセットはHGI-30(30 Classes of Household Garbage Images)と名付けられ、30世帯のごみの18,000枚の画像を含んでいる。
公開されているHGI-30データセットにより、研究者は家庭用ごみ認識のための正確で堅牢な方法を開発することができる。
また,本ベンチマークのベースラインとなるhgi-30における最先端深層cnn法の実験と性能解析を行った。
関連論文リスト
- GRIN: Zero-Shot Metric Depth with Pixel-Level Diffusion [27.35300492569507]
本稿では,非構造化トレーニングデータを取り込むための効率的な拡散モデルGRINを提案する。
GRINは,ゼロショット距離単眼深度推定において,スクラッチからトレーニングした場合でも,新たな技術の確立を図っている。
論文 参考訳(メタデータ) (2024-09-15T23:32:04Z) - The identification of garbage dumps in the rural areas of Cyprus through
the application of deep learning to satellite imagery [0.0]
本研究の目的は,キプロスの農村部における不法ゴミ捨て場を特定するために,人工知能技術がどの程度活用できるかを検討することである。
これには、ゴミを含むか含まないかのどちらかに分類される可能性のある、新しい画像のデータセットの収集が含まれていた。
ニューラルネットワークは、新しい画像におけるゴミの有無を認識するために訓練された。
論文 参考訳(メタデータ) (2023-07-23T05:24:20Z) - Exploring Incompatible Knowledge Transfer in Few-shot Image Generation [107.81232567861117]
少ないショット画像生成は、いくつかの参照サンプルを使用して、ターゲットドメインから多彩で高忠実な画像を生成することを学習する。
既存のF SIGメソッドは、ソースジェネレータから事前の知識を選択し、保存し、転送し、ターゲットジェネレータを学習する。
本稿では,知識保存を補完する操作であり,軽量プルーニング方式で実装した知識トランケーションを提案する。
論文 参考訳(メタデータ) (2023-04-15T14:57:15Z) - Deep Image Deblurring: A Survey [165.32391279761006]
低レベルのコンピュータビジョンにおいて、デブロアリングは古典的な問題であり、ぼやけた入力画像からシャープなイメージを復元することを目的としている。
近年のディープラーニングの進歩は、この問題の解決に大きな進歩をもたらした。
論文 参考訳(メタデータ) (2022-01-26T01:31:30Z) - Sci-Net: a Scale Invariant Model for Building Detection from Aerial
Images [0.0]
本研究では,空間分解能の異なる空間画像に存在している建物を分割できるスケール不変ニューラルネットワーク(Sci-Net)を提案する。
具体的には,U-Netアーキテクチャを改良し,それを高密度なASPP(Atrous Space Pyramid Pooling)で融合し,微細なマルチスケール表現を抽出した。
論文 参考訳(メタデータ) (2021-11-12T16:45:20Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Low-Rank Subspaces in GANs [101.48350547067628]
この研究は、GAN生成をより正確に制御できる低ランクな部分空間を導入している。
LowRankGAN は属性多様体の低次元表現を見つけることができる。
さまざまなデータセットでトレーニングされた最先端のGANモデル(StyleGAN2やBigGANなど)の実験は、私たちのLowRankGANの有効性を示しています。
論文 参考訳(メタデータ) (2021-06-08T16:16:32Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - An Efficient Framework for Zero-Shot Sketch-Based Image Retrieval [36.254157442709264]
ゼロショットのSketchベースのImage Retrieval (ZS-SBIR)は、現実のアプリケーションであるため、コンピュータビジョンコミュニティの注目を集めている。
ZS-SBIRは、コンテンツベースの画像検索(CBIR)、ゼロショット学習、ドメイン適応など、複数のコンピュータビジョン問題の主な課題を継承する。
論文 参考訳(メタデータ) (2021-02-08T06:10:37Z) - An Evolution of CNN Object Classifiers on Low-Resolution Images [0.4129225533930965]
低画質画像からのオブジェクト分類は、対象色、アスペクト比、乱れ背景のばらつきに対して困難である。
深層畳み込みニューラルネットワーク(DCNN)は、高解像度画像からオブジェクト分類の課題に直面する非常に強力なシステムとして実証されています。
本稿では,DCNNアーキテクチャを用いて低品質画像を正確に分類する最適アーキテクチャについて検討する。
論文 参考訳(メタデータ) (2021-01-03T18:44:23Z) - GraspNet: A Large-Scale Clustered and Densely Annotated Dataset for
Object Grasping [49.777649953381676]
我々は,統合評価システムを用いた大規模グリップポーズ検出データセットに貢献する。
データセットには87,040枚のRGBD画像と3億7000万枚以上のグリップポーズが含まれている。
論文 参考訳(メタデータ) (2019-12-31T18:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。