論文の概要: Transfer Learning for Instance Segmentation of Waste Bottles using Mask
R-CNN Algorithm
- arxiv url: http://arxiv.org/abs/2204.07437v1
- Date: Fri, 15 Apr 2022 12:19:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 16:57:04.532752
- Title: Transfer Learning for Instance Segmentation of Waste Bottles using Mask
R-CNN Algorithm
- Title(参考訳): Mask R-CNN アルゴリズムを用いた廃棄物のインスタンス分割のための移動学習
- Authors: Punitha Jaikumar, Remy Vandaele, Varun Ojha
- Abstract要約: プラスチックボトルは環境に深刻な脅威をもたらす主要な汚染物質の一つである。
ボトルの自動識別と分離は、プラスチック廃棄物のリサイクルを促進することができる。
提案手法は,Microsoft COCOデータセット上で事前学習したMask R-CNNモデルを利用する。
- 参考スコア(独自算出の注目度): 3.3722008527102894
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper proposes a methodological approach with a transfer learning scheme
for plastic waste bottle detection and instance segmentation using the
\textit{mask region proposal convolutional neural network} (Mask R-CNN).
Plastic bottles constitute one of the major pollutants posing a serious threat
to the environment both in oceans and on land. The automated identification and
segregation of bottles can facilitate plastic waste recycling. We prepare a
custom-made dataset of 192 bottle images with pixel-by pixel-polygon annotation
for the automatic segmentation task. The proposed transfer learning scheme
makes use of a Mask R-CNN model pre-trained on the Microsoft COCO dataset. We
present a comprehensive scheme for fine-tuning the base pre-trained Mask-RCNN
model on our custom dataset. Our final fine-tuned model has achieved 59.4
\textit{mean average precision} (mAP), which corresponds to the MS COCO metric.
The results indicate a promising application of deep learning for detecting
waste bottles.
- Abstract(参考訳): 本稿では, プラスチックボトル検出のための移動学習手法と, <textit{mask region proposal convolutional neural network} (Mask R-CNN) を用いたインスタンスセグメンテーションを提案する。
プラスチックボトルは、海洋と陸両方の環境に深刻な脅威をもたらす主要な汚染物質の一つである。
ボトルの自動識別と分離はプラスチック廃棄物のリサイクルを促進する。
自動セグメンテーションタスクのための画素別多角形アノテーションによる192瓶画像のカスタムメイドデータセットを作成する。
提案手法は,Microsoft COCOデータセット上で事前学習したMask R-CNNモデルを利用する。
本稿では,学習済みのMask-RCNNモデルをカスタムデータセット上で微調整するための総合的なスキームを提案する。
最後の微調整モデルは,MS COCO測定値に対応する59.4 \textit{mean average precision} (mAP)を達成した。
その結果, 廃棄物ボトル検出における深層学習の有望な応用が示唆された。
関連論文リスト
- Towards Natural Image Matting in the Wild via Real-Scenario Prior [69.96414467916863]
我々は,COCOデータセット,すなわちCOCO-Mattingに基づく新しいマッチングデータセットを提案する。
構築されたCOCO-Mattingは、複雑な自然シナリオにおける38,251人のインスタンスレベルのアルファマットの広範なコレクションを含む。
ネットワークアーキテクチャにおいて、提案する特徴整合変換器は、きめ細かいエッジと透過性を抽出することを学ぶ。
提案したマットアライメントデコーダは、マット固有のオブジェクトを分割し、粗いマスクを高精度なマットに変換することを目的としている。
論文 参考訳(メタデータ) (2024-10-09T06:43:19Z) - WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks [7.775894876221921]
ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。
次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
論文 参考訳(メタデータ) (2024-09-25T15:04:21Z) - Synthetic dual image generation for reduction of labeling efforts in semantic segmentation of micrographs with a customized metric function [0.0]
材料分析のためのセマンティックセグメンテーションモデルの訓練には、マイクログラフとそれに対応するマスクが必要である。
マスクと組み合わせた合成微細構造画像の生成による意味的セグメンテーションモデルの改善のためのワークフローを実証する。
このアプローチは、少数の実画像を持つモデルをトレーニングするためのユーザフレンドリなソリューションとして機能するなど、さまざまな種類の画像データに一般化することができる。
論文 参考訳(メタデータ) (2024-08-01T16:54:11Z) - Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。
両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。
転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-10-10T10:48:52Z) - Filter Pruning for Efficient CNNs via Knowledge-driven Differential
Filter Sampler [103.97487121678276]
フィルタプルーニングは同時に計算を加速し、CNNのメモリオーバーヘッドを低減する。
本稿では,MFM(Masked Filter Modeling)フレームワークを用いた知識駆動型微分フィルタサンプリング(KDFS)を提案する。
論文 参考訳(メタデータ) (2023-07-01T02:28:41Z) - SdAE: Self-distillated Masked Autoencoder [95.3684955370897]
本稿では,自己蒸留マスク付きオートエンコーダネットワークSdAEを提案する。
300エポックの事前トレーニングで、バニラViT-BaseモデルはImageNet-1k分類において84.1%の微調整精度を達成する。
論文 参考訳(メタデータ) (2022-07-31T15:07:25Z) - Multiscale Convolutional Transformer with Center Mask Pretraining for
Hyperspectral Image Classificationtion [14.33259265286265]
本稿では,空間スペクトル情報の効率的な抽出を実現するために,高スペクトル画像(HSI)のための高速多スケール畳み込みモジュールを提案する。
マスクオートエンコーダと同様に、我々の事前学習法は、エンコーダ内の中央画素の対応するトークンのみをマスクし、残りのトークンをデコーダに入力し、中央画素のスペクトル情報を再構成する。
論文 参考訳(メタデータ) (2022-03-09T14:42:26Z) - Domestic waste detection and grasping points for robotic picking up [0.0]
本稿では,位置とロボットの把握に応用したAIシステムを提案する。
リサイクル戦略を改善するため, 廃棄物をグループに分類することを目的とする。
論文 参考訳(メタデータ) (2021-05-14T13:37:33Z) - Recyclable Waste Identification Using CNN Image Recognition and Gaussian
Clustering [2.072259480917207]
本稿では,両タスクを補完する畳み込みニューラルネットワーク(CNN)モデルを提案する。
モデル全体の検出率は48.4%で、最終分類精度は92.4%である。
論文 参考訳(メタデータ) (2020-11-02T22:26:25Z) - LevelSet R-CNN: A Deep Variational Method for Instance Segmentation [79.20048372891935]
現在、多くのアートモデルはMask R-CNNフレームワークに基づいている。
本稿では,両世界の長所を結合したR-CNNを提案する。
我々はCOCOおよびCityscapesデータセットに対するアプローチの有効性を示す。
論文 参考訳(メタデータ) (2020-07-30T17:52:18Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。