論文の概要: SpectralWaste Dataset: Multimodal Data for Waste Sorting Automation
- arxiv url: http://arxiv.org/abs/2403.18033v1
- Date: Tue, 26 Mar 2024 18:39:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 21:14:58.270522
- Title: SpectralWaste Dataset: Multimodal Data for Waste Sorting Automation
- Title(参考訳): SpectralWaste Dataset: 廃棄物ソーティング自動化のためのマルチモーダルデータ
- Authors: Sara Casao, Fernando Peña, Alberto Sabater, Rosa Castillón, Darío Suárez, Eduardo Montijano, Ana C. Murillo,
- Abstract要約: 本稿では, 廃棄物処理施設から収集した最初のデータセットであるSpectralWasteについて紹介する。
このデータセットには、分類植物によく見られるいくつかのカテゴリのオブジェクトのラベルが含まれている。
異なるオブジェクトセグメンテーションアーキテクチャを用いたパイプラインを提案し,その代替案をデータセット上で評価する。
- 参考スコア(独自算出の注目度): 46.178512739789426
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The increase in non-biodegradable waste is a worldwide concern. Recycling facilities play a crucial role, but their automation is hindered by the complex characteristics of waste recycling lines like clutter or object deformation. In addition, the lack of publicly available labeled data for these environments makes developing robust perception systems challenging. Our work explores the benefits of multimodal perception for object segmentation in real waste management scenarios. First, we present SpectralWaste, the first dataset collected from an operational plastic waste sorting facility that provides synchronized hyperspectral and conventional RGB images. This dataset contains labels for several categories of objects that commonly appear in sorting plants and need to be detected and separated from the main trash flow for several reasons, such as security in the management line or reuse. Additionally, we propose a pipeline employing different object segmentation architectures and evaluate the alternatives on our dataset, conducting an extensive analysis for both multimodal and unimodal alternatives. Our evaluation pays special attention to efficiency and suitability for real-time processing and demonstrates how HSI can bring a boost to RGB-only perception in these realistic industrial settings without much computational overhead.
- Abstract(参考訳): 非生分解性廃棄物の増加は世界的に懸念されている。
リサイクル施設は重要な役割を担っているが, ごみ処理やオブジェクト変形といったごみリサイクルラインの複雑な特性によって自動化が妨げられている。
さらに、これらの環境に公開されているラベル付きデータの欠如は、堅牢な認識システムの開発を困難にしている。
実際の廃棄物処理シナリオにおけるオブジェクトセグメンテーションに対するマルチモーダル認識の利点について検討する。
まず,高スペクトル画像と従来のRGB画像の同期処理を行うプラスチック廃棄物選別施設から収集した最初のデータセットであるSpectralWasteについて述べる。
このデータセットには、プラントのソートに一般的に現れるいくつかのカテゴリのオブジェクトのラベルが含まれており、管理ラインのセキュリティや再利用など、いくつかの理由から、メインのゴミフローから検出および分離する必要がある。
さらに、異なるオブジェクトセグメンテーションアーキテクチャを用いたパイプラインを提案し、データセット上の代替品を評価し、マルチモーダルおよびユニモーダルの両方の選択肢に対して広範な分析を行う。
本評価では, リアルタイム処理における効率性と適合性に特に注目し, 計算オーバーヘッドを伴わずに, 現実的な産業環境において, HSIがRGBのみの認識をいかに向上させるかを示す。
関連論文リスト
- COSNet: A Novel Semantic Segmentation Network using Enhanced Boundaries in Cluttered Scenes [9.970265640589966]
COSNetと呼ばれる効果的セグメンテーションネットワークを導入し、境界キューと複数コンテキスト情報を用いて、散らばったシーンでオブジェクトを正確にセグメンテーションする。
我々のCOSNetは、mIoUメートル法でそれぞれZeroWaste-fで1.8%、SpectralWasteデータセットで2.1%の大幅な上昇を達成した。
論文 参考訳(メタデータ) (2024-10-31T17:03:38Z) - WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks [7.775894876221921]
ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。
次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
論文 参考訳(メタデータ) (2024-09-25T15:04:21Z) - VisDA 2022 Challenge: Domain Adaptation for Industrial Waste Sorting [61.52419223232737]
産業廃棄物の選別において、最も大きな課題の1つは入力ストリームの極端な多様性である。
産業廃棄物浄化における領域適応に関するVisDA 2022の課題について紹介する。
論文 参考訳(メタデータ) (2023-03-26T21:38:38Z) - MMRNet: Improving Reliability for Multimodal Object Detection and
Segmentation for Bin Picking via Multimodal Redundancy [68.7563053122698]
マルチモーダル冗長性(MMRNet)を用いた信頼度の高いオブジェクト検出・分割システムを提案する。
これは、マルチモーダル冗長の概念を導入し、デプロイ中のセンサ障害問題に対処する最初のシステムである。
システム全体の出力信頼性と不確実性を測定するために,すべてのモダリティからの出力を利用する新しいラベルフリーマルチモーダル整合性(MC)スコアを提案する。
論文 参考訳(メタデータ) (2022-10-19T19:15:07Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - MetaGraspNet: A Large-Scale Benchmark Dataset for Scene-Aware
Ambidextrous Bin Picking via Physics-based Metaverse Synthesis [72.85526892440251]
本稿では,物理に基づくメタバース合成により構築した大規模写真リアリスティックビンピックデータセットであるMetaGraspNetを紹介する。
提案データセットは,82種類の記事に対して217kのRGBD画像を含み,オブジェクト検出,アモーダル認識,キーポイント検出,操作順序,および並列ジャウと真空グリップパー用のアンビデクストグリップラベルの完全なアノテーションを備える。
また,2.3k以上の完全アノテートされた高品質なRGBD画像からなる実際のデータセットを5段階の難易度と,異なるオブジェクトおよびレイアウト特性を評価するための見えないオブジェクトセットに分割する。
論文 参考訳(メタデータ) (2022-08-08T08:15:34Z) - ZeroWaste Dataset: Towards Automated Waste Recycling [51.053682077915546]
産業レベルの廃棄物検出・分別データセットZeroWasteについて述べる。
このデータセットには、実際の廃棄物処理工場から収集された1800以上のビデオフレームが含まれている。
最先端のセグメンテーション手法では,対象物を正しく検出・分類することが困難であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:17:09Z) - Segmenting Unseen Industrial Components in a Heavy Clutter Using RGB-D
Fusion and Synthetic Data [0.4724825031148411]
産業コンポーネントはテクスチャレスで反射性があり、乱雑で非構造的な環境でよく見られる。
本稿では,テクスチャをランダム化して形状情報にフォーカスする合成データ生成パイプラインを提案する。
信頼性マップ推定器を備えたRGB-D Fusion Mask R-CNNも提案する。
論文 参考訳(メタデータ) (2020-02-10T02:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。