論文の概要: WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2409.16999v1
- Date: Wed, 25 Sep 2024 15:04:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-27 03:15:16.435718
- Title: WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks
- Title(参考訳): WasteGAN: ジェネレーティブ・ディバイサル・ネットワークによるロボット廃棄物収集のためのデータ強化
- Authors: Alberto Bacchin, Leonardo Barcellona, Matteo Terreran, Stefano Ghidoni, Emanuele Menegatti, Takuya Kiyokawa,
- Abstract要約: ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。
次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
- 参考スコア(独自算出の注目度): 7.775894876221921
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic waste sorting poses significant challenges in both perception and manipulation, given the extreme variability of objects that should be recognized on a cluttered conveyor belt. While deep learning has proven effective in solving complex tasks, the necessity for extensive data collection and labeling limits its applicability in real-world scenarios like waste sorting. To tackle this issue, we introduce a data augmentation method based on a novel GAN architecture called wasteGAN. The proposed method allows to increase the performance of semantic segmentation models, starting from a very limited bunch of labeled examples, such as few as 100. The key innovations of wasteGAN include a novel loss function, a novel activation function, and a larger generator block. Overall, such innovations helps the network to learn from limited number of examples and synthesize data that better mirrors real-world distributions. We then leverage the higher-quality segmentation masks predicted from models trained on the wasteGAN synthetic data to compute semantic-aware grasp poses, enabling a robotic arm to effectively recognizing contaminants and separating waste in a real-world scenario. Through comprehensive evaluation encompassing dataset-based assessments and real-world experiments, our methodology demonstrated promising potential for robotic waste sorting, yielding performance gains of up to 5.8\% in picking contaminants. The project page is available at https://github.com/bach05/wasteGAN.git
- Abstract(参考訳): ロボット廃棄物の選別は、粗いコンベアベルト上で認識されるべき物体の極端な変動を考えると、知覚と操作の両方において重大な課題となる。
ディープラーニングは複雑なタスクを解くのに有効であることが証明されているが、広範なデータ収集とラベル付けの必要性は、無駄のソートのような現実世界のシナリオでの適用性を制限している。
この問題に対処するために,ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,100に満たないラベル付き例から始めて,セマンティックセグメンテーションモデルの性能を向上させる。
ムダGANの重要な革新は、新しい損失関数、新しい活性化関数、より大きなジェネレータブロックである。
全体として、このようなイノベーションは、限られた数のサンプルから学習し、実世界の分布をより良く反映するデータを合成するのに役立ちます。
次に,廃棄物GAN合成データに基づいて学習したモデルから予測される高品質なセグメンテーションマスクを用いて,意味認識型グリップポーズを計算し,ロボットアームが汚染物質を効果的に認識し,現実のシナリオで廃棄物を分離することを可能にする。
提案手法は, データセットに基づく評価と実世界の実験を含む総合的な評価を通じて, ロボット廃棄物の選別の可能性を示し, 汚染物質の選別において最大5.8倍の性能向上が得られた。
プロジェクトページはhttps://github.com/bach05/wasteGAN.gitで公開されている。
関連論文リスト
- Advancing Recycling Efficiency: A Comparative Analysis of Deep Learning Models in Waste Classification [0.0]
本研究は, 各種深層学習モデルの解析により, リサイクルにおける廃棄物分類の押し付け問題に取り組む。
以上の結果から, 複雑な廃棄物カテゴリの精度が著しく向上することが示唆された。
この研究は, 多カテゴリー廃棄物リサイクルの今後の発展への道を開くものである。
論文 参考訳(メタデータ) (2024-11-05T03:44:54Z) - SpectralWaste Dataset: Multimodal Data for Waste Sorting Automation [46.178512739789426]
本稿では, 廃棄物処理施設から収集した最初のデータセットであるSpectralWasteについて紹介する。
このデータセットには、分類植物によく見られるいくつかのカテゴリのオブジェクトのラベルが含まれている。
異なるオブジェクトセグメンテーションアーキテクチャを用いたパイプラインを提案し,その代替案をデータセット上で評価する。
論文 参考訳(メタデータ) (2024-03-26T18:39:38Z) - Bridging the Gap: Enhancing the Utility of Synthetic Data via
Post-Processing Techniques [7.967995669387532]
生成モデルは、実世界のデータを置き換えたり拡張したりできる合成データセットを生成するための有望なソリューションとして登場した。
本稿では,合成データセットの品質と多様性を向上させるために,新しい3つのポストプロセッシング手法を提案する。
Gap Filler(GaFi)は、Fashion-MNIST、CIFAR-10、CIFAR-100データセットにおいて、実精度スコアとのギャップを2.03%、1.78%、および3.99%に効果的に減少させることを示した。
論文 参考訳(メタデータ) (2023-05-17T10:50:38Z) - VisDA 2022 Challenge: Domain Adaptation for Industrial Waste Sorting [61.52419223232737]
産業廃棄物の選別において、最も大きな課題の1つは入力ストリームの極端な多様性である。
産業廃棄物浄化における領域適応に関するVisDA 2022の課題について紹介する。
論文 参考訳(メタデータ) (2023-03-26T21:38:38Z) - Synthetic-to-Real Domain Generalized Semantic Segmentation for 3D Indoor
Point Clouds [69.64240235315864]
本稿では,本課題に対して,合成-実領域一般化設定を提案する。
合成と実世界のポイントクラウドデータのドメインギャップは、主に異なるレイアウトとポイントパターンにあります。
CINMixとMulti-prototypeの両方が分配ギャップを狭めることを示した。
論文 参考訳(メタデータ) (2022-12-09T05:07:43Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Towards artificially intelligent recycling Improving image processing
for waste classification [0.0]
IBMのWastenetプロジェクトは、廃棄物の分類に人工知能を用いてリサイクルを改善することを目的としている。
本稿では,移動学習とデータ拡張技術を用いて,このプロジェクトを基盤とする。
その結果、これらの拡張技術により、最終モデルのテスト精度は95.40%向上した。
論文 参考訳(メタデータ) (2021-08-09T21:41:48Z) - ZeroWaste Dataset: Towards Automated Waste Recycling [51.053682077915546]
産業レベルの廃棄物検出・分別データセットZeroWasteについて述べる。
このデータセットには、実際の廃棄物処理工場から収集された1800以上のビデオフレームが含まれている。
最先端のセグメンテーション手法では,対象物を正しく検出・分類することが困難であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:17:09Z) - Bridging the Gap Between Clean Data Training and Real-World Inference
for Spoken Language Understanding [76.89426311082927]
既存のモデルはクリーンデータに基づいてトレーニングされ、クリーンデータトレーニングと現実世界の推論の間にtextitgapが発生する。
本稿では,良質なサンプルと低品質のサンプルの両方が類似ベクトル空間に埋め込まれた領域適応法を提案する。
広く使用されているデータセット、スニップス、および大規模な社内データセット(1000万のトレーニング例)に関する実験では、この方法は実世界の(騒々しい)コーパスのベースラインモデルを上回るだけでなく、堅牢性、すなわち、騒々しい環境下で高品質の結果を生み出すことを実証しています。
論文 参考訳(メタデータ) (2021-04-13T17:54:33Z) - Multi-Spectral Image Synthesis for Crop/Weed Segmentation in Precision
Farming [3.4788711710826083]
本稿では, 精密農業における作物・雑草の分枝化問題に適用し, 共通データ増分法に関する代替手法を提案する。
我々は、最も関連性の高いオブジェクトクラス(作物や雑草)を合成されたクラスに置き換えることで、半人工的なサンプルを作成する。
RGBデータに加えて、近赤外(NIR)情報も考慮し、4つのチャネルマルチスペクトル合成画像を生成する。
論文 参考訳(メタデータ) (2020-09-12T08:49:36Z) - Learning to Count in the Crowd from Limited Labeled Data [109.2954525909007]
我々は,限られた数のラベル付きサンプルから参加者を数えることを学ぶことで,アノテーションの努力を減らすことに重点を置いている。
具体的には,未ラベルデータに対する擬似地下真理推定を含むガウス過程に基づく反復学習機構を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:17:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。