論文の概要: Textile Analysis for Recycling Automation using Transfer Learning and Zero-Shot Foundation Models
- arxiv url: http://arxiv.org/abs/2506.06569v1
- Date: Fri, 06 Jun 2025 22:49:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 16:33:10.333385
- Title: Textile Analysis for Recycling Automation using Transfer Learning and Zero-Shot Foundation Models
- Title(参考訳): 転写学習とゼロショット基礎モデルを用いたリサイクル自動化のための繊維分析
- Authors: Yannis Spyridis, Vasileios Argyriou,
- Abstract要約: 本稿では, 標準RGB画像, コスト効率のよいセンシングモダリティを, 自動化システムにおける重要な前処理タスクに利用することを検討する。
本稿では,コンベアベルト構成のためのコンピュータビジョンコンポーネントについて,(a)4種類の一般的な織物の分類と,(b)ボタンやジッパーなどの非繊維の特徴のセグメンテーションを行う。
- 参考スコア(独自算出の注目度): 6.932314083921248
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated sorting is crucial for improving the efficiency and scalability of textile recycling, but accurately identifying material composition and detecting contaminants from sensor data remains challenging. This paper investigates the use of standard RGB imagery, a cost-effective sensing modality, for key pre-processing tasks in an automated system. We present computer vision components designed for a conveyor belt setup to perform (a) classification of four common textile types and (b) segmentation of non-textile features such as buttons and zippers. For classification, several pre-trained architectures were evaluated using transfer learning and cross-validation, with EfficientNetB0 achieving the best performance on a held-out test set with 81.25\% accuracy. For feature segmentation, a zero-shot approach combining the Grounding DINO open-vocabulary detector with the Segment Anything Model (SAM) was employed, demonstrating excellent performance with a mIoU of 0.90 for the generated masks against ground truth. This study demonstrates the feasibility of using RGB images coupled with modern deep learning techniques, including transfer learning for classification and foundation models for zero-shot segmentation, to enable essential analysis steps for automated textile recycling pipelines.
- Abstract(参考訳): 自動選別は, 繊維リサイクルの効率化とスケーラビリティ向上に不可欠であるが, 材料組成を正確に同定し, センサデータから汚染物質を検出することは依然として困難である。
本稿では, 標準RGB画像, コスト効率のよいセンシングモダリティを, 自動化システムにおけるキー前処理タスクに利用することを検討する。
本稿ではコンベヤベルト構成のためのコンピュータビジョンコンポーネントを提案する。
(a)4種類の一般的な織物の分類
b) ボタンやジッパーなどの非テクスチャ特徴のセグメンテーション。
分類には、転送学習とクロスバリデーションを用いて事前訓練されたアーキテクチャが評価され、EfficientNetB0は81.25\%の精度でホールドアウトテストセット上で最高の性能を達成した。
特徴セグメンテーションのために、グラウンドディングDINOオープンボキャブラリ検出器とSegment Anything Model(SAM)を組み合わせたゼロショットアプローチが採用され、生成したマスクに対して0.90のmIoUで優れた性能を示した。
本研究では, ゼロショットセグメンテーションのためのトランスファーラーニングや基礎モデルなど, 最新の深層学習技術と組み合わせてRGB画像を使用することにより, 自動織物リサイクルパイプラインの本質的な解析手順を実現することが可能であることを示す。
関連論文リスト
- Detailed Evaluation of Modern Machine Learning Approaches for Optic Plastics Sorting [4.647327901007882]
EPAによると、廃棄物のわずか25%がリサイクルされ、アメリカの自治体の60%が再資源化を行っている。
リサイクル率は8%に過ぎず、さらに16%が焼却され、残りの76%が埋立地となる。
プラスチックリサイクル率の低さは、汚染、経済的インセンティブの低さ、技術的困難に起因する。
論文 参考訳(メタデータ) (2025-05-22T10:48:30Z) - Automated Parsing of Engineering Drawings for Structured Information Extraction Using a Fine-tuned Document Understanding Transformer [0.0]
本稿では,構造化情報抽出のためのハイブリッドディープラーニングフレームワークを提案する。
オブジェクト指向境界ボックス(OBB)モデルと変換器ベースの文書解析モデル(Donut)を統合する。
提案するフレームワークは、精度を改善し、手作業の労力を削減するとともに、精度駆動型産業におけるスケーラブルなデプロイメントをサポートする。
論文 参考訳(メタデータ) (2025-05-02T18:33:21Z) - WasteGAN: Data Augmentation for Robotic Waste Sorting through Generative Adversarial Networks [7.775894876221921]
ムダGANと呼ばれる新しいGANアーキテクチャに基づくデータ拡張手法を提案する。
提案手法は,ラベル付きサンプルのごく限られたセットから,セマンティックセグメンテーションモデルの性能を向上させることができる。
次に、ムダGAN合成データに基づいて訓練されたモデルから予測される高品質なセグメンテーションマスクを活用し、セグメンテーション・アウェア・グルーピング・ポーズを計算する。
論文 参考訳(メタデータ) (2024-09-25T15:04:21Z) - Kalib: Easy Hand-Eye Calibration with Reference Point Tracking [52.4190876409222]
カリブ (Kalib) は、視覚基礎モデルの一般化性を利用して課題を克服する手眼自動校正法である。
校正中は、ロボットの後ろの空間内のカメラ座標3D座標に運動基準点を追跡する。
Kalibのユーザフレンドリな設計と最小限のセットアップ要件により、非構造化環境での継続的操作のソリューションとなり得る。
論文 参考訳(メタデータ) (2024-08-20T06:03:40Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - DataDAM: Efficient Dataset Distillation with Attention Matching [14.44010988811002]
研究者たちは、さまざまなデータセットをまたいだ強力な一般化を維持することによって、ディープラーニングのトレーニングコストを最小化しようと長年努力してきた。
データセットに関する新たな研究は、より大きな実際のデータセットの情報を含む小さな合成セットを作成することで、トレーニングコストの削減を目的としている。
しかし、従来の方法で生成された合成データは、元のトレーニングデータと同様に、配布・差別することが保証されていない。
論文 参考訳(メタデータ) (2023-09-29T19:07:48Z) - A Comprehensive Study of Image Classification Model Sensitivity to
Foregrounds, Backgrounds, and Visual Attributes [58.633364000258645]
このデータセットをRIVAL10と呼びます。
本研究では,前景,背景,属性の騒音劣化に対する幅広いモデルの感度を評価する。
本稿では,多種多様な最先端アーキテクチャ (ResNets, Transformers) とトレーニング手順 (CLIP, SimCLR, DeiT, Adversarial Training) について考察する。
論文 参考訳(メタデータ) (2022-01-26T06:31:28Z) - ZeroWaste Dataset: Towards Automated Waste Recycling [51.053682077915546]
産業レベルの廃棄物検出・分別データセットZeroWasteについて述べる。
このデータセットには、実際の廃棄物処理工場から収集された1800以上のビデオフレームが含まれている。
最先端のセグメンテーション手法では,対象物を正しく検出・分類することが困難であることを示す。
論文 参考訳(メタデータ) (2021-06-04T22:17:09Z) - Neural BRDF Representation and Importance Sampling [79.84316447473873]
本稿では,リフレクタンスBRDFデータのコンパクトニューラルネットワークに基づく表現について述べる。
BRDFを軽量ネットワークとしてエンコードし、適応角サンプリングによるトレーニングスキームを提案する。
複数の実世界のデータセットから等方性および異方性BRDFの符号化結果を評価する。
論文 参考訳(メタデータ) (2021-02-11T12:00:24Z) - Unsupervised machine learning via transfer learning and k-means
clustering to classify materials image data [0.0]
本稿では,画像分類のための高性能な教師なし機械学習システムの構築,利用,評価について述べる。
我々は、自然画像のImageNetデータセット上に事前訓練されたVGG16畳み込みニューラルネットワークを用いて、各マイクログラフの特徴表現を抽出する。
このアプローチは、99.4% pm 0.16%$の精度を実現し、結果として得られたモデルは、再トレーニングせずに、新しい画像の分類に使うことができる。
論文 参考訳(メタデータ) (2020-07-16T14:36:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。