論文の概要: WS$^2$: Weakly Supervised Segmentation using Before-After Supervision in Waste Sorting
- arxiv url: http://arxiv.org/abs/2509.06485v1
- Date: Mon, 08 Sep 2025 09:48:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:04.045158
- Title: WS$^2$: Weakly Supervised Segmentation using Before-After Supervision in Waste Sorting
- Title(参考訳): WS$^2$: 廃棄物ソーティングにおける前処理スーパービジョンを用いた弱い監督セグメント化
- Authors: Andrea Marelli, Alberto Foresti, Leonardo Pesce, Giacomo Boracchi, Mario Grosso,
- Abstract要約: コンベアベルト上に1万以上の高解像度ビデオフレームをキャプチャした最初のマルチビューデータセットであるWS$2$(Weakly Supervised segmentation for Waste-Sorting)を紹介した。
WS$2$で、最先端の弱教師付きセグメンテーションメソッドのベンチマークに使用される堅牢なエンドツーエンドパイプラインも提示します。
- 参考スコア(独自算出の注目度): 9.145946959707414
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In industrial quality control, to visually recognize unwanted items within a moving heterogeneous stream, human operators are often still indispensable. Waste-sorting stands as a significant example, where operators on multiple conveyor belts manually remove unwanted objects to select specific materials. To automate this recognition problem, computer vision systems offer great potential in accurately identifying and segmenting unwanted items in such settings. Unfortunately, considering the multitude and the variety of sorting tasks, fully supervised approaches are not a viable option to address this challange, as they require extensive labeling efforts. Surprisingly, weakly supervised alternatives that leverage the implicit supervision naturally provided by the operator in his removal action are relatively unexplored. In this paper, we define the concept of Before-After Supervision, illustrating how to train a segmentation network by leveraging only the visual differences between images acquired \textit{before} and \textit{after} the operator. To promote research in this direction, we introduce WS$^2$ (Weakly Supervised segmentation for Waste-Sorting), the first multiview dataset consisting of more than 11 000 high-resolution video frames captured on top of a conveyor belt, including "before" and "after" images. We also present a robust end-to-end pipeline, used to benchmark several state-of-the-art weakly supervised segmentation methods on WS$^2$.
- Abstract(参考訳): 産業品質管理において、移動中の不均一な流れの中で視覚的に不要なアイテムを認識するためには、人間のオペレータは依然として不可欠である。
廃棄物の仕分けは重要な例であり、複数のコンベアベルトのオペレーターが手動で不要な物体を除去して特定の材料を選択する。
この認識問題を自動化するために、コンピュータビジョンシステムは、そのような設定で不要なアイテムを正確に識別し、セグメンテーションする大きな可能性を秘めている。
残念なことに、多様かつ多様なソートタスクを考えると、完全な教師付きアプローチは、広範囲なラベル付け作業を必要とするため、このチャランジに対処するための実行可能な選択肢ではない。
驚くべきことに、操作者によって自然に提供される暗黙の監督を利用する、弱く監督された代替手段は、比較的未調査である。
本稿では,<textit{before} と<textit{after} との視覚的差異のみを演算子として利用することにより,セグメンテーションネットワークのトレーニング方法を示す。
本研究は, コンベアベルト上に1万本以上の高解像度映像フレームを収録し, 「前」と「後」の画像を含む, マルチビューデータセットであるWS$^2$(Wakly Supervised segmentation for Waste-Sorting)を紹介する。
また、WS$^2$上で、最先端の弱教師付きセグメンテーション手法のベンチマークに使用される堅牢なエンドツーエンドパイプラインも提示する。
関連論文リスト
- Temporal-consistent CAMs for Weakly Supervised Video Segmentation in Waste Sorting [14.324826668510504]
本稿では,ビデオストリームの場合のセマンティックセグメンテーションのための正確なマスクを生成することができるWS手法を提案する。
ビデオ内の連続するフレーム間の時間的コヒーレンスを利用して、サリエンシマップを構築する。
我々は,映像セグメント化を弱めに制御する,ムダソーシングのシナリオに適用する。
論文 参考訳(メタデータ) (2025-02-03T15:43:33Z) - ProMerge: Prompt and Merge for Unsupervised Instance Segmentation [4.297070083645049]
教師なしのインスタンスセグメンテーションは、人間のラベル付きデータに頼ることなく、イメージ内の異なるオブジェクトインスタンスをセグメントすることを目的としている。
最近の最先端のアプローチでは、自己教師機能を使用して画像をグラフとして表現し、一般化された固有値系を解き、前景マスクを生成する。
Prompt and Merge(ProMerge)を提案する。これは、セルフ教師付き視覚機能を利用して、パッチの初期グループ化を取得し、これらのセグメントに戦略的マージを適用する。
論文 参考訳(メタデータ) (2024-09-27T17:59:42Z) - Weakly Supervised Video Individual CountingWeakly Supervised Video
Individual Counting [126.75545291243142]
Video Individual Countingは、単一のビデオ内のユニークな個人数を予測することを目的としている。
トラジェクトリラベルが提供されない弱い教師付きVICタスクを導入する。
そこで我々は,ネットワークを駆動し,インフロー,アウトフロー,残りを識別するために,エンドツーエンドのトレーニング可能なソフトコントラスト損失を考案した。
論文 参考訳(メタデータ) (2023-12-10T16:12:13Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - A Survey on Label-efficient Deep Segmentation: Bridging the Gap between
Weak Supervision and Dense Prediction [115.9169213834476]
本稿では,ラベル効率の高いセグメンテーション手法について概説する。
まず,様々な種類の弱いラベルによって提供される監督に従って,これらの手法を整理する分類法を開発する。
次に,既存のラベル効率のセグメンテーション手法を統一的な視点から要約する。
論文 参考訳(メタデータ) (2022-07-04T06:21:01Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - Unsupervised Part Discovery by Unsupervised Disentanglement [10.664434993386525]
部分分割は、個々のピクセルのレベルにおける部分ローカライゼーションに関する情報を提供する。
大きなアノテーションのコストは、教師付きアルゴリズムのスケーラビリティを他のオブジェクトカテゴリに制限します。
我々の研究は、監督なしに意味的部分のセグメンテーションを発見できる可能性を示している。
論文 参考訳(メタデータ) (2020-09-09T12:34:37Z) - Revisiting Sequence-to-Sequence Video Object Segmentation with
Multi-Task Loss and Skip-Memory [4.343892430915579]
ビデオオブジェクト(VOS)は、視覚領域の活発な研究領域である。
現行のアプローチでは、特にオブジェクトが小さく、あるいは一時的に隠された場合、長いシーケンスでオブジェクトを失う。
我々は,エンコーダ・デコーダアーキテクチャとメモリモジュールを組み合わせたシーケンス・ツー・シーケンス・アプローチを構築し,シーケンシャルデータを活用する。
論文 参考訳(メタデータ) (2020-04-25T15:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。