論文の概要: Semantics through Time: Semi-supervised Segmentation of Aerial Videos
with Iterative Label Propagation
- arxiv url: http://arxiv.org/abs/2010.01910v1
- Date: Fri, 2 Oct 2020 15:15:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 02:11:04.592427
- Title: Semantics through Time: Semi-supervised Segmentation of Aerial Videos
with Iterative Label Propagation
- Title(参考訳): 時間的意味論:反復ラベル伝搬による空中映像の半教師付きセグメンテーション
- Authors: Alina Marcu, Vlad Licaret, Dragos Costea and Marius Leordeanu
- Abstract要約: 本稿では,SegPropの導入によって自動アノテーションへの重要な一歩を踏み出す。
SegPropは、空間と時間におけるスペクトルクラスタリングに直接接続する、新しい反復フローベースの手法である。
Ruralscapesは、50フレーム毎に高解像度(4K)イメージと手動で注釈付けされた高密度ラベルを備えた、新しいデータセットである。
われわれの小説『SegProp』は、残っていない98%のフレームを90%を超える精度で自動的に注釈付けする。
- 参考スコア(独自算出の注目度): 16.478668565965243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation is a crucial task for robot navigation and safety.
However, current supervised methods require a large amount of pixelwise
annotations to yield accurate results. Labeling is a tedious and time consuming
process that has hampered progress in low altitude UAV applications. This paper
makes an important step towards automatic annotation by introducing SegProp, a
novel iterative flow-based method, with a direct connection to spectral
clustering in space and time, to propagate the semantic labels to frames that
lack human annotations. The labels are further used in semi-supervised learning
scenarios. Motivated by the lack of a large video aerial dataset, we also
introduce Ruralscapes, a new dataset with high resolution (4K) images and
manually-annotated dense labels every 50 frames - the largest of its kind, to
the best of our knowledge. Our novel SegProp automatically annotates the
remaining unlabeled 98% of frames with an accuracy exceeding 90% (F-measure),
significantly outperforming other state-of-the-art label propagation methods.
Moreover, when integrating other methods as modules inside SegProp's iterative
label propagation loop, we achieve a significant boost over the baseline
labels. Finally, we test SegProp in a full semi-supervised setting: we train
several state-of-the-art deep neural networks on the
SegProp-automatically-labeled training frames and test them on completely novel
videos. We convincingly demonstrate, every time, a significant improvement over
the supervised scenario.
- Abstract(参考訳): セマンティックセグメンテーションは、ロボットのナビゲーションと安全性にとって重要なタスクである。
しかし、現在の教師付き手法は正確な結果を得るために大量のピクセル単位のアノテーションを必要とする。
ラベリングは退屈で時間のかかるプロセスであり、低高度UAVアプリケーションの進行を妨げている。
本稿では,人間のアノテーションを欠いたフレームにセマンティックラベルを伝播させるため,時間と空間のスペクトルクラスタリングに直接接続する新しい反復フローベース手法であるSegPropを導入することにより,自動アノテーションへの重要な一歩を踏み出す。
ラベルは半教師付き学習シナリオでさらに使用される。
大規模なビデオ空中データセットの欠如に動機づけられて,田園風景も紹介しています。高解像度(4k)イメージと,50フレーム毎に手作業で注釈付の密ラベルを備えた,私たちの知る限り最大のデータセットです。
新しいsegpropは、残りの98%のフレームに90%以上の精度(f-measure)で自動的に注釈を付け、他の最先端ラベル伝搬法を著しく上回っている。
さらに、SegPropの反復ラベル伝搬ループ内で他のメソッドをモジュールとして統合すると、ベースラインラベルよりも大幅に向上する。
最後に、segpropを完全な半教師付き環境でテストします。segpropの自動ラベル付きトレーニングフレーム上で、最先端のディープニューラルネットワークをトレーニングし、全く新しいビデオでテストします。
私たちは常に、監督されたシナリオに対する大きな改善を説得力強く示しています。
関連論文リスト
- Exploring Structured Semantic Prior for Multi Label Recognition with
Incomplete Labels [60.675714333081466]
不完全なラベルを持つマルチラベル認識(MLR)は非常に難しい。
最近の研究は、視覚言語モデルであるCLIPにおける画像とラベルの対応を探り、不十分なアノテーションを補うことを目指している。
我々は,MLRにおけるラベル管理の欠如を,構造化されたセマンティクスを導出することにより,不完全なラベルで修復することを提唱する。
論文 参考訳(メタデータ) (2023-03-23T12:39:20Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - Warp-Refine Propagation: Semi-Supervised Auto-labeling via
Cycle-consistency [27.77065474840873]
本稿では,意味的手がかりと幾何学的手がかりを組み合わせ,効率的な自動ラベルビデオを生成する新しいラベル伝搬法を提案する。
本手法は, 幾何学的にワープされたラベルを改良し, 半教師付き環境下で学習したセマンティック先行情報を注入する。
本研究では,ApolloScapeデータセット上の13.1 mIoUの有意なマージンでラベルの伝播を改善する手法を定量的に示す。
論文 参考訳(メタデータ) (2021-09-28T02:04:18Z) - One Thing One Click: A Self-Training Approach for Weakly Supervised 3D
Semantic Segmentation [78.36781565047656]
私たちは、アノテーションーがオブジェクトごとに1ポイントだけラベルを付ける必要があることを意味する「One Thing One Click」を提案します。
グラフ伝搬モジュールによって促進されるトレーニングとラベル伝搬を反復的に行う。
私たちの結果は、完全に監督されたものと同等です。
論文 参考訳(メタデータ) (2021-04-06T02:27:25Z) - Reducing the Annotation Effort for Video Object Segmentation Datasets [50.893073670389164]
ピクセルマスクでフレームを密にラベル付けしても 大規模なデータセットにはスケールしない
我々は、より安価なバウンディングボックスアノテーションからピクセルレベルで擬似ラベルを自動生成するために、深層畳み込みネットワークを使用します。
我々は新しいTAO-VOSベンチマークを取得し、www.vision.rwth-aachen.de/page/taovosで公開している。
論文 参考訳(メタデータ) (2020-11-02T17:34:45Z) - PCAMs: Weakly Supervised Semantic Segmentation Using Point Supervision [12.284208932393073]
本稿では,ある点レベルのアノテーションが与えられた画像から意味的セグメンテーションを生成する新しい手法を提案する。
提案するCNNは,通常,地上の真理ラベルの代わりに擬似ラベルを用いて完全に教師される。
提案手法は,PASCAL VOC 2012 データセットを引用した PASCAL VOC 2012 のセマンティックセマンティックセマンティフィケーションのための技術結果の状態を達成し,より強いバウンディングボックスやリスグル管理のための技術手法よりも優れていた。
論文 参考訳(メタデータ) (2020-07-10T21:25:27Z) - Labelling unlabelled videos from scratch with multi-modal
self-supervision [82.60652426371936]
ビデオデータセットの教師なしラベリングは、強力な機能エンコーダから解放されない。
人間のアノテーションを使わずにビデオデータセットの擬似ラベリングを可能にする新しいクラスタリング手法を提案する。
広範囲な分析により、結果として得られたクラスタは、真理の人間ラベルと高いセマンティックオーバーラップがあることが示されている。
論文 参考訳(メタデータ) (2020-06-24T12:28:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。