論文の概要: ScribbleBox: Interactive Annotation Framework for Video Object
Segmentation
- arxiv url: http://arxiv.org/abs/2008.09721v1
- Date: Sat, 22 Aug 2020 00:33:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 07:36:09.520063
- Title: ScribbleBox: Interactive Annotation Framework for Video Object
Segmentation
- Title(参考訳): ScribbleBox:ビデオオブジェクトセグメンテーションのためのインタラクティブアノテーションフレームワーク
- Authors: Bowen Chen, Huan Ling, Xiaohui Zeng, Gao Jun, Ziyue Xu, Sanja Fidler
- Abstract要約: 我々はScribbleBoxを紹介した。これはビデオでオブジェクトインスタンスにマスクを付けるためのインタラクティブなフレームワークだ。
パラメトリック曲線を用いて軌道を近似することにより、ボックストラックを効率的にアノテートする。
我々のScribbleBoxアプローチは、DAVIS 2017で88.92%のJ&Fに達し、ボックストラックあたり9.14クリック、4フレームのアノテーションがある。
- 参考スコア(独自算出の注目度): 62.86341611684222
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Manually labeling video datasets for segmentation tasks is extremely time
consuming. In this paper, we introduce ScribbleBox, a novel interactive
framework for annotating object instances with masks in videos. In particular,
we split annotation into two steps: annotating objects with tracked boxes, and
labeling masks inside these tracks. We introduce automation and interaction in
both steps. Box tracks are annotated efficiently by approximating the
trajectory using a parametric curve with a small number of control points which
the annotator can interactively correct. Our approach tolerates a modest amount
of noise in the box placements, thus typically only a few clicks are needed to
annotate tracked boxes to a sufficient accuracy. Segmentation masks are
corrected via scribbles which are efficiently propagated through time. We show
significant performance gains in annotation efficiency over past work. We show
that our ScribbleBox approach reaches 88.92% J&F on DAVIS2017 with 9.14 clicks
per box track, and 4 frames of scribble annotation.
- Abstract(参考訳): セグメンテーションタスクのためのビデオデータセットの手動ラベリングは非常に時間がかかる。
本稿では,ビデオ中のマスク付きオブジェクトインスタンスをアノテートするためのインタラクティブフレームワークであるScribbleBoxを紹介する。
特に、アノテーションを2つのステップに分割した: トラックされたボックスでオブジェクトに注釈を付け、これらのトラック内にマスクをラベル付けする。
両方のステップで自動化とインタラクションを導入します。
注釈装置が対話的に補正できる少数の制御点を有するパラメトリック曲線を用いて軌道を近似することにより、ボックストラックを効率的に注釈付けする。
当社のアプローチでは,ボックス配置のノイズをわずかに許容するので,トラックボックスのアノテートに要するクリック数はごくわずかである。
セグメンテーションマスクは、時間を通じて効率的に伝播するスクリブルを介して修正される。
我々は過去の作業でアノテーションの効率が大幅に向上したことを示す。
我々のScribbleBoxアプローチは、DAVIS2017で88.92%のJ&Fに達し、ボックストラックあたり9.14クリック、4フレームのスクリブルアノテーションがある。
関連論文リスト
- Learning Tracking Representations from Single Point Annotations [49.47550029470299]
本稿では,単一点アノテーションから追跡表現を弱教師付きで学習することを提案する。
具体的には,エンド・ツー・エンド・エンド・コントラスト学習に先立って,対象対象対象性を取り入れたソフトコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-15T06:50:58Z) - Learning Referring Video Object Segmentation from Weak Annotation [78.45828085350936]
RVOS(Referring Video Object segmentation)は、対象物を記述する文に基づいて、対象物をすべてのビデオフレームにセグメント化することを目的としたタスクである。
そこで本研究では, RVOS に対する十分な監視を提供しながら, アノテーションの労力を 8 倍に削減する新たなアノテーション方式を提案する。
私たちのスキームは、最初にオブジェクトが現れるフレームのマスクと、残りのフレームのバウンディングボックスのみを必要とする。
論文 参考訳(メタデータ) (2023-08-04T06:50:52Z) - Box2Mask: Weakly Supervised 3D Semantic Instance Segmentation Using
Bounding Boxes [38.60444957213202]
弱教師付き3Dセマンティックインスタンスセグメンテーションについて検討する。
キーとなるアイデアは、3Dバウンディングボックスラベルを活用することだ。
境界ボックスラベルのみを用いて高密度セグメンテーションモデルを訓練することが可能であることを示す。
論文 参考訳(メタデータ) (2022-06-02T17:59:57Z) - Robust Visual Tracking by Segmentation [103.87369380021441]
対象範囲を推定することは、視覚的物体追跡において根本的な課題となる。
高精度なセグメンテーションマスクを生成するセグメンテーション中心のトラッキングパイプラインを提案する。
我々のトラッカーは、シーンのターゲットを背景コンテンツと明確に区別するターゲット表現をよりよく学習することができる。
論文 参考訳(メタデータ) (2022-03-21T17:59:19Z) - Heuristics2Annotate: Efficient Annotation of Large-Scale Marathon
Dataset For Bounding Box Regression [8.078491757252692]
我々はマラソンランナーの大規模インザワイルドビデオデータセットを収集した。
このデータセットは、42台のハンドヘルドスマートフォンカメラで撮影された数千人のランナーの記録から成り立っている。
このような大規模データセットのアノテーションにおける課題に取り組むための新しいスキームを提案する。
論文 参考訳(メタデータ) (2021-04-06T19:08:31Z) - Generating Masks from Boxes by Mining Spatio-Temporal Consistencies in
Videos [159.02703673838639]
フレーム毎のバウンディングボックスアノテーションからセグメンテーションマスクを生成する手法を動画で紹介します。
得られた正確なマスクを用いて、ビデオオブジェクトセグメンテーション(VOS)ネットワークの弱い教師付きトレーニングを行う。
追加データは、VOSとより困難なトラッキングドメインの両方で最先端の結果をもたらす大幅に優れた一般化パフォーマンスを提供します。
論文 参考訳(メタデータ) (2021-01-06T18:56:24Z) - Efficient video annotation with visual interpolation and frame selection
guidance [0.0]
バウンディングボックスを備えたジェネリックビデオアノテーションの統一フレームワークを紹介します。
提案手法は,一般的な線形手法に比べて実測アノテーション時間を50%短縮することを示す。
論文 参考訳(メタデータ) (2020-12-23T09:31:40Z) - Reducing the Annotation Effort for Video Object Segmentation Datasets [50.893073670389164]
ピクセルマスクでフレームを密にラベル付けしても 大規模なデータセットにはスケールしない
我々は、より安価なバウンディングボックスアノテーションからピクセルレベルで擬似ラベルを自動生成するために、深層畳み込みネットワークを使用します。
我々は新しいTAO-VOSベンチマークを取得し、www.vision.rwth-aachen.de/page/taovosで公開している。
論文 参考訳(メタデータ) (2020-11-02T17:34:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。