論文の概要: ScribbleSeg: Scribble-based Interactive Image Segmentation
- arxiv url: http://arxiv.org/abs/2303.11320v1
- Date: Mon, 20 Mar 2023 17:57:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 14:02:37.992259
- Title: ScribbleSeg: Scribble-based Interactive Image Segmentation
- Title(参考訳): ScribbleSeg: Scribbleベースのインタラクティブイメージセグメンテーション
- Authors: Xi Chen, Yau Shing Jonathan Cheung, Ser-Nam Lim, Hengshuang Zhao
- Abstract要約: インタラクティブセグメンテーションにより、ユーザは、ボックス、クリック、スクリブルなどのターゲットを示すシンプルなアノテーションを提供することで、マスクを抽出できる。
これまでの作業は主にクリックベースの設定に重点を置いており、スクリブルベースの設定はめったに検討されていない。
本研究では,スクリブルに基づく対話的セグメンテーションのための標準プロトコルを定式化しようと試みる。
- 参考スコア(独自算出の注目度): 45.45183308962017
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive segmentation enables users to extract masks by providing simple
annotations to indicate the target, such as boxes, clicks, or scribbles. Among
these interaction formats, scribbles are the most flexible as they can be of
arbitrary shapes and sizes. This enables scribbles to provide more indications
of the target object. However, previous works mainly focus on click-based
configuration, and the scribble-based setting is rarely explored. In this work,
we attempt to formulate a standard protocol for scribble-based interactive
segmentation. Basically, we design diversified strategies to simulate scribbles
for training, propose a deterministic scribble generator for evaluation, and
construct a challenging benchmark. Besides, we build a strong framework
ScribbleSeg, consisting of a Prototype Adaption Module(PAM) and a Corrective
Refine Module (CRM), for the task. Extensive experiments show that ScribbleSeg
performs notably better than previous click-based methods. We hope this could
serve as a more powerful and general solution for interactive segmentation. Our
code will be made available.
- Abstract(参考訳): インタラクティブセグメンテーションにより、ユーザは、ボックス、クリック、スクリブルなどのターゲットを示すシンプルなアノテーションを提供することで、マスクを抽出できる。
これらの相互作用形式の中で、スクリブルは任意の形状や大きさを持つため、最も柔軟である。
これにより、scribblesはターゲットオブジェクトのより多くの表示を提供することができる。
しかし、以前の作品は主にクリックベースの設定に焦点を当てており、クリブルベースの設定はほとんど検討されていない。
本研究では,スクリブルに基づく対話的セグメンテーションのための標準プロトコルを定式化する。
基本的に、トレーニングのためのスクリブルをシミュレートする多様な戦略を設計し、評価のための決定論的スクリブル生成器を提案し、挑戦的なベンチマークを構築する。
さらに、タスクのためのPrototype Adaption Module(PAM)とCorrective Refine Module(CRM)で構成される強力なフレームワークであるScribbleSegを構築します。
広範な実験により、scribblesegは以前のクリックベースメソッドよりも優れたパフォーマンスを示している。
対話的なセグメンテーションのための、より強力で一般的なソリューションになることを期待しています。
私たちのコードは利用可能になります。
関連論文リスト
- RClicks: Realistic Click Simulation for Benchmarking Interactive Segmentation [37.44155289954746]
対話型セグメンテーションシナリオにおけるクリックパターンの大規模クラウドソーシング調査を行い,475万のリアルタイムクリックを収集する。
本モデルとデータセットを用いて,現実的なクリックにおける既存の対話的セグメンテーション手法の包括的比較のためのRClicksベンチマークを提案する。
我々のベンチマークによると、実世界の対話型セグメンテーションモデルでは、ベースラインベンチマークで報告されたよりもパフォーマンスが悪く、ほとんどの手法は堅牢ではない。
論文 参考訳(メタデータ) (2024-10-15T15:55:00Z) - Visual Prompt Selection for In-Context Learning Segmentation [77.15684360470152]
本稿では,サンプル選択戦略の再考と改善に焦点をあてる。
まず、ICLに基づくセグメンテーションモデルが異なる文脈に敏感であることを示す。
さらに、経験的証拠は、文脈的プロンプトの多様性がセグメンテーションを導く上で重要な役割を担っていることを示している。
論文 参考訳(メタデータ) (2024-07-14T15:02:54Z) - Frozen CLIP: A Strong Backbone for Weakly Supervised Semantic Segmentation [90.35249276717038]
弱教師付きセマンティックセグメンテーションのためのCLIPベースのシングルステージパイプラインであるWeCLIPを提案する。
具体的には、凍結したCLIPモデルを意味的特徴抽出のバックボーンとして適用する。
新しいデコーダは、最終予測のために抽出された意味的特徴を解釈するように設計されている。
論文 参考訳(メタデータ) (2024-06-17T03:49:47Z) - IFSENet : Harnessing Sparse Iterations for Interactive Few-shot Segmentation Excellence [2.822194296769473]
新しいクラスのセグメンテーションを学ぶために必要な画像の数を減らします。
インタラクティブなセグメンテーション技術は、一度に1つのオブジェクトのセグメンテーションを漸進的に改善することのみに焦点を当てます。
2つの概念を組み合わせることで、新しいクラスのセグメンテーションモデルをトレーニングするのに要する労力を大幅に削減する。
論文 参考訳(メタデータ) (2024-03-22T10:15:53Z) - Learning Referring Video Object Segmentation from Weak Annotation [78.45828085350936]
RVOS(Referring Video Object segmentation)は、対象物を記述する文に基づいて、対象物をすべてのビデオフレームにセグメント化することを目的としたタスクである。
そこで本研究では, RVOS に対する十分な監視を提供しながら, アノテーションの労力を 8 倍に削減する新たなアノテーション方式を提案する。
私たちのスキームは、最初にオブジェクトが現れるフレームのマスクと、残りのフレームのバウンディングボックスのみを必要とする。
論文 参考訳(メタデータ) (2023-08-04T06:50:52Z) - Contour-based Interactive Segmentation [4.164728134421114]
ユーザインタラクションの自然な形態をゆるい輪郭とみなし、輪郭に基づく対話的セグメンテーション手法を導入する。
一つの輪郭が複数のクリックと同じ精度で、ユーザインタラクションの必要量を減らすことを実証する。
論文 参考訳(メタデータ) (2023-02-13T13:35:26Z) - UCP-Net: Unstructured Contour Points for Instance Segmentation [2.105564340986074]
本稿では,初期セグメンテーションとセグメンテーションの洗練のために,制約のない輪郭クリックに基づく対話型セグメンテーションを提案する。
本手法は分類に依存しず,一般的なセグメンテーションデータセットの最先端手法よりもユーザインタラクションの少ない精度のセグメンテーションマスク(IoU > 85%)を生成する。
論文 参考訳(メタデータ) (2021-09-15T22:03:37Z) - Locate then Segment: A Strong Pipeline for Referring Image Segmentation [73.19139431806853]
参照画像セグメンテーションは、自然言語表現によって参照されるオブジェクトをセグメンテーションすることを目的とする。
従来の方法は、視覚言語機能を融合させ、最終的なセグメンテーションマスクを直接生成するための暗黙的および反復的な相互作用メカニズムの設計に焦点を当てています。
これらの問題に取り組むための「Then-Then-Segment」スキームを紹介します。
私たちのフレームワークはシンプルですが驚くほど効果的です。
論文 参考訳(メタデータ) (2021-03-30T12:25:27Z) - Semantically Meaningful Class Prototype Learning for One-Shot Image
Semantic Segmentation [58.96902899546075]
ワンショットセマンティックイメージセグメンテーションは、1つの注釈付きイメージで新しいクラスのオブジェクト領域を分割することを目的としている。
最近の研究では、テスト時に予想される状況を模倣するために、エピソディクストレーニング戦略を採用している。
エピソードトレーニングにおいて,マルチクラスラベル情報を活用することを提案する。
ネットワークが各カテゴリに対してより意味のある機能を生成するように促すだろう。
論文 参考訳(メタデータ) (2021-02-22T12:07:35Z) - Localized Interactive Instance Segmentation [24.55415554455844]
本稿では,ユーザインタラクションがオブジェクトの近接に制限されるクリック方式を提案する。
提案手法の有効性を,詳細な実験により示す。
論文 参考訳(メタデータ) (2020-10-18T23:24:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。