論文の概要: Accelerating the creation of instance segmentation training sets through
bounding box annotation
- arxiv url: http://arxiv.org/abs/2205.11563v1
- Date: Mon, 23 May 2022 18:37:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-25 14:30:11.736810
- Title: Accelerating the creation of instance segmentation training sets through
bounding box annotation
- Title(参考訳): 境界ボックスアノテーションによるインスタンスセグメンテーショントレーニングセット作成の高速化
- Authors: Niels Sayez and Christophe De Vleeschouwer
- Abstract要約: 我々の研究は、半自動的なアプローチに基づいて、インスタンスを3つのステップで記述することを提案する。
極端点の唯一の定義は、マスクが完全に手動で記述された場合、最大10倍の資源を必要とするモデル精度をもたらす。
- 参考スコア(独自算出の注目度): 25.85927871251385
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Collecting image annotations remains a significant burden when deploying CNN
in a specific applicative context. This is especially the case when the
annotation consists in binary masks covering object instances. Our work
proposes to delineate instances in three steps, based on a semi-automatic
approach: (1) the extreme points of an object (left-most, right-most, top,
bottom pixels) are manually defined, thereby providing the object bounding-box,
(2) a universal automatic segmentation tool like Deep Extreme Cut is used to
turn the bounded object into a segmentation mask that matches the extreme
points; and (3) the predicted mask is manually corrected. Various strategies
are then investigated to balance the human manual annotation resources between
bounding-box definition and mask correction, including when the correction of
instance masks is prioritized based on their overlap with other instance
bounding-boxes, or the outcome of an instance segmentation model trained on a
partially annotated dataset. Our experimental study considers a teamsport
player segmentation task, and measures how the accuracy of the Panoptic-Deeplab
instance segmentation model depends on the human annotation resources
allocation strategy. It reveals that the sole definition of extreme points
results in a model accuracy that would require up to 10 times more resources if
the masks were defined through fully manual delineation of instances. When
targeting higher accuracies, prioritizing the mask correction among the
training set instances is also shown to save up to 80\% of correction
annotation resources compared to a systematic frame by frame correction of
instances, for a same trained instance segmentation model accuracy.
- Abstract(参考訳): 特定のアプリケーションコンテキストでCNNをデプロイする場合、イメージアノテーションの収集は依然として大きな負担となる。
特に、アノテーションがオブジェクトインスタンスをカバーするバイナリマスクで構成されている場合です。
本研究は,(1)物体の極端点(最左端,最上端,最下端,最下端)を手動で定義し,オブジェクト境界ボックスを提供すること,(2)Deep Extreme Cutのような普遍的な自動セグメンテーションツールを用いて,限界点と一致するセグメンテーションマスクに変換すること,(3)予測マスクを手動で修正することを提案する。
次に、他のインスタンス境界ボックスとの重なり合いに基づいて、インスタンスマスクの修正が優先される場合や、部分的に注釈付きデータセットでトレーニングされたインスタンスセグメンテーションモデルの結果など、人手によるアノテーションリソースをバウンディングボックス定義とマスク修正のバランスをとるための様々な戦略が検討される。
本研究では,teamsport playerのセグメンテーションタスクを考察し,panoptic-deeplabインスタンスセグメンテーションモデルの精度がヒューマンアノテーションリソース割り当て戦略に依存するかを測定する。
極点の唯一の定義は、マスクが完全に手動で記述されたインスタンスによって定義された場合、最大10倍のリソースを必要とするモデル精度をもたらす。
より高い精度を目標とする場合、トレーニングセットインスタンス間でマスク補正を優先順位付けすると、同じトレーニングインスタンス分割モデルの精度で、インスタンスのフレーム補正による体系的なフレームに比べて最大80%の修正アノテーションリソースが節約される。
関連論文リスト
- Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - MaskUno: Switch-Split Block For Enhancing Instance Segmentation [0.0]
マスク予測を洗練されたROIを処理し、それらを分類し、特定のマスク予測者に割り当てるスイッチスプリットブロックに置き換えることを提案する。
平均平均精度(mAP)が2.03%上昇し,80クラスにおいて高い成績を示した。
論文 参考訳(メタデータ) (2024-07-31T10:12:14Z) - Outline-Guided Object Inpainting with Diffusion Models [11.391452115311798]
インスタンスセグメンテーションデータセットは、正確で堅牢なコンピュータビジョンモデルのトレーニングにおいて重要な役割を果たす。
この問題は、小さなアノテーション付きインスタンスセグメンテーションデータセットから始めて、拡張して、サイズが拡大されたアノテーション付きデータセットを取得することで緩和できることを示す。
オブジェクトアウトラインの拡散を導くことで,対象クラスでマスク領域を埋めるために,拡散ベースの塗装モデルを用いて新しい画像を生成する。
論文 参考訳(メタデータ) (2024-02-26T09:21:17Z) - Skeleton-Guided Instance Separation for Fine-Grained Segmentation in
Microscopy [23.848474219551818]
顕微鏡(MS)画像解析における基本的な課題の1つは、インスタンスセグメンテーション(IS)である。
我々は,この課題に対処し,MS画像におけるISの精度を高めるために,A2B-ISという新しいワンステージフレームワークを提案する。
提案手法は2つの大規模MSデータセットに対して徹底的に検証されている。
論文 参考訳(メタデータ) (2024-01-18T11:14:32Z) - PWISeg: Point-based Weakly-supervised Instance Segmentation for Surgical
Instruments [27.89003436883652]
我々はPWISeg (Point-based Weakly-supervised Instance) という,弱制御型手術器具セグメンテーション手法を提案する。
PWISegは、特徴点とバウンディングボックスの関係をモデル化するために、ポイント・ツー・ボックスとポイント・ツー・マスクのブランチを備えたFCNベースのアーキテクチャを採用している。
そこで本研究では,キー・ツー・マスク・ブランチを駆動し,より正確なセグメンテーション予測を生成するキー・ピクセル・アソシエーション・ロスとキー・ピクセル・アソシエーション・ロスを提案する。
論文 参考訳(メタデータ) (2023-11-16T11:48:29Z) - Synthetic Instance Segmentation from Semantic Image Segmentation Masks [15.477053085267404]
我々は、Synthetic Instance(SISeg)と呼ばれる新しいパラダイムを提案する。
SISegインスタンスセグメンテーションの結果は、既存のセマンティックセグメンテーションモデルによって生成されたイメージマスクを活用する。
言い換えれば、提案モデルは余分な人力や高い計算コストを必要としない。
論文 参考訳(メタデータ) (2023-08-02T05:13:02Z) - Collaborative Propagation on Multiple Instance Graphs for 3D Instance
Segmentation with Single-point Supervision [63.429704654271475]
本稿では,1つのオブジェクトを1つのポイントでラベル付けするだけでよい,弱教師付き手法RWSegを提案する。
これらの疎いラベルにより、セマンティック情報とインスタンス情報を伝達する2つの分岐を持つ統一的なフレームワークを導入する。
具体的には、異なるインスタンスグラフ間の競合を促進するクロスグラフ競合ランダムウォークス(CRW)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-10T02:14:39Z) - Sparse Instance Activation for Real-Time Instance Segmentation [72.23597664935684]
本稿では,リアルタイムインスタンスセグメンテーションのための概念的・効率的・完全畳み込み型フレームワークを提案する。
SparseInstは非常に高速な推論速度を持ち、COCOベンチマークで40 FPSと37.9 APを達成した。
論文 参考訳(メタデータ) (2022-03-24T03:15:39Z) - Scaling up instance annotation via label propagation [69.8001043244044]
本稿では,オブジェクトセグメンテーションマスクを用いた大規模データセット構築のための高効率アノテーション手法を提案する。
セグメンテーションモデルによるマスク予測に階層的クラスタリングを用いることにより,これらの類似性を生かした。
総アノテーション時間はたった290時間である100万個のオブジェクトセグメンテーションマスクが得られた。
論文 参考訳(メタデータ) (2021-10-05T18:29:34Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。