論文の概要: Learning Equivariant Segmentation with Instance-Unique Querying
- arxiv url: http://arxiv.org/abs/2210.00911v1
- Date: Mon, 3 Oct 2022 13:14:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 15:52:35.384964
- Title: Learning Equivariant Segmentation with Instance-Unique Querying
- Title(参考訳): instance-uniqueクエリによる等価セグメンテーションの学習
- Authors: Wenguan Wang, James Liang, Dongfang Liu
- Abstract要約: 我々は、差別的なクエリ埋め込み学習を通じて、クエリベースのモデルを強化する新しいトレーニングフレームワークを考案した。
我々のアルゴリズムは、トレーニングデータセット全体から対応するインスタンスを検索するためにクエリを使用します。
4つの有名なクエリベースのモデルに加えて、トレーニングアルゴリズムは大きなパフォーマンス向上を提供します。
- 参考スコア(独自算出の注目度): 47.52528819153683
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prevalent state-of-the-art instance segmentation methods fall into a
query-based scheme, in which instance masks are derived by querying the image
feature using a set of instance-aware embeddings. In this work, we devise a new
training framework that boosts query-based models through discriminative query
embedding learning. It explores two essential properties, namely dataset-level
uniqueness and transformation equivariance, of the relation between queries and
instances. First, our algorithm uses the queries to retrieve the corresponding
instances from the whole training dataset, instead of only searching within
individual scenes. As querying instances across scenes is more challenging, the
segmenters are forced to learn more discriminative queries for effective
instance separation. Second, our algorithm encourages both image (instance)
representations and queries to be equivariant against geometric
transformations, leading to more robust, instance-query matching. On top of
four famous, query-based models ($i.e.,$ CondInst, SOLOv2, SOTR, and
Mask2Former), our training algorithm provides significant performance gains
($e.g.,$ +1.6 - 3.2 AP) on COCO dataset. In addition, our algorithm promotes
the performance of SOLOv2 by 2.7 AP, on LVISv1 dataset.
- Abstract(参考訳): 一般的な最先端のインスタンスセグメンテーションメソッドは、クエリベースのスキームに該当する。インスタンスマスクは、インスタンス認識の埋め込みセットを使用して画像機能に問い合わせることによって引き起こされる。
本研究では,クエリベースのモデルを識別型クエリ埋め込み学習によって強化する新たなトレーニングフレームワークを考案する。
クエリとインスタンスの関係について、データセットレベルの一意性と変換の同値性という2つの重要な性質を探求する。
まず,本アルゴリズムでは,各シーン内でのみ検索するのではなく,クエリを用いてトレーニングデータセット全体から対応するインスタンスを検索する。
シーンにまたがるインスタンスのクエリがより難しいため、セグメンタは効果的なインスタンス分離のためにより識別的なクエリを学ぶことを余儀なくされる。
第2に,画像表現と問合せを幾何変換に対して等価にすることを推奨し,より頑健なインスタンスクエリマッチングを実現する。
有名なクエリベースの4つのモデル(例:$CondInst、SOLOv2、SOTR、Mask2Former)に加えて、トレーニングアルゴリズムはCOCOデータセット上で大きなパフォーマンス向上(例:$ +1.6 - 3.2 AP)を提供する。
さらに,本アルゴリズムは,LVISv1データセット上でSOLOv2を2.7 APで高速化する。
関連論文リスト
- FastGAS: Fast Graph-based Annotation Selection for In-Context Learning [53.17606395275021]
インコンテキスト学習(ICL)は、大規模言語モデル(LLM)に対して、一連のトレーニングインスタンスをプロンプトとして使用することにより、新しいタスクに対処する権限を与える。
既存の手法では、アノテーションのラベルなし例のサブセットを選択する方法が提案されている。
本稿では,高品質なインスタンスを効率的に識別するグラフベースの選択手法であるFastGASを提案する。
論文 参考訳(メタデータ) (2024-06-06T04:05:54Z) - LaSagnA: Language-based Segmentation Assistant for Complex Queries [39.620806493454616]
視覚のための大規模言語モデル(vLLM)は、バウンディングボックスやマスクを含む知覚結果を生成する。
本研究では,これらの問題の主な原因が,学習クエリの複雑さの不足であることを認めた。
本稿では,提案フォーマットの直接統合による課題を効果的に解決するための3つの新しい戦略を提案する。
論文 参考訳(メタデータ) (2024-04-12T14:40:45Z) - A Unified Query-based Paradigm for Camouflaged Instance Segmentation [26.91533966120182]
本稿では,UQFormer と呼ばれるキャモフラージュされたインスタンスセグメンテーションのための,クエリベースの統合型マルチタスク学習フレームワークを提案する。
本モデルでは,インスタンスセグメンテーションをクエリに基づく直接セット予測問題とみなすが,非最大抑圧のような後処理は不要である。
最先端の14のアプローチと比較して、UQFormerは、camouflagedインスタンスセグメンテーションのパフォーマンスを大幅に改善します。
論文 参考訳(メタデータ) (2023-08-14T18:23:18Z) - Learning Dynamic Query Combinations for Transformer-based Object
Detection and Segmentation [37.24532930188581]
トランスフォーマーに基づく検出とセグメンテーション方法は、学習された検出クエリのリストを使用して、トランスフォーマーネットワークから情報を取得する。
学習したクエリの無作為な凸の組み合わせは、まだ対応するモデルに相応しいことを実証的に見出した。
本稿では,画像の高レベルな意味論に基づいて,動的係数と凸の組み合わせを学習することを提案する。
論文 参考訳(メタデータ) (2023-07-23T06:26:27Z) - Instance Image Retrieval by Learning Purely From Within the Dataset [26.59077238274763]
本研究は,従来は画像検索について十分な研究が行われていなかった,別のアプローチを考察する。
自己教師付き学習のための画像領域を生成するためにオブジェクト提案ジェネレータを追加することで、探索対象のデータセットに固有の特徴表現をうまく学習することができる。
実験的に検証されたように、このような単純な自己教師付き学習と自己ブーティングのアプローチは、関連する最先端の検索手法とよく競合する。
論文 参考訳(メタデータ) (2022-08-12T04:51:53Z) - Parallel Instance Query Network for Named Entity Recognition [73.30174490672647]
名前付きエンティティ認識(NER)は自然言語処理の基本課題である。
最近の研究は、名前付きエンティティ認識を読み取り理解タスクとして扱い、エンティティを抽出するためにタイプ固有のクエリを手動で構築している。
本稿では,グローバルかつ学習可能なインスタンスクエリを並列に抽出するParallel Instance Query Network (PIQN)を提案する。
論文 参考訳(メタデータ) (2022-03-20T13:01:25Z) - SOLO: A Simple Framework for Instance Segmentation [84.00519148562606]
インスタンスカテゴリ"は、インスタンスの場所に応じて、インスタンス内の各ピクセルにカテゴリを割り当てる。
SOLO"は、強力なパフォーマンスを備えたインスタンスセグメンテーションのための、シンプルで、直接的で、高速なフレームワークです。
提案手法は, 高速化と精度の両面から, 実例分割の最先端結果を実現する。
論文 参考訳(メタデータ) (2021-06-30T09:56:54Z) - QueryInst: Parallelly Supervised Mask Query for Instance Segmentation [53.5613957875507]
本稿では,動的マスクヘッドの並列監視によるクエリベースインスタンスセグメンテーション手法であるqueryinstを提案する。
COCO、CityScapes、YouTube-VISの3つの挑戦的なベンチマークについて広範な実験を行っています。
QueryInstは、すべてのオンラインVISアプローチの中で最高のパフォーマンスを達成し、十分なスピード精度のトレードオフを打ち負かす。
論文 参考訳(メタデータ) (2021-05-05T08:38:25Z) - Conditional Convolutions for Instance Segmentation [109.2706837177222]
我々はCondInstと呼ばれるシンプルだが効果的なインスタンスセグメンテーションフレームワークを提案する。
インスタンスに条件付き動的インスタンス認識ネットワークを採用しています。
本稿では,精度と推論速度の両面で性能の向上を実現するための,より単純なインスタンス分割法を示す。
論文 参考訳(メタデータ) (2020-03-12T08:42:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。