Fugu-MT 論文翻訳(概要): IFSENet : Harnessing Sparse Iterations for Interactive Few-shot Segmentation Excellence

論文の概要: IFSENet : Harnessing Sparse Iterations for Interactive Few-shot Segmentation Excellence

arxiv url: http://arxiv.org/abs/2403.15089v1
Date: Fri, 22 Mar 2024 10:15:53 GMT
ステータス: 翻訳完了
システム内更新日: 2024-03-25 17:48:36.103903
Title: IFSENet : Harnessing Sparse Iterations for Interactive Few-shot Segmentation Excellence
Title（参考訳）: IFSENet : 対話型Few-shotセグメンテーションのハーネス化
Authors: Shreyas Chandgothia, Ardhendu Sekhar, Amit Sethi,
Abstract要約: 新しいクラスのセグメンテーションを学ぶために必要な画像の数を減らします。インタラクティブなセグメンテーション技術は、一度に1つのオブジェクトのセグメンテーションを漸進的に改善することのみに焦点を当てます。 2つの概念を組み合わせることで、新しいクラスのセグメンテーションモデルをトレーニングするのに要する労力を大幅に削減する。
参考スコア（独自算出の注目度）: 2.822194296769473
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Training a computer vision system to segment a novel class typically requires collecting and painstakingly annotating lots of images with objects from that class. Few-shot segmentation techniques reduce the required number of images to learn to segment a new class, but careful annotations of object boundaries are still required. On the other hand, interactive segmentation techniques only focus on incrementally improving the segmentation of one object at a time (typically, using clicks given by an expert) in a class-agnostic manner. We combine the two concepts to drastically reduce the effort required to train segmentation models for novel classes. Instead of trivially feeding interactive segmentation masks as ground truth to a few-shot segmentation model, we propose IFSENet, which can accept sparse supervision on a single or few support images in the form of clicks to generate masks on support (training, at least clicked upon once) as well as query (test, never clicked upon) images. To trade-off effort for accuracy flexibly, the number of images and clicks can be incrementally added to the support set to further improve the segmentation of support as well as query images. The proposed model approaches the accuracy of previous state-of-the-art few-shot segmentation models with considerably lower annotation effort (clicks instead of maps), when tested on Pascal and SBD datasets on query images. It also works well as an interactive segmentation method on support images.
Abstract（参考訳）: コンピュータビジョンシステムをトレーニングして、新しいクラスをセグメンテーションするには、多くの画像にそのクラスのオブジェクトを注釈付けする必要がある。ほとんどショットのセグメンテーション技術は、新しいクラスのセグメンテーションを学ぶために必要な画像数を減らすが、オブジェクト境界に対する注意深いアノテーションは依然として必要である。一方、インタラクティブなセグメンテーション技術は、クラスに依存しない方法で1つのオブジェクトのセグメンテーションを段階的に改善することのみに焦点を当てている。 2つの概念を組み合わせることで、新しいクラスのセグメンテーションモデルをトレーニングするのに要する労力を大幅に削減する。対話型セグメンテーションマスクを数発のセグメンテーションモデルに自明に供給する代わりに、単一または少数のサポートイメージに対するスパース・インスペクションをクリック形式で受け入れ、サポート中のマスク(トレーニング、少なくとも一度クリック)とクエリ(テスト、決してクリックしない)イメージを生成するIFSENetを提案する。精度を柔軟にトレードオフするために、サポートセットに画像とクリックの数を漸進的に追加して、サポートのセグメンテーションとクエリイメージをさらに改善することができる。提案モデルでは,クエリ画像上のPascalデータセットとSBDデータセットでテストした場合,アノテーションの労力がかなり小さく(地図の代わりにクリックする),従来の数ショットセグメンテーションモデルの精度にアプローチする。また、サポート画像の対話的セグメンテーション手法としても機能する。

関連論文リスト

MultiverSeg: Scalable Interactive Segmentation of Biomedical Imaging Datasets with In-Context Guidance [3.7015512365236907]
既存のラベル付きデータへのアクセスを必要とせずに、新しいデータセット全体を迅速にセグメント化するシステムを導入する。画像のセグメント化とともに、クリックやバウンディングボックス、スクリブルといったユーザインタラクションを入力として取り、セグメント化を予測する。我々は,MultiverSegによって,画像毎のインタラクション数を減らし,正確なセグメンテーションを実現することにより,対話的に新しいデータセットを効率的にセグメント化できることを実証した。
論文参考訳（メタデータ） (2024-12-19T17:06:53Z)
Learning from Exemplars for Interactive Image Segmentation [15.37506525730218]
同一カテゴリにおける1つのオブジェクトと複数のオブジェクトの両方に対して、新しい対話的セグメンテーションフレームワークを導入する。当社のモデルでは,ターゲットIoUの85%と90%を達成するために,クリック数が2回削減されるため,ユーザの労力を約15%削減する。
論文参考訳（メタデータ） (2024-06-17T12:38:01Z)
Text and Click inputs for unambiguous open vocabulary instance segmentation [21.03169732771627]
そこで本研究では,画像入力としてモデルが取る新たなセグメンテーションプロセスであるText + Clickと,セグメンテーションにクラスを記述するテキストフレーズと,セグメンテーションにインスタンスを指定する1つのフォアグラウンドクリックを提案する。ユーザが指定した1つのフォアグラウンドクリックとテキストプロンプトを組み合わせることで、モデルの重複や共起のセマンティックカテゴリをより曖昧にすることができることを示す。
論文参考訳（メタデータ） (2023-11-24T19:37:57Z)
Self-Correlation and Cross-Correlation Learning for Few-Shot Remote Sensing Image Semantic Segmentation [27.59330408178435]
リモートセマンティックセマンティックセマンティックセマンティクスは、クエリイメージからターゲットオブジェクトをセグメントすることを学ぶことを目的としている。本稿では,数発のリモートセンシング画像セマンティックセマンティックセグメンテーションのための自己相関・相互相関学習ネットワークを提案する。本モデルは,サポート画像とクエリ画像の自己相関と相互相関の両方を考慮し,一般化を促進させる。
論文参考訳（メタデータ） (2023-09-11T21:53:34Z)
DynaMITe: Dynamic Query Bootstrapping for Multi-object Interactive Segmentation Transformer [58.95404214273222]
最先端のインスタンスセグメンテーション手法の多くは、訓練のために大量のピクセル精度のグランドトルースに依存している。ユーザインタラクションを時間的クエリとして表現するDynaMITeという,より効率的なアプローチを導入する。我々のアーキテクチャはまた、改善中にイメージ機能を再計算する必要をなくし、単一のイメージに複数のインスタンスをセグメント化するためのインタラクションを少なくする。
論文参考訳（メタデータ） (2023-04-13T16:57:02Z)
Semantically Meaningful Class Prototype Learning for One-Shot Image Semantic Segmentation [58.96902899546075]
ワンショットセマンティックイメージセグメンテーションは、1つの注釈付きイメージで新しいクラスのオブジェクト領域を分割することを目的としている。最近の研究では、テスト時に予想される状況を模倣するために、エピソディクストレーニング戦略を採用している。エピソードトレーニングにおいて,マルチクラスラベル情報を活用することを提案する。ネットワークが各カテゴリに対してより意味のある機能を生成するように促すだろう。
論文参考訳（メタデータ） (2021-02-22T12:07:35Z)
Group-Wise Semantic Mining for Weakly Supervised Semantic Segmentation [49.90178055521207]
この研究は、画像レベルのアノテーションとピクセルレベルのセグメンテーションのギャップを埋めることを目標に、弱い監督されたセマンティックセグメンテーション(WSSS)に対処する。画像群における意味的依存関係を明示的にモデル化し,より信頼性の高い擬似的基盤構造を推定する,新たなグループ学習タスクとしてWSSSを定式化する。特に、入力画像がグラフノードとして表現されるグループ単位のセマンティックマイニングのためのグラフニューラルネットワーク(GNN)を考案する。
論文参考訳（メタデータ） (2020-12-09T12:40:13Z)
Multi-Stage Fusion for One-Click Segmentation [20.00726292545008]
対話型セグメンテーションのための多段階ガイダンスフレームワークを提案する。提案フレームワークは,早期融合フレームワークと比較してパラメータ数の増加は無視できない。
論文参考訳（メタデータ） (2020-10-19T17:07:40Z)
BriNet: Towards Bridging the Intra-class and Inter-class Gaps in One-Shot Segmentation [84.2925550033094]
ほとんどショットのセグメンテーションは、限られたトレーニングサンプルで見えないオブジェクトインスタンスをセグメンテーションするためのモデルの一般化に焦点を当てている。本稿では,クエリの抽出した特徴とサポートイメージのギャップを埋めるフレームワーク BriNet を提案する。本フレームワークの有効性は,他の競合手法よりも優れる実験結果によって実証された。
論文参考訳（メタデータ） (2020-08-14T07:45:50Z)
Part-aware Prototype Network for Few-shot Semantic Segmentation [50.581647306020095]
本稿では,プロトタイプ表現に基づく新規な数ショットセマンティックセマンティックセマンティクスフレームワークを提案する。私たちのキーとなるアイデアは、全体論的なクラス表現を、部分認識型プロトタイプのセットに分解することです。提案する部分認識型プロトタイプを生成・拡張する新しいグラフニューラルネットワークモデルを開発した。
論文参考訳（メタデータ） (2020-07-13T11:03:09Z)
CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。 PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文参考訳（メタデータ） (2020-03-24T04:55:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。