論文の概要: FAIRS -- Soft Focus Generator and Attention for Robust Object
Segmentation from Extreme Points
- arxiv url: http://arxiv.org/abs/2004.02038v1
- Date: Sat, 4 Apr 2020 22:25:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 23:18:36.364736
- Title: FAIRS -- Soft Focus Generator and Attention for Robust Object
Segmentation from Extreme Points
- Title(参考訳): fairs --soft focus generatorと極限点からのロバストなオブジェクトセグメンテーションに対する注意
- Authors: Ahmed H. Shahin, Prateek Munjal, Ling Shao, Shadab Khan
- Abstract要約: 本稿では,ユーザ入力からオブジェクトのセグメンテーションを極端点と補正クリックの形で生成する手法を提案する。
提案手法は,エクストリームポイント,クリック誘導,修正クリックを原則として組み込んだ,高品質なトレーニングデータを生成する能力とスケーラビリティを実証する。
- 参考スコア(独自算出の注目度): 70.65563691392987
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation from user inputs has been actively studied to
facilitate interactive segmentation for data annotation and other applications.
Recent studies have shown that extreme points can be effectively used to encode
user inputs. A heat map generated from the extreme points can be appended to
the RGB image and input to the model for training. In this study, we present
FAIRS -- a new approach to generate object segmentation from user inputs in the
form of extreme points and corrective clicks. We propose a novel approach for
effectively encoding the user input from extreme points and corrective clicks,
in a novel and scalable manner that allows the network to work with a variable
number of clicks, including corrective clicks for output refinement. We also
integrate a dual attention module with our approach to increase the efficacy of
the model in preferentially attending to the objects. We demonstrate that these
additions help achieve significant improvements over state-of-the-art in dense
object segmentation from user inputs, on multiple large-scale datasets. Through
experiments, we demonstrate our method's ability to generate high-quality
training data as well as its scalability in incorporating extreme points,
guiding clicks, and corrective clicks in a principled manner.
- Abstract(参考訳): ユーザ入力からのセマンティックセグメンテーションを積極的に研究し、データアノテーションやその他のアプリケーションに対するインタラクティブセグメンテーションを促進する。
近年の研究では、ユーザ入力のエンコードに極端点を効果的に利用できることが示されている。
極端点から生成された熱マップをRGB画像に付加し、トレーニング用モデルに入力することができる。
本研究では,ユーザの入力から極端点と補正クリックの形でオブジェクトのセグメンテーションを生成する新しいアプローチであるfairsを提案する。
本稿では,ユーザが入力する過度な点や補正的なクリックを効率的にエンコードするための新しい手法を提案する。
また、オブジェクトに優先的に参加するモデルの有効性を高めるために、デュアルアテンションモジュールを我々のアプローチと統合します。
これらの追加は、複数の大規模データセット上で、ユーザ入力から高密度オブジェクトセグメンテーションの最先端よりも大幅に改善できることを実証する。
実験により,本手法は,極端点,誘導クリック,補正クリックを原則的に組み込んだ,高品質なトレーニングデータを生成する能力とスケーラビリティを実証した。
関連論文リスト
- Interactive segmentation in aerial images: a new benchmark and an open
access web-based tool [2.729446374377189]
近年,コンピュータビジョンにおける対話型セマンティックセマンティックセマンティクスは,人間とコンピュータの相互作用セマンティクスの理想的な状態を実現している。
本研究の目的は,対話型セグメンテーションモデルのベンチマークにより,対話型セグメンテーションとリモートセンシング分析のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-08-25T04:49:49Z) - CFR-ICL: Cascade-Forward Refinement with Iterative Click Loss for
Interactive Image Segmentation [2.482735440750151]
本稿では,3つの新しいコンポーネントを含むクリックベースおよびマスク誘導型インタラクティブ画像分割フレームワークを提案する。
提案フレームワークは,セグメント化結果を粗い方法で生成する統合推論フレームワークを提供する。
我々のモデルは33.2%減少し、15.5%は従来の最先端のアプローチで0.95のIoUを超えるのに必要なクリック数である。
論文 参考訳(メタデータ) (2023-03-09T23:20:35Z) - Cascaded Sparse Feature Propagation Network for Interactive Segmentation [18.584007891618096]
ユーザが提供する情報をラベルなし領域に伝播するためのクリック拡張特徴表現を学習するカスケードスパース特徴伝達ネットワークを提案する。
提案手法の有効性を,様々なベンチマークによる総合的な実験により検証し,提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2022-03-10T03:47:24Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - Interactive segmentation using U-Net with weight map and dynamic user
interactions [0.0]
本稿では,現在のセグメンテーションマスクに基づいてユーザクリックを動的にサイズに適応させるインタラクティブセグメンテーションフレームワークを提案する。
クリックされた領域は重みマップを形成し、新しい重み付き損失関数としてディープニューラルネットワークに供給される。
動的なユーザクリックサイズを適用すると、それぞれ5.60%と10.39%の精度が向上する。
論文 参考訳(メタデータ) (2021-11-18T15:08:11Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - EDN: Salient Object Detection via Extremely-Downsampled Network [66.38046176176017]
画像全体のグローバルビューを効果的に学ぶために、極端なダウンサンプリング技術を使用するExtremely-Downsampled Network(EDN)を紹介します。
実験は、ednがリアルタイム速度でsart性能を達成することを実証する。
論文 参考訳(メタデータ) (2020-12-24T04:23:48Z) - Point-Set Anchors for Object Detection, Instance Segmentation and Pose
Estimation [85.96410825961966]
中心点から抽出された画像の特徴は、離れたキーポイントや境界ボックスの境界を予測するための限られた情報を含んでいると論じる。
推論を容易にするために,より有利な位置に配置された点集合からの回帰を行うことを提案する。
我々は、オブジェクト検出、インスタンス分割、人間のポーズ推定にPoint-Set Anchorsと呼ばれるこのフレームワークを適用した。
論文 参考訳(メタデータ) (2020-07-06T15:59:56Z) - Mining Implicit Entity Preference from User-Item Interaction Data for
Knowledge Graph Completion via Adversarial Learning [82.46332224556257]
本稿では,知識グラフ補完タスクにおけるユーザインタラクションデータを活用することで,新たな逆学習手法を提案する。
我々のジェネレータはユーザインタラクションデータから分離されており、識別器の性能を向上させるのに役立ちます。
利用者の暗黙の実体的嗜好を発見するために,グラフニューラルネットワークに基づく精巧な協調学習アルゴリズムを設計する。
論文 参考訳(メタデータ) (2020-03-28T05:47:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。