論文の概要: SIN:Superpixel Interpolation Network
- arxiv url: http://arxiv.org/abs/2110.08702v1
- Date: Sun, 17 Oct 2021 02:21:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-19 16:31:55.594832
- Title: SIN:Superpixel Interpolation Network
- Title(参考訳): SIN:スーパーピクセル補間ネットワーク
- Authors: Qing Yuan, Songfeng Lu, Yan Huang, Wuxin Sha
- Abstract要約: 従来のアルゴリズムとディープラーニングベースのアルゴリズムは、スーパーピクセルセグメンテーションにおける2つの主要なストリームである。
本稿では,エンド・ツー・エンド方式で下流タスクと統合可能な深層学習に基づくスーパーピクセルセグメンテーションアルゴリズムSINを提案する。
- 参考スコア(独自算出の注目度): 9.046310874823002
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Superpixels have been widely used in computer vision tasks due to their
representational and computational efficiency. Meanwhile, deep learning and
end-to-end framework have made great progress in various fields including
computer vision. However, existing superpixel algorithms cannot be integrated
into subsequent tasks in an end-to-end way. Traditional algorithms and deep
learning-based algorithms are two main streams in superpixel segmentation. The
former is non-differentiable and the latter needs a non-differentiable
post-processing step to enforce connectivity, which constraints the integration
of superpixels and downstream tasks. In this paper, we propose a deep
learning-based superpixel segmentation algorithm SIN which can be integrated
with downstream tasks in an end-to-end way. Owing to some downstream tasks such
as visual tracking require real-time speed, the speed of generating superpixels
is also important. To remove the post-processing step, our algorithm enforces
spatial connectivity from the start. Superpixels are initialized by sampled
pixels and other pixels are assigned to superpixels through multiple updating
steps. Each step consists of a horizontal and a vertical interpolation, which
is the key to enforcing spatial connectivity. Multi-layer outputs of a fully
convolutional network are utilized to predict association scores for
interpolations. Experimental results show that our approach runs at about 80fps
and performs favorably against state-of-the-art methods. Furthermore, we design
a simple but effective loss function which reduces much training time. The
improvements of superpixel-based tasks demonstrate the effectiveness of our
algorithm. We hope SIN will be integrated into downstream tasks in an
end-to-end way and benefit the superpixel-based community. Code is available
at: \href{https://github.com/yuanqqq/SIN}{https://github.com/yuanqqq/SIN}.
- Abstract(参考訳): スーパーピクセルは、その表現効率と計算効率のためにコンピュータビジョンタスクで広く使われている。
一方、ディープラーニングとエンドツーエンドフレームワークはコンピュータビジョンを含む様々な分野で大きな進歩を遂げている。
しかし、既存のスーパーピクセルアルゴリズムは、エンドツーエンドで後続のタスクに統合することはできない。
従来のアルゴリズムとディープラーニングベースのアルゴリズムは、スーパーピクセルセグメンテーションの主要な2つのストリームである。
前者は非微分可能であり、後者は、スーパーピクセルと下流タスクの統合を制約する接続を強制するために、非微分後処理ステップが必要である。
本稿では,エンド・ツー・エンド方式で下流タスクと統合可能な深層学習に基づくスーパーピクセルセグメンテーションアルゴリズムSINを提案する。
ビジュアルトラッキングなどの下流タスクでは、リアルタイムな速度を必要とするため、スーパーピクセルの生成速度も重要である。
処理後のステップを取り除くために,本アルゴリズムでは,初期から空間接続を強制する。
スーパーピクセルはサンプルされたピクセルによって初期化され、他のピクセルは複数の更新ステップを通じてスーパーピクセルに割り当てられる。
各ステップは水平および垂直の補間で構成されており、空間的接続を強制する鍵となる。
完全畳み込みネットワークの多層出力を用いて補間のための相関スコアを予測する。
実験の結果,提案手法は80fpsで動作し,最先端の手法に対して良好に動作していることがわかった。
さらに,学習時間を短縮する簡易かつ効果的な損失関数を設計する。
スーパーピクセルに基づくタスクの改善は,アルゴリズムの有効性を示す。
SINをエンドツーエンドでダウンストリームタスクに統合し、スーパーピクセルベースのコミュニティに恩恵をもたらすことを期待しています。
コードは以下の通り。 \href{https://github.com/yuanqqq/SIN}{https://github.com/yuanqq/SIN}。
関連論文リスト
- Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - Superpixel Transformers for Efficient Semantic Segmentation [32.537400525407186]
本稿では,画像の過剰部分化というスーパーピクセルの考え方を活用し,近代的なトランスフォーマーフレームワークでそれらを適用することによって,その解決策を提案する。
提案手法は,グローバルな自己認識機構によって生成されるリッチなスーパーピクセル特徴により,セマンティックセマンティックセグメンテーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2023-09-28T23:09:30Z) - Superpixels algorithms through network community detection [0.0]
コミュニティ検出は複雑なネットワーク分析の強力なツールであり、様々な研究分野の応用を見出すことができる。
スーパーピクセルは、可能な限りオリジナル情報を保存しながら、画像をより小さなレベルで表現することを目的としている。
4つの連結画素グラフ上で,最先端のコミュニティ検出アルゴリズムによって計算されたスーパーピクセルの効率について検討した。
論文 参考訳(メタデータ) (2023-08-27T13:13:28Z) - Efficient Multiscale Object-based Superpixel Framework [62.48475585798724]
我々は,SICLE(Iterative CLEarcutting)によるスーパーピクセルという,新しいスーパーピクセルフレームワークを提案する。
SICLEは、複数スケールのセグメンテーションをオンザフライで生成できるオブジェクト情報を利用する。
これは最近のスーパーピクセル法を一般化し、複数のデライン化指標に従って効率と効率性に関する最先端のアプローチを超越している。
論文 参考訳(メタデータ) (2022-04-07T15:59:38Z) - Saliency Enhancement using Superpixel Similarity [77.34726150561087]
Saliency Object Detection (SOD) は画像解析にいくつかの応用がある。
深層学習に基づくSOD法は最も効果的であるが、類似した色を持つ前景の部品を見逃すことがある。
スーパーピクセル類似性(SESS)に対するtextitSaliency Enhancement というポストプロセッシング手法を導入する。
我々は,SESSが5つの画像データセット上での3つのディープラーニングに基づくSOD手法の結果を連続的に,かつ著しく改善できることを実証した。
論文 参考訳(メタデータ) (2021-12-01T17:22:54Z) - Generating Superpixels for High-resolution Images with Decoupled Patch
Calibration [82.21559299694555]
Patch Networks (PCNet) は高解像度のスーパーピクセルセグメンテーションを効率的かつ正確に実装するように設計されている。
DPCは高解像度画像から局所パッチを取得し、動的にバイナリマスクを生成し、ネットワークを領域境界に集中させる。
特に、DPCは高解像度画像からローカルパッチを取り、動的にバイナリマスクを生成して、ネットワークを領域境界に集中させる。
論文 参考訳(メタデータ) (2021-08-19T10:33:05Z) - HERS Superpixels: Deep Affinity Learning for Hierarchical Entropy Rate
Segmentation [0.0]
スーパーピクセルセグメンテーションのための2段階グラフベースのフレームワークを提案する。
最初の段階では,ペアワイズ画素親和性を学習するディープ親和性学習ネットワークを導入する。
第2段階では階層エントロピーレート(HERS)と呼ばれる高効率スーパーピクセル法を提案する。
論文 参考訳(メタデータ) (2021-06-07T16:20:04Z) - Implicit Integration of Superpixel Segmentation into Fully Convolutional
Networks [11.696069523681178]
スーパーピクセル方式をCNNに暗黙的に統合する方法を提案する。
提案手法では,下地層に画素を階層的にグループ化し,スーパーピクセルを生成する。
本手法は,セマンティックセグメンテーション,スーパーピクセルセグメンテーション,モノクル深度推定などのタスクで評価する。
論文 参考訳(メタデータ) (2021-03-05T02:20:26Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Propagate Yourself: Exploring Pixel-Level Consistency for Unsupervised
Visual Representation Learning [60.75687261314962]
我々は,高密度な特徴表現を学習するための画素レベルのプレテキストタスクを導入する。
ピクセル・ツー・プロパゲーション整合性タスクは、最先端のアプローチよりも優れた結果をもたらす。
結果は、ピクセルレベルでプリテキストタスクを定義する強力な可能性を示している。
論文 参考訳(メタデータ) (2020-11-19T18:59:45Z) - Superpixel Segmentation with Fully Convolutional Networks [32.878045921919714]
本稿では,通常の画像グリッド上でのスーパーピクセルの予測に完全畳み込みネットワークを用いる新しい手法を提案する。
ベンチマーク・データセットによる実験結果から,提案手法は最先端のスーパーピクセル・セグメンテーション性能を実現することが示された。
ステレオマッチングのための人気のあるネットワークアーキテクチャを改良し、スーパーピクセルと格差を同時に予測する。
論文 参考訳(メタデータ) (2020-03-29T02:42:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。