論文の概要: Improving Pixel Embedding Learning through Intermediate Distance
Regression Supervision for Instance Segmentation
- arxiv url: http://arxiv.org/abs/2007.06660v1
- Date: Mon, 13 Jul 2020 20:03:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 00:26:15.828240
- Title: Improving Pixel Embedding Learning through Intermediate Distance
Regression Supervision for Instance Segmentation
- Title(参考訳): サンプルセグメンテーションのための中間距離回帰監督による画素埋め込み学習の改善
- Authors: Yuli Wu, Long Chen, Dorit Merhof
- Abstract要約: 本稿では,オブジェクト認識型埋め込み学習のための,シンプルで効果的なアーキテクチャを提案する。
距離回帰モジュールをアーキテクチャに組み込んで,高速クラスタリングのためのシードを生成する。
距離回帰モジュールによって学習された特徴は、学習対象認識の埋め込みの精度を大幅に向上させることができることを示す。
- 参考スコア(独自算出の注目度): 8.870513218826083
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a proposal-free approach, instance segmentation through pixel embedding
learning and clustering is gaining more emphasis. Compared with bounding box
refinement approaches, such as Mask R-CNN, it has potential advantages in
handling complex shapes and dense objects. In this work, we propose a simple,
yet highly effective, architecture for object-aware embedding learning. A
distance regression module is incorporated into our architecture to generate
seeds for fast clustering. At the same time, we show that the features learned
by the distance regression module are able to promote the accuracy of learned
object-aware embeddings significantly. By simply concatenating features of the
distance regression module to the images as inputs of the embedding module, the
mSBD scores on the CVPPP Leaf Segmentation Challenge can be further improved by
more than 8% compared to the identical set-up without concatenation, yielding
the best overall result amongst the leaderboard at CodaLab.
- Abstract(参考訳): 提案のないアプローチとして,ピクセル埋め込み学習とクラスタリングによるインスタンスセグメンテーションが注目されている。
Mask R-CNNのようなバウンディングボックスリファインメントアプローチと比較すると、複雑な形状や高密度オブジェクトを扱う上で潜在的に有利である。
本稿では,オブジェクト指向組込み学習のための簡易かつ高効率なアーキテクチャを提案する。
距離回帰モジュールをアーキテクチャに組み込んで,高速クラスタリングのためのシードを生成する。
同時に, 距離回帰モジュールが学習した特徴が, 学習対象認識の埋め込みの精度を著しく向上させることができることを示す。
CVPPPリーフセグメンテーションチャレンジのmSBDスコアは、画像への距離回帰モジュールの特徴を埋め込みモジュールの入力として簡単に結合することにより、連結のない同一のセットアップに比べて8%以上改善することができ、CodaLabのリーダーボードで最高の総合結果が得られる。
関連論文リスト
- Multi-Level Aggregation and Recursive Alignment Architecture for Efficient Parallel Inference Segmentation Network [18.47001817385548]
セグメンテーションタスク用にカスタマイズされた並列推論ネットワークを提案する。
実時間速度を確保するために浅いバックボーンを使用し、モデル容量の削減と精度の向上のために3つのコアコンポーネントを提案する。
我々のフレームワークは、CityscapesとCamVidデータセットの最先端のリアルタイム手法よりも、速度と精度のバランスが良くなっている。
論文 参考訳(メタデータ) (2024-02-03T22:51:17Z) - SRFormer: Text Detection Transformer with Incorporated Segmentation and
Regression [6.74412860849373]
本稿では,アマルガメーションと回帰を併用した統合DTRモデルSRFormerを提案する。
実験分析により,初期デコーダ層で良好なセグメンテーション予測が得られることが示された。
提案手法の強靭性,優れたトレーニングとデータ効率,および最先端の性能について検討した。
論文 参考訳(メタデータ) (2023-08-21T07:34:31Z) - Hi-ResNet: Edge Detail Enhancement for High-Resolution Remote Sensing Segmentation [10.919956120261539]
高分解能リモートセンシング(HRS)セマンティックセマンティクスは、高分解能カバレッジ領域からキーオブジェクトを抽出する。
HRS画像内の同じカテゴリのオブジェクトは、多様な地理的環境におけるスケールと形状の顕著な違いを示す。
効率的なネットワーク構造を持つ高分解能リモートセンシングネットワーク(Hi-ResNet)を提案する。
論文 参考訳(メタデータ) (2023-05-22T03:58:25Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Deep Relational Metric Learning [84.95793654872399]
本稿では,画像クラスタリングと検索のためのディープリレーショナルメトリック学習フレームワークを提案する。
我々は、クラス間分布とクラス内分布の両方をモデル化するために、異なる側面から画像を特徴付ける特徴のアンサンブルを学ぶ。
広く使われているCUB-200-2011、Cars196、Stanford Online Productsデータセットの実験は、我々のフレームワークが既存の深層学習方法を改善し、非常に競争力のある結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-08-23T09:31:18Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - Joint Self-Attention and Scale-Aggregation for Self-Calibrated Deraining
Network [13.628218953897946]
本稿では,JDNetとよばれる有効アルゴリズムを提案する。
自己校正畳み込みを用いたスケール・アグリゲーション・セルフアグリゲーション・モジュールを巧みに設計することにより,提案モデルはより優れたデコレーション結果が得られる。
論文 参考訳(メタデータ) (2020-08-06T17:04:34Z) - Sequential Hierarchical Learning with Distribution Transformation for
Image Super-Resolution [83.70890515772456]
画像SRのための逐次階層学習型超解像ネットワーク(SHSR)を構築した。
特徴のスケール間相関を考察し、階層的情報を段階的に探索するシーケンシャルなマルチスケールブロック(SMB)を考案する。
実験結果から,SHSRは最先端手法に優れた定量的性能と視覚的品質が得られることが示された。
論文 参考訳(メタデータ) (2020-07-19T01:35:53Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。