論文の概要: AinnoSeg: Panoramic Segmentation with High Perfomance
- arxiv url: http://arxiv.org/abs/2007.10591v1
- Date: Tue, 21 Jul 2020 04:16:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 04:39:33.163618
- Title: AinnoSeg: Panoramic Segmentation with High Perfomance
- Title(参考訳): ainnoseg:高いパーフォマンスを持つパノラマセグメンテーション
- Authors: Jiahong Wu, Jianfei Lu, Xinxin Kang, Yiming Zhang, Yinhang Tang,
Jianfei Song, Ze Huang, Shenglan Ben, Jiashui Huang, Faen Zhang
- Abstract要約: 現在のパノラマセグメンテーションアルゴリズムは文脈意味論に関係しているが、画像の詳細は十分に処理されていない。
これらの課題に対処するために,本稿ではいくつかの有用なトリックを提案する。
AinnoSegと名付けられたこれらの操作はすべて、よく知られたデータセットADE20Kで最先端のパフォーマンスを達成することができる。
- 参考スコア(独自算出の注目度): 4.867465475957119
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Panoramic segmentation is a scene where image segmentation tasks is more
difficult. With the development of CNN networks, panoramic segmentation tasks
have been sufficiently developed.However, the current panoramic segmentation
algorithms are more concerned with context semantics, but the details of image
are not processed enough. Moreover, they cannot solve the problems which
contains the accuracy of occluded object segmentation,little object
segmentation,boundary pixel in object segmentation etc. Aiming to address these
issues, this paper presents some useful tricks. (a) By changing the basic
segmentation model, the model can take into account the large objects and the
boundary pixel classification of image details. (b) Modify the loss function so
that it can take into account the boundary pixels of multiple objects in the
image. (c) Use a semi-supervised approach to regain control of the training
process. (d) Using multi-scale training and reasoning. All these operations
named AinnoSeg, AinnoSeg can achieve state-of-art performance on the well-known
dataset ADE20K.
- Abstract(参考訳): パノラマセグメンテーションは、画像セグメンテーションタスクがより難しいシーンである。
cnnネットワークの発展に伴いパノラマセグメンテーションタスクが十分に開発されているが、現在のパノラマセグメンテーションアルゴリズムは文脈意味論に重点を置いているが、画像の詳細は十分に処理されていない。
さらに、オクルードされたオブジェクトセグメンテーションの精度、小さなオブジェクトセグメンテーション、オブジェクトセグメンテーションにおけるバウンダリーピクセルなどを含む問題は解決できない。
この問題に対処するため,本稿では有用な手法を提案する。
(a) 基本セグメンテーションモデルを変更することにより, 画像の詳細の大規模オブジェクトと境界画素の分類を考慮に入れることができる。
b) 画像内の複数のオブジェクトの境界画素を考慮に入れられるように損失関数を変更する。
(c)訓練過程の制御を取り戻すために半監督的アプローチを用いる。
(d)マルチスケールトレーニングと推論を用いた。
AinnoSegと名付けられたこれらの操作はすべて、よく知られたデータセットADE20Kで最先端のパフォーマンスを達成することができる。
関連論文リスト
- Superpixel Segmentation: A Long-Lasting Ill-Posed Problem [1.104960878651584]
スーパーピクセルの分割は,スーパーピクセルの形状とサイズに暗黙の規則性制約があるため,基本的に不適切な問題であることを示す。
我々は,超画素セグメンテーションタスクを専用にトレーニングすることなく,SAM(Segment Anything Model)のような最近のアーキテクチャを用いて,競争力のある結果が得られることを示す。
論文 参考訳(メタデータ) (2024-11-10T14:31:56Z) - UnSeg: One Universal Unlearnable Example Generator is Enough against All Image Segmentation [64.01742988773745]
未承認のプライベートデータ上での大規模なイメージセグメンテーションモデルのトレーニングに関して、プライバシーに関する懸念が高まっている。
我々は、学習不可能な例の概念を利用して、学習不可能なノイズを原画像に生成し、付加することにより、モデルトレーニングに使用不能な画像を作成する。
6つのメインストリームイメージセグメンテーションタスク、10つの広く使われているデータセット、7つの異なるネットワークアーキテクチャでUnSegの有効性を実証的に検証する。
論文 参考訳(メタデータ) (2024-10-13T16:34:46Z) - A Simple Image Segmentation Framework via In-Context Examples [59.319920526160466]
本稿では,テキスト内例を利用したシンプルな画像フレームワークであるSINEを提案する。
In-context Interactionモジュールを導入し、インコンテキスト情報を補完し、ターゲット画像とインコンテキストの例との相関関係を生成する。
様々なセグメンテーションタスクの実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-07T08:59:05Z) - A Generalist Framework for Panoptic Segmentation of Images and Videos [61.61453194912186]
我々は,タスクの帰納バイアスに頼ることなく,離散的なデータ生成問題としてパノプティクスセグメンテーションを定式化する。
単純な構造と一般的な損失関数を持つパノスコープマスクをモデル化するための拡散モデルを提案する。
本手法は,動画を(ストリーミング環境で)モデル化し,オブジェクトのインスタンスを自動的に追跡することを学ぶ。
論文 参考訳(メタデータ) (2022-10-12T16:18:25Z) - Leveraging GAN Priors for Few-Shot Part Segmentation [43.35150430895919]
わずかなショット部分のセグメンテーションは、少数のサンプルしか与えられていないオブジェクトの異なる部分を切り離すことを目的としている。
本稿では,タスク固有の特徴を「事前学習」-「微調整」パラダイムで学習することを提案する。
論文 参考訳(メタデータ) (2022-07-27T10:17:07Z) - Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised
Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。
これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。
データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文 参考訳(メタデータ) (2022-05-16T17:47:44Z) - PNM: Pixel Null Model for General Image Segmentation [17.971090313814447]
ランダムセグメンタによって正しく分類される確率に応じて各ピクセルを重み付けする先行モデルを提案する。
3つのデータセットに対するセグメンテーションのセグメンテーション・タスクの実験により、PNMはセグメンテーションの品質を一貫して改善することを確認した。
本稿では,境界のシャープさを認識できる新しい測度であるtextitPNM IoUを提案する。
論文 参考訳(メタデータ) (2022-03-13T15:17:41Z) - From Explanations to Segmentation: Using Explainable AI for Image
Segmentation [1.8581514902689347]
我々は、説明可能なAI(XAI)コミュニティの進歩の上に構築し、ピクセル単位のバイナリセグメンテーションを抽出する。
我々は,既存のU-Netセグメンテーションアーキテクチャと比較して,同様の結果が得られることを示す。
トレーニングサンプルは画像レベルでのみラベル付けする必要があるため,提案手法は弱教師付きでトレーニングすることができる。
論文 参考訳(メタデータ) (2022-02-01T10:26:10Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - Learning RGB-D Feature Embeddings for Unseen Object Instance
Segmentation [67.88276573341734]
合成データからRGB-D特徴埋め込みを学習し,オブジェクトのインスタンスセグメンテーションを未確認する手法を提案する。
距離学習損失関数を用いて画素単位の機能埋め込みを学習する。
新たな2段階クラスタリングアルゴリズムにより,セグメンテーションの精度をさらに向上する。
論文 参考訳(メタデータ) (2020-07-30T00:23:07Z) - Multi-task deep learning for image segmentation using recursive
approximation tasks [5.735162284272276]
セグメンテーションのためのディープニューラルネットワークは通常、手作業で作成するのに高価な大量のピクセルレベルのラベルを必要とする。
本研究では,この制約を緩和するマルチタスク学習手法を提案する。
ネットワークは、非常に少量の精度で区切られた画像と大量の粗いラベルで訓練されている。
論文 参考訳(メタデータ) (2020-05-26T21:35:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。