論文の概要: Instance Semantic Segmentation Benefits from Generative Adversarial
Networks
- arxiv url: http://arxiv.org/abs/2010.13757v2
- Date: Sat, 4 Dec 2021 05:00:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 19:24:23.273223
- Title: Instance Semantic Segmentation Benefits from Generative Adversarial
Networks
- Title(参考訳): 生成型adversarial networkからのインスタンス意味セグメンテーションの利点
- Authors: Quang H. Le, Kamal Youcef-Toumi, Dzmitry Tsetserukou, Ali Jahanian
- Abstract要約: マスクの予測問題は,GANのゲームフレームワークとして定義する。
セグメンテーションネットワークがマスクを生成し、識別ネットワークがマスクの品質を決定する。
携帯電話のリサイクル,自動運転,大規模物体検出,医療用腺について報告する。
- 参考スコア(独自算出の注目度): 13.295723883560122
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In design of instance segmentation networks that reconstruct masks,
segmentation is often taken as its literal definition -- assigning each pixel a
label. This has led to thinking the problem as a template matching one with the
goal of minimizing the loss between the reconstructed and the ground truth
pixels. Rethinking reconstruction networks as a generator, we define the
problem of predicting masks as a GANs game framework: A segmentation network
generates the masks, and a discriminator network decides on the quality of the
masks. To demonstrate this game, we show effective modifications on the general
segmentation framework in Mask R-CNN. We find that playing the game in feature
space is more effective than the pixel space leading to stable training between
the discriminator and the generator, predicting object coordinates should be
replaced by predicting contextual regions for objects, and overall the
adversarial loss helps the performance and removes the need for any custom
settings per different data domain. We test our framework in various domains
and report on cellphone recycling, autonomous driving, large-scale object
detection, and medical glands. We observe in general GANs yield masks that
account for crispier boundaries, clutter, small objects, and details, being in
domain of regular shapes or heterogeneous and coalescing shapes. Our code for
reproducing the results is available publicly.
- Abstract(参考訳): マスクを再構成するインスタンスセグメンテーションネットワークの設計において、セグメンテーションはしばしばそのリテラル定義として、各ピクセルにラベルを割り当てる。
これにより、この問題は、再構成されたピクセルと地上の真理画素の間の損失を最小限に抑えるという目標と一致するテンプレートとして考えられた。
レコンストラクションネットワークをジェネレータとして再考し,gansゲームフレームワークとしてマスクを予測する問題を定義した。セグメンテーションネットワークがマスクを生成し,判別ネットワークがマスクの品質を決定する。
このゲームを実演するために,Mask R-CNNにおける一般的なセグメンテーションフレームワークの効果的な修正を示す。
特徴空間におけるゲームプレイは, 画素空間よりも有効であり, 判別器とジェネレータ間の安定したトレーニング, オブジェクトのコンテキスト領域の予測によってオブジェクト座標を置き換えるべきであること, 対向損失の全体はパフォーマンスの助けとなり, 異なるデータ領域毎のカスタム設定の必要性を解消する。
本フレームワークをさまざまな領域でテストし,携帯電話リサイクル,自動運転,大規模物体検出,医療用腺について報告する。
一般の GAN の収差マスクは, 平滑な境界, 乱れ, 小物体, 細部を考慮し, 正則な形状, 不均一な形状, 合体形状の領域内にある。
結果の再現コードは公開されています。
関連論文リスト
- LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion [79.22197702626542]
本稿では, 乱れ場面におけるロボットグルーピングのためのアモーダルセグメンテーションを探求する枠組みを提案する。
線形融合注意誘導畳み込みネットワーク(LAC-Net)を提案する。
その結果,本手法が最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-08-06T14:50:48Z) - MaskCD: A Remote Sensing Change Detection Network Based on Mask Classification [29.15203530375882]
深層学習を用いたリモートセンシング(RS)画像からの変化(CD)を文献的に広く研究している。
入力画像対から分類マスクを適応的に生成し,変化領域を検出するMaskCDを提案する。
ピクセルワイズ表現を学習可能なマスク提案に復号することで、望まれる変更対象を再構築する。
論文 参考訳(メタデータ) (2024-04-18T11:05:15Z) - Mask2Anomaly: Mask Transformer for Universal Open-set Segmentation [29.43462426812185]
本稿では,画素単位の分類からマスク分類へのシフトによるパラダイム変化を提案する。
マスクをベースとしたMask2Anomalyは,マスク分類アーキテクチャの統合の可能性を示した。
総合的質的・質的評価により, Mask2Anomaly は新たな最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2023-09-08T20:07:18Z) - Towards Robust Video Object Segmentation with Adaptive Object
Calibration [18.094698623128146]
ビデオオブジェクトセグメンテーション(VOS)は、参照フレームの注釈付きオブジェクトマスクを与えられたビデオのすべてのターゲットフレームにおけるオブジェクトのセグメンテーションを目的としている。
本稿では,オブジェクト表現を適応的に構築し,オブジェクトマスクを校正して強靭性を実現する,新しいディープネットワークを提案する。
本モデルは,既存の出版作品の最先端性能を達成し,摂動に対する優れた堅牢性を示す。
論文 参考訳(メタデータ) (2022-07-02T17:51:29Z) - Discovering Object Masks with Transformers for Unsupervised Semantic
Segmentation [75.00151934315967]
MaskDistillは教師なしセマンティックセグメンテーションのための新しいフレームワークである。
我々のフレームワークは、低レベルの画像キューにラッチを付けず、オブジェクト中心のデータセットに限らない。
論文 参考訳(メタデータ) (2022-06-13T17:59:43Z) - Differentiable Soft-Masked Attention [115.5770357189209]
Weakly Supervised Video Objectのタスクには,「識別可能なソフトマッシュアップ注意」が使用されている。
我々は、トランスフォーマーベースのトレーニングネットワークを開発したが、1つのアノテートフレームだけで、ビデオ上でのサイクル一貫性トレーニングの恩恵を受けることができる。
論文 参考訳(メタデータ) (2022-06-01T02:05:13Z) - A Unified Architecture of Semantic Segmentation and Hierarchical
Generative Adversarial Networks for Expression Manipulation [52.911307452212256]
セマンティックセグメンテーションと階層的GANの統一アーキテクチャを開発する。
我々のフレームワークのユニークな利点は、将来的なセマンティックセグメンテーションネットワーク条件を生成モデルに渡すことである。
我々は,AffectNetとRaFDの2つの難解な表情翻訳ベンチマークとセマンティックセグメンテーションベンチマークであるCelebAMask-HQについて評価を行った。
論文 参考訳(メタデータ) (2021-12-08T22:06:31Z) - Context-Aware Mixup for Domain Adaptive Semantic Segmentation [52.1935168534351]
Unsupervised domain adapt (UDA) は、ラベル付きソースドメインのモデルをラベル付きターゲットドメインに適応させることを目的としている。
ドメイン適応型セマンティックセグメンテーションのためのエンド・ツー・エンドコンテキスト・アウェア・ミックスアップ(CAMix)を提案する。
実験結果から,提案手法は最先端の手法よりも高い性能を示した。
論文 参考訳(メタデータ) (2021-08-08T03:00:22Z) - Spatial Attention Pyramid Network for Unsupervised Domain Adaptation [66.75008386980869]
教師なし領域適応は様々なコンピュータビジョンタスクにおいて重要である。
教師なし領域適応のための新しい空間注意ピラミッドネットワークを設計する。
我々の手法は最先端の手法に対して大きなマージンで好適に機能する。
論文 参考訳(メタデータ) (2020-03-29T09:03:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。