論文の概要: GMNet: Graph Matching Network for Large Scale Part Semantic Segmentation
in the Wild
- arxiv url: http://arxiv.org/abs/2007.09073v1
- Date: Fri, 17 Jul 2020 15:53:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-09 13:39:25.349505
- Title: GMNet: Graph Matching Network for Large Scale Part Semantic Segmentation
in the Wild
- Title(参考訳): GMNet:野生における大規模部分セマンティックセグメンテーションのためのグラフマッチングネットワーク
- Authors: Umberto Michieli, Edoardo Borsato, Luca Rossi, Pietro Zanuttigh
- Abstract要約: 課題に対処するために,より高いオブジェクトレベルのコンテキスト条件と部分レベルの空間関係を組み合わせたフレームワークを提案する。
オブジェクトレベルの曖昧性に取り組むために、クラスレベルのセマンティクスを保持するためにクラスコンディショニングモジュールが導入される。
また,地中真実と予測部分との相対空間関係のマッチングを目的とした,新しい隣接グラフベースモジュールを提案する。
- 参考スコア(独自算出の注目度): 23.29789882934198
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The semantic segmentation of parts of objects in the wild is a challenging
task in which multiple instances of objects and multiple parts within those
objects must be detected in the scene. This problem remains nowadays very
marginally explored, despite its fundamental importance towards detailed object
understanding. In this work, we propose a novel framework combining higher
object-level context conditioning and part-level spatial relationships to
address the task. To tackle object-level ambiguity, a class-conditioning module
is introduced to retain class-level semantics when learning parts-level
semantics. In this way, mid-level features carry also this information prior to
the decoding stage. To tackle part-level ambiguity and localization we propose
a novel adjacency graph-based module that aims at matching the relative spatial
relationships between ground truth and predicted parts. The experimental
evaluation on the Pascal-Part dataset shows that we achieve state-of-the-art
results on this task.
- Abstract(参考訳): 野生のオブジェクトの部分のセマンティクスセグメンテーションは、複数のオブジェクトのインスタンスとそれらのオブジェクト内の複数のパーツがシーン内で検出されなければならない困難なタスクである。
この問題は、詳細オブジェクトの理解に根本的な重要性があるにもかかわらず、現在でも非常に精査されている。
本研究では,課題に対処するための高次オブジェクトレベルコンテキスト条件と部分レベル空間関係を組み合わせた新しいフレームワークを提案する。
オブジェクトレベルの曖昧さに対処するために、クラス条件モジュールが導入された。
このように、中間レベルの機能は、デコーディングのステージの前に、この情報も持っています。
部分レベルの曖昧性と局所性に取り組むために,基底真理と予測部分との相対的な空間的関係をマッチングする新しい隣接グラフベースモジュールを提案する。
pascal-partデータセットの実験的評価により,本課題の最先端の結果が得られた。
関連論文リスト
- A Bottom-Up Approach to Class-Agnostic Image Segmentation [4.086366531569003]
本稿では,クラスに依存しないセグメンテーション問題に対処するためのボトムアップの新たな定式化を提案する。
我々は、その特徴空間の射影球に直接ネットワークを監督する。
ボトムアップの定式化は、クラスベースのセグメンテーション用に設計されたデータセットで訓練された場合でも、例外的な一般化能力を示す。
論文 参考訳(メタデータ) (2024-09-20T17:56:02Z) - From Text Segmentation to Smart Chaptering: A Novel Benchmark for
Structuring Video Transcriptions [63.11097464396147]
音声コンテンツに焦点をあてた新しいベンチマークYTSegを導入し、その内容は本質的に非構造的であり、トポロジと構造的にも多様である。
また,高効率な階層分割モデルMiniSegを導入する。
論文 参考訳(メタデータ) (2024-02-27T15:59:37Z) - Position-Aware Contrastive Alignment for Referring Image Segmentation [65.16214741785633]
マルチモーダル特徴のアライメントを強化するために,位置認識型コントラストアライメントネットワーク(PCAN)を提案する。
1)自然言語記述に関連するすべてのオブジェクトの位置情報を提供する位置認識モジュール(PAM)と,2)マルチモーダルアライメントを強化するコントラスト言語理解モジュール(CLUM)の2つのモジュールで構成されている。
論文 参考訳(メタデータ) (2022-12-27T09:13:19Z) - Self-Supervised Learning of Object Parts for Semantic Segmentation [7.99536002595393]
我々は、オブジェクト部品の自己教師型学習がこの問題の解決策であると主張している。
本手法は3つのセマンティックセグメンテーションベンチマークの最先端を17%-3%超える。
論文 参考訳(メタデータ) (2022-04-27T17:55:17Z) - TransFGU: A Top-down Approach to Fine-Grained Unsupervised Semantic
Segmentation [44.75300205362518]
教師なしセマンティックセグメンテーションは、手動のアノテーションを使わずに、低レベルの視覚的特徴の高レベルセマンティック表現を得ることを目的としている。
本稿では, 非常に複雑なシナリオにおける細粒度セグメンテーションのための, トップダウンの教師なしセグメンテーションフレームワークを提案する。
我々の結果は、トップダウンの教師なしセグメンテーションが、オブジェクト中心とシーン中心の両方のデータセットに対して堅牢であることを示している。
論文 参考訳(メタデータ) (2021-12-02T18:59:03Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Hierarchical Pyramid Representations for Semantic Segmentation [0.0]
コンテキストはこれらの固有の特性に基づいているため、オブジェクトの構造とオブジェクト間の階層構造を学ぶ。
本研究では,新しい階層的,文脈的,マルチスケールのピラミッド表現を設計し,入力画像から特徴を捉える。
提案手法はPASCALコンテキストにおける最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-05T06:39:12Z) - ClawCraneNet: Leveraging Object-level Relation for Text-based Video
Segmentation [47.7867284770227]
テキストベースのビデオセグメンテーションは、ビデオ内の自然言語参照オブジェクトをセグメンテーションする難しいタスクである。
言語指導でオブジェクトを人間に分割する方法を模倣することで、新しいトップダウンアプローチを導入する。
我々の手法は最先端の手法よりも大きなマージンで優れている。
論文 参考訳(メタデータ) (2021-03-19T09:31:08Z) - Improving Semantic Segmentation via Decoupled Body and Edge Supervision [89.57847958016981]
既存のセグメンテーションアプローチは、グローバルコンテキストをモデル化することでオブジェクトの内部の一貫性を改善すること、あるいはマルチスケールの特徴融合によって境界に沿ったオブジェクトの詳細を洗練することを目的としている。
本稿では,セマンティックセグメンテーションのための新しいパラダイムを提案する。
我々の洞察は、セマンティックセグメンテーションの魅力ある性能には、画像の高頻度と低頻度に対応するオブジェクトのテキストボディとテキストエッジを具体的にモデル化する必要があるということである。
さまざまなベースラインやバックボーンネットワークを備えた提案したフレームワークが,オブジェクト内部の一貫性とオブジェクト境界を向上させることを示す。
論文 参考訳(メタデータ) (2020-07-20T12:11:22Z) - Bidirectional Graph Reasoning Network for Panoptic Segmentation [126.06251745669107]
本稿では,BGRNet(Bidirectional Graph Reasoning Network)を導入し,前景物と背景物間のモジュラー内およびモジュラー間関係について検討する。
BGRNetはまず、インスタンスとセマンティックセグメンテーションの両方でイメージ固有のグラフを構築し、提案レベルとクラスレベルで柔軟な推論を可能にする。
論文 参考訳(メタデータ) (2020-04-14T02:32:10Z) - Panoptic Feature Fusion Net: A Novel Instance Segmentation Paradigm for
Biomedical and Biological Images [91.41909587856104]
本稿では,本研究における意味的特徴とインスタンス的特徴を統一するPanoptic Feature Fusion Net(PFFNet)を提案する。
提案するPFFNetには,インスタンス予測を意味的特徴に組み込むための残注意特徴融合機構が組み込まれている。
様々なバイオメディカルおよび生物学的データセットにおいて、最先端のいくつかの手法を上回ります。
論文 参考訳(メタデータ) (2020-02-15T09:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。