Fugu-MT 論文翻訳(概要): Hierarchical Pyramid Representations for Semantic Segmentation

論文の概要: Hierarchical Pyramid Representations for Semantic Segmentation

arxiv url: http://arxiv.org/abs/2104.01792v1
Date: Mon, 5 Apr 2021 06:39:12 GMT
ステータス: 翻訳完了
システム内更新日: 2021-04-06 14:33:16.075282
Title: Hierarchical Pyramid Representations for Semantic Segmentation
Title（参考訳）: 意味セグメンテーションのための階層的ピラミッド表現
Authors: Hiroaki Aizawa, Yukihiro Domae, Kunihito Kato
Abstract要約: コンテキストはこれらの固有の特性に基づいているため、オブジェクトの構造とオブジェクト間の階層構造を学ぶ。本研究では,新しい階層的,文脈的,マルチスケールのピラミッド表現を設計し,入力画像から特徴を捉える。提案手法はPASCALコンテキストにおける最先端のパフォーマンスを実現する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Understanding the context of complex and cluttered scenes is a challenging problem for semantic segmentation. However, it is difficult to model the context without prior and additional supervision because the scene's factors, such as the scale, shape, and appearance of objects, vary considerably in these scenes. To solve this, we propose to learn the structures of objects and the hierarchy among objects because context is based on these intrinsic properties. In this study, we design novel hierarchical, contextual, and multiscale pyramidal representations to capture the properties from an input image. Our key idea is the recursive segmentation in different hierarchical regions based on a predefined number of regions and the aggregation of the context in these regions. The aggregated contexts are used to predict the contextual relationship between the regions and partition the regions in the following hierarchical level. Finally, by constructing the pyramid representations from the recursively aggregated context, multiscale and hierarchical properties are attained. In the experiments, we confirmed that our proposed method achieves state-of-the-art performance in PASCAL Context.
Abstract（参考訳）: 複雑で散らばったシーンのコンテキストを理解することは、セマンティックセグメンテーションにとって難しい問題である。しかし、これらの場面では、大きさ、形状、外観などの場面の要素がかなり異なるため、事前・追加の監督なしに文脈をモデル化することは困難である。そこで本研究では,これらの固有性に基づいて,オブジェクトの構造とオブジェクト間の階層構造を学習することを提案する。本研究では,新しい階層的,文脈的,マルチスケールのピラミッド表現を設計し,入力画像から特徴を捉える。我々のキーとなる考え方は、予め定義された領域数とこれらの領域におけるコンテキストの集約に基づいて、異なる階層領域における再帰的セグメンテーションである。集約されたコンテキストは、各領域間のコンテキスト関係を予測し、以下の階層レベルで分割するために使用される。最後に、再帰的に集約されたコンテキストからピラミッド表現を構築することにより、マルチスケールおよび階層的特性が得られる。実験では,提案手法がPASCALコンテキストにおける最先端性能を実現することを確認した。

関連論文リスト

Talk in Pieces, See in Whole: Disentangling and Hierarchical Aggregating Representations for Language-based Object Detection [39.748035737067745]
本稿では,言語に基づく物体検出のための文内階層関係に基づく言語表現の再構成を提案する。重要な洞察は、テキストトークンを中核となる構成要素、属性、関係("talk in pieces")に切り離し、その後階層的に構造化された文レベルの表現に集約する必要性である。 OmniLabelベンチマークによる実験結果は24%のパフォーマンス向上を示し、言語構成の重要性を示している。
論文参考訳（メタデータ） (2025-09-29T02:14:26Z)
Aligning Instance-Semantic Sparse Representation towards Unsupervised Object Segmentation and Shape Abstraction with Repeatable Primitives [48.155145581663724]
3Dオブジェクトの形状を理解するには、インスタンスとセマンティックセグメンテーションの結果から抽象化されたオブジェクト部品による形状表現が必要である。セマンティック・アウェア・シェイプ表現のための一段階的、完全に教師なしのフレームワークを提案する。このフレームワークは、高次元空間におけるオブジェクト部分のスパース表現と特徴アライメントを通じて、統合インスタンスのセグメンテーション、セマンティックセグメンテーション、形状抽象化を生成する。
論文参考訳（メタデータ） (2025-03-10T05:52:17Z)
SPIN: Hierarchical Segmentation with Subpart Granularity in Natural Images [17.98848062686217]
自然画像のサブパートアノテーションを用いた最初の階層的セマンティックセマンティックセマンティクスデータセットを提案する。また,アルゴリズムが階層レベルの空間的関係と意味的関係をいかにうまく捉えるかを評価するために,新しい評価指標を2つ導入した。
論文参考訳（メタデータ） (2024-07-12T21:08:00Z)
Flattening the Parent Bias: Hierarchical Semantic Segmentation in the Poincaré Ball [39.76366192826905]
親が子どもから推定されるフラットな(階層的でない)セグメンテーションネットワークは,階層的アプローチよりも高いセグメンテーション精度を有することを示す。また,ポアンカー球モデルを用いた階層的セグメンテーションに対するより原理的なアプローチについても検討する。
論文参考訳（メタデータ） (2024-04-04T19:50:57Z)
From Text Segmentation to Smart Chaptering: A Novel Benchmark for Structuring Video Transcriptions [63.11097464396147]
音声コンテンツに焦点をあてた新しいベンチマークYTSegを導入し、その内容は本質的に非構造的であり、トポロジと構造的にも多様である。また,高効率な階層分割モデルMiniSegを導入する。
論文参考訳（メタデータ） (2024-02-27T15:59:37Z)
Neural Constraint Satisfaction: Hierarchical Abstraction for Combinatorial Generalization in Object Rearrangement [75.9289887536165]
基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
論文参考訳（メタデータ） (2023-03-20T18:19:36Z)
Framework-agnostic Semantically-aware Global Reasoning for Segmentation [29.69187816377079]
本稿では,画像特徴を潜在表現に投影し,それら間の関係を推論するコンポーネントを提案する。我々の設計では、活性化領域が空間的に不整合であることを保証することにより、潜在領域が意味概念を表現することを奨励している。潜在トークンはセマンティックに解釈可能で多様性があり、下流タスクに転送可能な豊富な機能セットを提供します。
論文参考訳（メタデータ） (2022-12-06T21:42:05Z)
Deep Spectral Methods: A Surprisingly Strong Baseline for Unsupervised Semantic Segmentation and Localization [98.46318529630109]
画像分解をグラフ分割問題として再フレーミングすることで,従来のスペクトル分割法から着想を得た。これらの固有ベクトルはすでにイメージを意味のあるセグメントに分解しており、シーン内のオブジェクトのローカライズに容易に利用できる。データセットにまたがるこれらのセグメントに関連する機能をクラスタ化することで、明確に定義された、名前付き可能なリージョンを得ることができる。
論文参考訳（メタデータ） (2022-05-16T17:47:44Z)
Compositional Temporal Grounding with Structured Variational Cross-Graph Correspondence Learning [92.07643510310766]
ビデオの時間的接地は、あるクエリ文に意味的に対応する1つのターゲットビデオセグメントをローカライズすることを目的としている。新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。出現した単語の新たな組み合わせによるクエリの一般化に失敗したことを実証的に見出した。本稿では,ビデオと言語を複数の階層構造に明示的に分解する多変分グラフ推論フレームワークを提案する。
論文参考訳（メタデータ） (2022-03-24T12:55:23Z)
Exploring Set Similarity for Dense Self-supervised Representation Learning [96.35286140203407]
本研究では,高密度自己教師型表現学習のためのtextbfset textbfsimilarity (SetSim) を提案する。ピクセルワイドの類似性学習をセットワイドに一般化し,よりセマンティックな情報や構造的な情報を含むため,ロバスト性を向上させる。具体的には、ビューの注意的特徴に頼って対応する集合を定め、不適切な対応を引き起こす可能性のあるノイズの多い背景をフィルタリングする。
論文参考訳（メタデータ） (2021-07-19T09:38:27Z)
PhraseCut: Language-based Image Segmentation in the Wild [62.643450401286]
自然言語のフレーズを与えられた画像領域を分割する問題について考察する。私たちのデータセットは、Visual Genomeデータセットの上に収集されます。我々の実験は、我々のデータセットにおける概念のスケールと多様性が、既存の最先端技術に重大な課題をもたらすことを示している。
論文参考訳（メタデータ） (2020-08-03T20:58:53Z)
GMNet: Graph Matching Network for Large Scale Part Semantic Segmentation in the Wild [23.29789882934198]
課題に対処するために,より高いオブジェクトレベルのコンテキスト条件と部分レベルの空間関係を組み合わせたフレームワークを提案する。オブジェクトレベルの曖昧性に取り組むために、クラスレベルのセマンティクスを保持するためにクラスコンディショニングモジュールが導入される。また,地中真実と予測部分との相対空間関係のマッチングを目的とした,新しい隣接グラフベースモジュールを提案する。
論文参考訳（メタデータ） (2020-07-17T15:53:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。