論文の概要: Tensor Low-Rank Reconstruction for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2008.00490v1
- Date: Sun, 2 Aug 2020 14:29:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 19:46:41.002524
- Title: Tensor Low-Rank Reconstruction for Semantic Segmentation
- Title(参考訳): セマンティックセグメンテーションに対するテンソル低ランク再建術
- Authors: Wanli Chen, Xinge Zhu, Ruoqi Sun, Junjun He, Ruiyu Li, Xiaoyong Shen,
and Bei Yu
- Abstract要約: 本稿では,空間圧縮を回避するだけでなく,高階化の難しさに対処する3次元コンテキスト表現をモデル化する手法を提案する。
提案手法は従来の非局所的手法に比べて100倍以上の計算コストがかかる。
- 参考スコア(独自算出の注目度): 33.59216889218587
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Context information plays an indispensable role in the success of semantic
segmentation. Recently, non-local self-attention based methods are proved to be
effective for context information collection. Since the desired context
consists of spatial-wise and channel-wise attentions, 3D representation is an
appropriate formulation. However, these non-local methods describe 3D context
information based on a 2D similarity matrix, where space compression may lead
to channel-wise attention missing. An alternative is to model the contextual
information directly without compression. However, this effort confronts a
fundamental difficulty, namely the high-rank property of context information.
In this paper, we propose a new approach to model the 3D context
representations, which not only avoids the space compression but also tackles
the high-rank difficulty. Here, inspired by tensor canonical-polyadic
decomposition theory (i.e, a high-rank tensor can be expressed as a combination
of rank-1 tensors.), we design a low-rank-to-high-rank context reconstruction
framework (i.e, RecoNet). Specifically, we first introduce the tensor
generation module (TGM), which generates a number of rank-1 tensors to capture
fragments of context feature. Then we use these rank-1 tensors to recover the
high-rank context features through our proposed tensor reconstruction module
(TRM). Extensive experiments show that our method achieves state-of-the-art on
various public datasets. Additionally, our proposed method has more than 100
times less computational cost compared with conventional non-local-based
methods.
- Abstract(参考訳): 文脈情報は意味セグメンテーションの成功に欠かせない役割を果たす。
近年,非局所的自己照準に基づく手法が文脈情報収集に有効であることが判明した。
所望のコンテキストは空間的およびチャネル的注意で構成されているため、3D表現は適切な定式化である。
しかし、これらの非局所的な手法は、2次元の類似性行列に基づいて3次元の文脈情報を記述する。
もう一つの方法は、文脈情報を圧縮なしで直接モデル化することである。
しかし、この取り組みは基本的な難しさ、すなわち文脈情報の高位な性質に直面する。
本稿では,空間圧縮を回避するだけでなく,高階化の難しさに対処する3次元コンテキスト表現をモデル化する新しい手法を提案する。
ここではテンソル標準-ポリド分解理論(高階テンソルをランク1テンソルの組み合わせとして表現できる)に着想を得て、低階から高階の文脈再構成フレームワーク(RecoNet)を設計する。
具体的には、まずテンソル生成モジュール(TGM)を導入し、複数のランク-1テンソルを生成し、コンテキスト特徴の断片をキャプチャする。
次に、これらのランク1テンソルを用いて、提案したテンソル再構成モジュール(TRM)を介して高階のコンテキスト特徴を復元する。
大規模な実験により,本手法は様々な公開データセットの最先端性を実現する。
また,提案手法は従来の非局所的手法に比べて100倍以上の計算コストがかかる。
関連論文リスト
- Irregular Tensor Low-Rank Representation for Hyperspectral Image Representation [71.69331824668954]
低ランクテンソル表現はスペクトル変動を緩和するための重要なアプローチである。
従来の低ランク表現法は、通常のデータキューブにのみ適用できる。
本稿では,不規則な3次元立方体を効率的にモデル化できる新しい不規則な低ランク表現法を提案する。
論文 参考訳(メタデータ) (2024-10-24T02:56:22Z) - Efficient Generalized Low-Rank Tensor Contextual Bandits [14.016197224603433]
本稿では,3つの特徴ベクトルから行動が生成され,テンソルで表現できる,低ランクな文脈帯域モデルを提案する。
探索と利用のトレードオフを効果的に実現するために,我々は「一般化低ランク部分空間を再定義する」という新しいアルゴリズムを導入する(G-LowTESTR)。
厳密な理論解析により、G-LowTESTRの後悔境界はベクトル化や行列化の場合よりも優れていることが示されている。
論文 参考訳(メタデータ) (2023-11-03T08:12:05Z) - Tensor Decomposition Based Attention Module for Spiking Neural Networks [18.924242014716647]
我々は、線形に成長するパラメータで優れた結果を示すテキストプロジェクションフルアテンション(PFA)モジュールを設計する。
本手法は,静的ベンチマークと動的ベンチマークの両方において,最先端の性能を実現する。
論文 参考訳(メタデータ) (2023-10-23T05:25:49Z) - Semi-Supervised Single-View 3D Reconstruction via Prototype Shape Priors [79.80916315953374]
本研究では,3次元再構成のための半教師付きフレームワークであるSSP3Dを提案する。
本稿では,現実的なオブジェクト再構成を導くために,注意誘導型プロトタイプ形状先行モジュールを提案する。
実世界のPix3Dデータセットに10%のラベリング比で転送する場合も,本手法は良好に機能する。
論文 参考訳(メタデータ) (2022-09-30T11:19:25Z) - Few-Shot Non-Parametric Learning with Deep Latent Variable Model [50.746273235463754]
遅延変数を用いた圧縮による非パラメトリック学習(NPC-LV)を提案する。
NPC-LVは、ラベルなしデータが多いがラベル付きデータはほとんどないデータセットの学習フレームワークである。
我々は,NPC-LVが低データ構造における画像分類における3つのデータセットの教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-23T09:35:03Z) - 2D+3D facial expression recognition via embedded tensor manifold
regularization [16.98176664818354]
2D+3次元表情認識(FERETMR)のための埋め込みテンソル多様体正規化による新しい手法を提案する。
定常点の観点から一階最適条件を確立し、収束解析によるブロック座標降下(BCD)アルゴリズムを設計する。
BU-3DFEデータベースとBosphorusデータベースの数値計算結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-01-29T06:11:00Z) - Tensor Full Feature Measure and Its Nonconvex Relaxation Applications to
Tensor Recovery [1.8899300124593645]
完全特徴量(FFM)と呼ばれる新しいテンソル間隔尺度を提案する。
これは各次元の特徴次元を同時に記述することができ、タッカーランクとテンソルチューブランクを結びつけることができる。
FFMに基づく2つの効率的なモデルを提案し、提案モデルを解決するために2つの代替乗算器法(ADMM)アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-09-25T01:44:34Z) - A Unified Efficient Pyramid Transformer for Semantic Segmentation [40.20512714144266]
我々はコンテキスト情報と境界アーティファクトの両方を考慮してオブジェクトをセグメント化する統一フレームワーク(UN-EPT)を提唱する。
我々はまず,効率的なコンテキストモデリングのために,トランスフォーマーに基づくアテンション機構を組み込むため,スパースサンプリング戦略を適用した。
メモリフットプリントの少ないセマンティックセグメンテーションのための3つの人気のあるベンチマークで有望な性能を示す。
論文 参考訳(メタデータ) (2021-07-29T17:47:32Z) - Scaling Semantic Segmentation Beyond 1K Classes on a Single GPU [87.48110331544885]
既存のセマンティックセグメンテーションモデルのトレーニングとスケールアップのための新しいトレーニング手法を提案する。
我々は、LVISとCOCOアノテーションからブートストラップした1284クラスのデータセットに対するアプローチの明確な利点を示し、DeeplabV3+モデルの3倍のmIoUを実現した。
論文 参考訳(メタデータ) (2020-12-14T13:12:38Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z) - Convolutional Occupancy Networks [88.48287716452002]
本稿では,オブジェクトと3Dシーンの詳細な再構築のための,より柔軟な暗黙的表現である畳み込み機能ネットワークを提案する。
畳み込みエンコーダと暗黙の占有デコーダを組み合わせることで、帰納的バイアスが組み込まれ、3次元空間における構造的推論が可能となる。
実験により,本手法は単一物体の微細な3次元再構成,大規模屋内シーンへのスケール,合成データから実データへの一般化を可能にした。
論文 参考訳(メタデータ) (2020-03-10T10:17:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。