論文の概要: Learning Implicit Feature Alignment Function for Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2206.08655v1
- Date: Fri, 17 Jun 2022 09:40:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-20 14:11:38.373347
- Title: Learning Implicit Feature Alignment Function for Semantic Segmentation
- Title(参考訳): 意味セグメンテーションのための暗黙的特徴アライメント関数の学習
- Authors: Hanzhe Hu, Yinbo Chen, Jiarui Xu, Shubhankar Borse, Hong Cai, Fatih
Porikli, Xiaolong Wang
- Abstract要約: Implicit Feature Alignment Function (IFA)は、暗黙の神経表現の急速に拡大するトピックにインスパイアされている。
IFAは機能マップを異なるレベルで暗黙的に整列し、任意の解像度でセグメンテーションマップを生成することができることを示す。
提案手法は,様々なアーキテクチャの改善と組み合わせて,一般的なベンチマークにおける最先端の精度のトレードオフを実現する。
- 参考スコア(独自算出の注目度): 51.36809814890326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Integrating high-level context information with low-level details is of
central importance in semantic segmentation. Towards this end, most existing
segmentation models apply bilinear up-sampling and convolutions to feature maps
of different scales, and then align them at the same resolution. However,
bilinear up-sampling blurs the precise information learned in these feature
maps and convolutions incur extra computation costs. To address these issues,
we propose the Implicit Feature Alignment function (IFA). Our method is
inspired by the rapidly expanding topic of implicit neural representations,
where coordinate-based neural networks are used to designate fields of signals.
In IFA, feature vectors are viewed as representing a 2D field of information.
Given a query coordinate, nearby feature vectors with their relative
coordinates are taken from the multi-level feature maps and then fed into an
MLP to generate the corresponding output. As such, IFA implicitly aligns the
feature maps at different levels and is capable of producing segmentation maps
in arbitrary resolutions. We demonstrate the efficacy of IFA on multiple
datasets, including Cityscapes, PASCAL Context, and ADE20K. Our method can be
combined with improvement on various architectures, and it achieves
state-of-the-art computation-accuracy trade-off on common benchmarks. Code will
be made available at https://github.com/hzhupku/IFA.
- Abstract(参考訳): 低レベルな詳細にハイレベルなコンテキスト情報を統合することは、セマンティックセグメンテーションにおいて重要となる。
この目的に向けて、既存のセグメンテーションモデルの多くは、異なるスケールの特徴写像に双線形のアップサンプリングと畳み込みを適用し、同じ解像度でそれらを整列させる。
しかし、双線形アップサンプリングはこれらの特徴マップで得られた正確な情報を曖昧にし、畳み込みによって余分な計算コストがかかる。
これらの問題に対処するため,IFA (Implicit Feature Alignment Function) を提案する。
本手法は,信号場を指定するために座標ベースのニューラルネットワークを用いる暗黙的ニューラルネットワークの急速に拡大する話題に着想を得たものである。
ifaでは、特徴ベクトルは情報の2次元フィールドを表すと見なされる。
クエリ座標が与えられた後、その周辺特徴ベクトルとその相対座標を多層特徴写像から取り出し、MLPに入力して対応する出力を生成する。
したがって、IFAは機能マップを異なるレベルで暗黙的に整列させ、任意の解像度でセグメンテーションマップを生成することができる。
都市景観,PASCALコンテキスト,ADE20Kなど,複数のデータセットに対するIFAの有効性を示す。
本手法は,様々なアーキテクチャの改善と組み合わせることで,共通ベンチマークにおいて最先端の計算精度のトレードオフを実現する。
コードはhttps://github.com/hzhupku/ifaで入手できる。
関連論文リスト
- Representing 3D sparse map points and lines for camera relocalization [1.2974519529978974]
軽量ニューラルネットワークが3Dポイントとラインの両方の特徴を表現するためにどのように学習できるかを示す。
テストにおいて,本手法は,最先端の学習手法に対する最も顕著な向上を図っている。
論文 参考訳(メタデータ) (2024-02-28T03:07:05Z) - Coupled Laplacian Eigenmaps for Locally-Aware 3D Rigid Point Cloud Matching [0.0]
局所構造を考慮したグラフラプラシアン固有写像に基づく新しい手法を提案する。
ラプラシアン固有写像の順序と符号のあいまいさに対処するために、結合ラプラシアンと呼ばれる新しい作用素を導入する。
これらの高次元空間間の類似性は、形状に一致するような局所的な意味のあるスコアを与えることを示す。
論文 参考訳(メタデータ) (2024-02-27T10:10:12Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - SemAffiNet: Semantic-Affine Transformation for Point Cloud Segmentation [94.11915008006483]
ポイントクラウドセマンティックセグメンテーションのためのSemAffiNetを提案する。
我々はScanNetV2とNYUv2データセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-05-26T17:00:23Z) - Stage-Aware Feature Alignment Network for Real-Time Semantic
Segmentation of Street Scenes [59.81228011432776]
街路シーンのリアルタイムなセマンティックセグメンテーションのためのSFANet(Stage-Aware Feature Alignment Network)を提案する。
デコーダにおける各ステージのユニークな役割を考慮に入れ、新しいステージ認識機能拡張ブロック(FEB)は、エンコーダからの特徴マップの空間的詳細と文脈的情報を強化するように設計されている。
実験の結果,提案したSFANetは,ストリートシーンのリアルタイムセマンティックセグメンテーションにおける精度と速度のバランスが良好であることがわかった。
論文 参考訳(メタデータ) (2022-03-08T11:46:41Z) - Improving Lidar-Based Semantic Segmentation of Top-View Grid Maps by
Learning Features in Complementary Representations [3.0413873719021995]
我々は、自律運転の文脈において、スパースで単発のLiDAR測定から意味情報を予測するための新しい方法を提案する。
このアプローチは、トップビューグリッドマップのセマンティックセグメンテーションを改善することを目的としている。
各表現に対して、セマンティック情報を効果的に抽出するために、調整されたディープラーニングアーキテクチャが開発された。
論文 参考訳(メタデータ) (2022-03-02T14:49:51Z) - PointFlow: Flowing Semantics Through Points for Aerial Image
Segmentation [96.76882806139251]
本論文では,FPN(Feature Pyramid Network)フレームワークに基づく点親和性伝播モジュールであるPointFlowを提案する。
密接な親和性学習ではなく、隣接する特徴間の選択された点にスパース親和性マップを生成する。
3つの異なる空中セグメンテーションデータセットの実験結果から,提案手法は最先端の汎用セグメンテーション法よりも効率的かつ効率的であることが示唆された。
論文 参考訳(メタデータ) (2021-03-11T09:42:32Z) - A Holistically-Guided Decoder for Deep Representation Learning with
Applications to Semantic Segmentation and Object Detection [74.88284082187462]
一般的な戦略の1つは、バックボーンネットワークに拡張畳み込みを採用し、高解像度のフィーチャーマップを抽出することです。
本稿では,高分解能なセマンティクスリッチな特徴マップを得るために紹介される,新たなホリスティック誘導デコーダを提案する。
論文 参考訳(メタデータ) (2020-12-18T10:51:49Z) - AlignSeg: Feature-Aligned Segmentation Networks [109.94809725745499]
本稿では,機能集約プロセスにおける誤アライメント問題に対処するために,特徴適応型ネットワーク(AlignSeg)を提案する。
我々のネットワークは、それぞれ82.6%と45.95%という新しい最先端のmIoUスコアを達成している。
論文 参考訳(メタデータ) (2020-02-24T10:00:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。