論文の概要: Memory-based Semantic Segmentation for Off-road Unstructured Natural
Environments
- arxiv url: http://arxiv.org/abs/2108.05635v1
- Date: Thu, 12 Aug 2021 10:04:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-13 14:24:32.820030
- Title: Memory-based Semantic Segmentation for Off-road Unstructured Natural
Environments
- Title(参考訳): オフロード非構造自然環境のためのメモリベースセマンティックセマンティックセグメンテーション
- Authors: Youngsaeng Jin, David K. Han and Hanseok Ko
- Abstract要約: 本稿では,セマンティックセグメンテーションのためのメモリモジュールを提案する。
メモリモジュールはトレーニングイメージのかなりの表現をメモリアイテムとして格納する。
我々は,ロボット非構造地上走行データセットとRELLISデータセットについて実験を行った。
- 参考スコア(独自算出の注目度): 29.498304237783763
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the availability of many datasets tailored for autonomous driving in
real-world urban scenes, semantic segmentation for urban driving scenes
achieves significant progress. However, semantic segmentation for off-road,
unstructured environments is not widely studied. Directly applying existing
segmentation networks often results in performance degradation as they cannot
overcome intrinsic problems in such environments, such as illumination changes.
In this paper, a built-in memory module for semantic segmentation is proposed
to overcome these problems. The memory module stores significant
representations of training images as memory items. In addition to the encoder
embedding like items together, the proposed memory module is specifically
designed to cluster together instances of the same class even when there are
significant variances in embedded features. Therefore, it makes segmentation
networks better deal with unexpected illumination changes. A triplet loss is
used in training to minimize redundancy in storing discriminative
representations of the memory module. The proposed memory module is general so
that it can be adopted in a variety of networks. We conduct experiments on the
Robot Unstructured Ground Driving (RUGD) dataset and RELLIS dataset, which are
collected from off-road, unstructured natural environments. Experimental
results show that the proposed memory module improves the performance of
existing segmentation networks and contributes to capturing unclear objects
over various off-road, unstructured natural scenes with equivalent
computational cost and network parameters. As the proposed method can be
integrated into compact networks, it presents a viable approach for
resource-limited small autonomous platforms.
- Abstract(参考訳): 都市景観における自律走行に適した多くのデータセットが利用可能となり、都市走行シーンのセマンティックセグメンテーションは大きな進歩を遂げた。
しかし、オフロード、非構造化環境のセマンティクスセグメンテーションは広く研究されていない。
既存のセグメンテーションネットワークを直接適用すると、照明などの環境における固有の問題を克服できないため、性能が劣化することが多い。
本稿では,これらの問題を解決するためにセマンティックセグメンテーションのためのメモリモジュールを提案する。
メモリモジュールはトレーニングイメージのかなりの表現をメモリアイテムとして格納する。
アイテムを埋め込んだエンコーダに加えて、提案するメモリモジュールは、組み込み機能に大きな違いがある場合でも、同じクラスのインスタンスをクラスタリングするように特別に設計されている。
そのため、セグメンテーションネットワークは、予期せぬ照明変更に対処する。
三重項損失は、メモリモジュールの識別表現を格納する冗長性を最小化するためにトレーニングに使用される。
提案したメモリモジュールは、様々なネットワークで採用できるように一般化されている。
オフロード・非構造化自然環境から収集したrugd(robot unstructured ground driving)データセットとrellisデータセットについて実験を行った。
実験の結果,提案するメモリモジュールは,既存のセグメンテーションネットワークの性能を向上し,計算コストとネットワークパラメータの等価な,様々なオフロード,非構造化自然シーン上の不明瞭なオブジェクトをキャプチャするのに役立つことがわかった。
提案手法は小型ネットワークに組み込むことができるため,資源限定の小型自律型プラットフォームの実現が可能である。
関連論文リスト
- MRFP: Learning Generalizable Semantic Segmentation from Sim-2-Real with Multi-Resolution Feature Perturbation [2.0293118701268154]
本稿では,ドメイン固有の細粒度特徴と粗い特徴の摂動スタイルをランダム化するための,MRFP(Multi Resolution Feature Perturbation)手法を提案する。
MRFPは最先端のディープニューラルネットワークで、シミュレーションから実際のセマンティックセグメンテーションのための堅牢なドメイン不変機能を学ぶのに役立つ。
論文 参考訳(メタデータ) (2023-11-30T08:02:49Z) - Prompt-Matched Semantic Segmentation [96.99924127527002]
本研究の目的は、事前学習した基礎モデルを、画像意味セグメンテーションの下流の様々なタスクに効果的に適応する方法を検討することである。
本稿では,タスク指向のチューニングに適応的に視覚的プロンプトを生成するとともに,基礎モデルの本来の構造を維持できる新しい階層間プロンプトマッチングフレームワークを提案する。
次に、Semantic-aware Prompt Matcherと呼ばれる軽量モジュールを導入し、2つのステージ間で階層的に補間し、各タスクに対して適切なプロンプトを学習する。
論文 参考訳(メタデータ) (2022-08-22T09:12:53Z) - Unsupervised domain adaptation semantic segmentation of high-resolution
remote sensing imagery with invariant domain-level context memory [10.210120085157161]
本研究では,HRS画像のセマンティックセマンティックセマンティックセマンティクスのための,教師なし領域適応セマンティクスネットワーク(MemoryAdaptNet)を提案する。
MemoryAdaptNetは、ソースドメインとターゲットドメイン間のドメイン分布の不一致をブリッジするために、出力空間逆学習スキームを構築する。
3つのクロスドメインタスクによる実験は、提案したMemoryAdaptNetが最先端の手法よりもはるかに優れていることを示している。
論文 参考訳(メタデータ) (2022-08-16T12:35:57Z) - Pin the Memory: Learning to Generalize Semantic Segmentation [68.367763672095]
本稿ではメタラーニングフレームワークに基づくセマンティックセグメンテーションのための新しいメモリ誘導ドメイン一般化手法を提案する。
本手法は,セマンティッククラスの概念的知識を,ドメインを超えて一定であるカテゴリ記憶に抽象化する。
論文 参考訳(メタデータ) (2022-04-07T17:34:01Z) - Memory-Guided Semantic Learning Network for Temporal Sentence Grounding [55.31041933103645]
本稿では,TSGタスクにおいて稀に出現しないコンテンツを学習し,記憶するメモリ拡張ネットワークを提案する。
MGSL-Netは、クロスモーダル・インターアクション・モジュール、メモリ拡張モジュール、異種アテンション・モジュールの3つの主要な部分で構成されている。
論文 参考訳(メタデータ) (2022-01-03T02:32:06Z) - Semantic Attention and Scale Complementary Network for Instance
Segmentation in Remote Sensing Images [54.08240004593062]
本稿では,セマンティックアテンション(SEA)モジュールとスケール補完マスクブランチ(SCMB)で構成される,エンドツーエンドのマルチカテゴリインスタンスセグメンテーションモデルを提案する。
SEAモジュールは、機能マップ上の興味あるインスタンスのアクティベーションを強化するために、追加の監督を備えた、単純な完全な畳み込みセマンティックセマンティックセマンティクスブランチを含んでいる。
SCMBは、元のシングルマスクブランチをトリデントマスクブランチに拡張し、異なるスケールで補完マスクの監視を導入する。
論文 参考訳(メタデータ) (2021-07-25T08:53:59Z) - RICE: Refining Instance Masks in Cluttered Environments with Graph
Neural Networks [53.15260967235835]
本稿では,インスタンスマスクのグラフベース表現を利用して,そのような手法の出力を改良する新しいフレームワークを提案する。
我々は、セグメンテーションにスマートな摂動をサンプリングできるディープネットワークと、オブジェクト間の関係をエンコード可能なグラフニューラルネットワークを訓練し、セグメンテーションを評価する。
本稿では,本手法によって生成された不確実性推定を用いてマニピュレータを誘導し,乱れたシーンを効率的に理解するアプリケーションについて紹介する。
論文 参考訳(メタデータ) (2021-06-29T20:29:29Z) - End-to-End Egospheric Spatial Memory [32.42361470456194]
Egospheric Spatial Memory (ESM) と呼ばれるパラメータフリーのモジュールを提案し、エージェントの周りの自我圏内のメモリをエンコードする。
ESMは模倣あるいは強化学習を通じてエンドツーエンドでトレーニングすることができる。
ScanNetデータセット上でのセマンティックセグメンテーションへの適用を示す。ESMは画像レベルとマップレベルの推論モダリティを自然に組み合わせている。
論文 参考訳(メタデータ) (2021-02-15T18:59:07Z) - Video Object Segmentation with Episodic Graph Memory Networks [198.74780033475724]
セグメント化モデルを更新する学習」という新しいアイデアに対処するために,グラフメモリネットワークが開発された。
我々は、完全に連結されたグラフとして構成されたエピソードメモリネットワークを利用して、フレームをノードとして保存し、エッジによってフレーム間の相関をキャプチャする。
提案したグラフメモリネットワークは、一発とゼロショットの両方のビデオオブジェクトセグメンテーションタスクをうまく一般化できる、巧妙だが原則化されたフレームワークを提供する。
論文 参考訳(メタデータ) (2020-07-14T13:19:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。