論文の概要: StrideNET: Swin Transformer for Terrain Recognition with Dynamic Roughness Extraction
- arxiv url: http://arxiv.org/abs/2404.13270v1
- Date: Sat, 20 Apr 2024 04:51:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 19:49:10.291737
- Title: StrideNET: Swin Transformer for Terrain Recognition with Dynamic Roughness Extraction
- Title(参考訳): StrideNET:動的粗さ抽出による地形認識のためのスイニングトランス
- Authors: Maitreya Shelare, Neha Shigvan, Atharva Satam, Poonam Sonar,
- Abstract要約: 本稿では、地形認識と暗黙的特性推定のために設計された新しいデュアルブランチアーキテクチャであるStrideNETを提案する。
この研究の意味は、環境モニタリング、土地利用、土地被覆分類(LULC)、災害対応、精密農業など、様々な応用にまで及んでいる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Advancements in deep learning are revolutionizing the classification of remote-sensing images. Transformer-based architectures, utilizing self-attention mechanisms, have emerged as alternatives to conventional convolution methods, enabling the capture of long-range dependencies along with global relationships in the image. Motivated by these advancements, this paper presents StrideNET, a novel dual-branch architecture designed for terrain recognition and implicit properties estimation. The terrain recognition branch utilizes the Swin Transformer, leveraging its hierarchical representation and low computational cost to efficiently capture both local and global features. The terrain properties branch focuses on the extraction of surface properties such as roughness and slipperiness using a statistical texture analysis method. By computing surface terrain properties, an enhanced environmental perception can be obtained. The StrideNET model is trained on a dataset comprising four target terrain classes: Grassy, Marshy, Sandy, and Rocky. StrideNET attains competitive performance compared to contemporary methods. The implications of this work extend to various applications, including environmental monitoring, land use and land cover (LULC) classification, disaster response, precision agriculture, and much more.
- Abstract(参考訳): 深層学習の進歩は、リモートセンシング画像の分類に革命をもたらしている。
トランスフォーマーベースのアーキテクチャは、自己認識機構を利用して、画像内のグローバルな関係とともに、長距離依存関係のキャプチャを可能にする、従来の畳み込み手法に代わるものとして登場した。
そこで本研究では,地形認識と暗黙的特性推定のために設計された新しいデュアルブランチアーキテクチャであるStrideNETを提案する。
地形認識部はSwin Transformerを利用して、その階層的表現と低計算コストを活用し、局所的特徴とグローバル的特徴の両方を効率的に捉える。
地形特性分枝は, 統計的テクスチャ解析法を用いて, 粗さやすべり性などの表面特性の抽出に重点を置いている。
地形特性の計算により、環境認識の強化が可能である。
StrideNETモデルは、Grassy、Marshy、Sandy、Rockyの4つのターゲット地形クラスからなるデータセットでトレーニングされている。
StrideNETは、現代の方法と比較して競争力がある。
この研究の意味は、環境モニタリング、土地利用と土地被覆分類(LULC)、災害対応、精密農業など、様々な応用にまで及んでいる。
関連論文リスト
- Enhancing Ecological Monitoring with Multi-Objective Optimization: A Novel Dataset and Methodology for Segmentation Algorithms [17.802456388479616]
オーストラリア, ニューサウスウェールズ州ベガバレーで, 外来種および外来種を捉えた6,096個の高分解能空中画像のユニークなセマンティックセマンティックセマンティクスデータセットを導入した。
このデータセットは、草種の重複と分布のため、困難な課題を示す。
データセットとコードは公開され、コンピュータビジョン、機械学習、生態学の研究を促進することを目的としている。
論文 参考訳(メタデータ) (2024-07-25T18:27:27Z) - ImplicitTerrain: a Continuous Surface Model for Terrain Data Analysis [14.013976303831313]
ImplicitTerrainは、高解像度の地形を連続的に微分的にモデル化するための暗黙の神経表現(INR)アプローチである。
本実験では, 表面適合精度, 有効トポロジカル特徴抽出, 各種トポロジカル特徴抽出について検討した。
論文 参考訳(メタデータ) (2024-05-31T23:05:34Z) - Terrain Diffusion Network: Climatic-Aware Terrain Generation with
Geological Sketch Guidance [16.29267504093274]
スケッチベースの地形生成は、コンピュータゲーム、アニメーション、バーチャルリアリティーなどの様々なアプリケーションにおいて、仮想環境のための現実的な風景を作成しようとしている。
本稿では,制御性向上のためのユーザガイダンスを積極的に取り入れた,新しい拡散に基づく地形拡散ネットワーク(TDN)を提案する。
3つの地形合成装置は、構造的、中間的、きめ細やかなレベル認知のために設計されており、それぞれの合成装置は異なる地形の側面に集中することができる。
論文 参考訳(メタデータ) (2023-08-31T13:41:34Z) - Masked Transformer for Neighhourhood-aware Click-Through Rate Prediction [74.52904110197004]
本稿では,近隣相互作用に基づくCTR予測を提案し,そのタスクを異種情報ネットワーク(HIN)設定に組み込む。
周辺地域の表現を高めるために,ノード間のトポロジカルな相互作用を4種類検討する。
本研究では,2つの実世界のデータセットに関する総合的な実験を行い,提案手法が最先端のCTRモデルを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2022-01-25T12:44:23Z) - CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。
提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。
実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文 参考訳(メタデータ) (2021-12-31T04:37:11Z) - Cycle and Semantic Consistent Adversarial Domain Adaptation for Reducing
Simulation-to-Real Domain Shift in LiDAR Bird's Eye View [110.83289076967895]
ドメイン適応プロセス中に関心のある小さなオブジェクトの情報を保存するために,事前の意味分類を用いたサイクガンに基づくbevドメイン適応法を提案する。
生成したBEVの品質は,KITTI 3D Object Detection Benchmarkの最先端3Dオブジェクト検出フレームワークを用いて評価されている。
論文 参考訳(メタデータ) (2021-04-22T12:47:37Z) - GANav: Group-wise Attention Network for Classifying Navigable Regions in
Unstructured Outdoor Environments [54.21959527308051]
本稿では,RGB画像から,オフロード地形および非構造環境における安全かつ航行可能な領域を識別する新しい学習手法を提案する。
本手法は,粒度の粗いセマンティックセグメンテーションを用いて,そのナビビリティレベルに基づいて地形分類群を分類する。
RUGD と RELLIS-3D のデータセットを広範囲に評価することにより,我々の学習アルゴリズムがナビゲーションのためのオフロード地形における視覚知覚の精度を向上させることを示す。
論文 参考訳(メタデータ) (2021-03-07T02:16:24Z) - Localising In Complex Scenes Using Balanced Adversarial Adaptation [19.160686658569507]
ドメイン適応と生成モデリングは、データ収集とラベル付けの高価な性質を全体として緩和している。
本研究では,シミュレーション環境のローカライズに最適化された表現と,実環境におけるそのような表現の適用との間に存在する性能ギャップについて検討する。
論文 参考訳(メタデータ) (2020-11-09T00:40:50Z) - Unsupervised Metric Relocalization Using Transform Consistency Loss [66.19479868638925]
メートル法再ローカライズを行うためのトレーニングネットワークは、従来、正確な画像対応が必要である。
地図内のクエリ画像のローカライズは、登録に使用される参照画像に関係なく、同じ絶対的なポーズを与えるべきである。
提案手法は, 限られた地下構造情報が得られる場合に, 他の教師あり手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-01T19:24:27Z) - Gaussian Process Gradient Maps for Loop-Closure Detection in
Unstructured Planetary Environments [17.276441789710574]
以前にマップされた位置を認識する能力は、自律システムにとって不可欠な機能である。
非構造的な惑星のような環境は、地形の類似性のためにこれらのシステムに大きな課題をもたらす。
本稿では,空間情報のみを用いたループ閉鎖問題の解法を提案する。
論文 参考訳(メタデータ) (2020-09-01T04:41:40Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。