論文の概要: Efficient Remote Sensing Segmentation With Generative Adversarial
Transformer
- arxiv url: http://arxiv.org/abs/2310.01292v1
- Date: Mon, 2 Oct 2023 15:46:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-04 20:58:50.975813
- Title: Efficient Remote Sensing Segmentation With Generative Adversarial
Transformer
- Title(参考訳): 生成逆変換器を用いた効率的なリモートセンシングセグメンテーション
- Authors: Luyi Qiu and Dayu Yu and Xiaofeng Zhang and Chenxiao Zhang
- Abstract要約: 本稿では,高精度なセマンティックセマンティックセグメンテーションを実現するためのGATrans(Generative Adversarial Transfomer)を提案する。
このフレームワークはGTNet(Global Transformer Network)をジェネレータとして利用し、マルチレベル機能を効率的に抽出する。
ベイヒンゲンデータセットの広範囲な実験により、我々のアプローチの有効性を検証し、平均F1スコアは90.17%、総合精度は91.92%に達した。
- 参考スコア(独自算出の注目度): 5.728847418491545
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most deep learning methods that achieve high segmentation accuracy require
deep network architectures that are too heavy and complex to run on embedded
devices with limited storage and memory space. To address this issue, this
paper proposes an efficient Generative Adversarial Transfomer (GATrans) for
achieving high-precision semantic segmentation while maintaining an extremely
efficient size. The framework utilizes a Global Transformer Network (GTNet) as
the generator, efficiently extracting multi-level features through residual
connections. GTNet employs global transformer blocks with progressively linear
computational complexity to reassign global features based on a learnable
similarity function. To focus on object-level and pixel-level information, the
GATrans optimizes the objective function by combining structural similarity
losses. We validate the effectiveness of our approach through extensive
experiments on the Vaihingen dataset, achieving an average F1 score of 90.17%
and an overall accuracy of 91.92%.
- Abstract(参考訳): 高いセグメンテーション精度を達成するディープラーニング手法の多くは、ストレージとメモリスペースに制限のある組み込みデバイス上で実行するには重くて複雑すぎるディープネットワークアーキテクチャを必要とする。
本稿では,高精度なサイズを維持しつつ高精度なセマンティクスセグメンテーションを実現するための効率的な生成的逆向性トランスフォマー(gatrans)を提案する。
このフレームワークはGTNet(Global Transformer Network)をジェネレータとして利用し、残差接続を通じて効率的にマルチレベル特徴を抽出する。
gtnetは、段階的に線形な計算複雑性を持つグローバルトランスフォーマーブロックを使用して、学習可能な類似度関数に基づいてグローバルな特徴を再割り当てする。
GATransは、オブジェクトレベルの情報とピクセルレベルの情報に焦点を合わせるため、構造的類似性損失を組み合わせた目的関数を最適化する。
本手法の有効性を検証するために,vaihingenデータセットを用いた広範な実験を行い,平均f1スコアが90.17%,総合精度91.92%を得た。
関連論文リスト
- CARE Transformer: Mobile-Friendly Linear Visual Transformer via Decoupled Dual Interaction [77.8576094863446]
本稿では,新しいdetextbfCoupled dutextbfAl-interactive lineatextbfR atttextbfEntion (CARE) 機構を提案する。
まず,非対称な特徴分離戦略を提案し,非対称的に学習プロセスを局所帰納バイアスと長距離依存に分解する。
分離学習方式を採用し,特徴間の相補性を完全に活用することにより,高い効率性と精度を両立させることができる。
論文 参考訳(メタデータ) (2024-11-25T07:56:13Z) - Efficient Semantic Segmentation via Lightweight Multiple-Information Interaction Network [37.84039482457571]
LMIINetと呼ばれるリアルタイムセマンティックセグメンテーションのための軽量な多重情報インタラクションネットワークを提案する。
CNNとTransformerを効果的に組み合わせ、冗長な計算とメモリフットプリントを削減する。
0.72Mパラメータと11.74G FLOPsで、LMIINetはシティスケープのテストセットで100 FPSで72.0% mIoU、CamVidデータセットで160 FPSで69.94% mIoUを達成した。
論文 参考訳(メタデータ) (2024-10-03T05:45:24Z) - TransUKAN:Computing-Efficient Hybrid KAN-Transformer for Enhanced Medical Image Segmentation [5.280523424712006]
U-Netは現在、医療画像セグメンテーションの最も広く使われているアーキテクチャである。
我々は、メモリ使用量と計算負荷を減らすためにkanを改善した。
このアプローチは、非線形関係をキャプチャするモデルの能力を高める。
論文 参考訳(メタデータ) (2024-09-23T02:52:49Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - Spatial-information Guided Adaptive Context-aware Network for Efficient
RGB-D Semantic Segmentation [9.198120596225968]
計算パラメータを削減し,アルゴリズムの堅牢性を保証する,効率的な軽量エンコーダデコーダネットワークを提案する。
また,NYUv2,SUN RGB-D,Cityscapesのデータセットを用いた実験結果から,本手法は最先端手法よりもセグメンテーション精度,推定時間,パラメータのトレードオフが良好であることが示された。
論文 参考訳(メタデータ) (2023-08-11T09:02:03Z) - DLGSANet: Lightweight Dynamic Local and Global Self-Attention Networks
for Image Super-Resolution [83.47467223117361]
画像の超解像化に有効な軽量な動的局所・大域自己アテンションネットワーク(DLGSANet)を提案する。
トランスフォーマーのネットワーク設計により,ローカル特徴を効率的に抽出するシンプルなマルチヘッド動的自己アテンション(MHDLSA)モジュールを開発した。
この問題を解決するために,最も有用な類似値を選択するために,スパースグローバル自己アテンション(SparseGSA)モジュールを開発した。
論文 参考訳(メタデータ) (2023-01-05T12:06:47Z) - RTFormer: Efficient Design for Real-Time Semantic Segmentation with
Transformer [63.25665813125223]
本稿では,リアルタイムセマンティックセグメンテーションのための効率的なデュアルレゾリューション変換器RTFormerを提案する。
CNNベースのモデルよりもパフォーマンスと効率のトレードオフが優れている。
主要なベンチマーク実験では,提案したRTFormerの有効性を示す。
論文 参考訳(メタデータ) (2022-10-13T16:03:53Z) - MISSU: 3D Medical Image Segmentation via Self-distilling TransUNet [55.16833099336073]
医用画像セグメンテーションのためのトランスフォーマーベースUNetを提案する。
グローバルな意味情報と局所的な空間的詳細特徴を同時に学習する。
MISSUは従来の最先端手法よりも優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-06-02T07:38:53Z) - TransMOT: Spatial-Temporal Graph Transformer for Multiple Object
Tracking [74.82415271960315]
映像内の物体間の空間的・時間的相互作用を効率的にモデル化するソリューションであるTransMOTを提案する。
TransMOTは従来のTransformerよりも計算効率が高いだけでなく、トラッキング精度も向上している。
提案手法は、MOT15、MOT16、MOT17、MOT20を含む複数のベンチマークデータセット上で評価される。
論文 参考訳(メタデータ) (2021-04-01T01:49:05Z) - TransFuse: Fusing Transformers and CNNs for Medical Image Segmentation [9.266588373318688]
低レベルディテールのローカリゼーション能力を失うことなく、グローバルコンテキストのモデリングにおける効率性を改善する問題を検討する。
TransFuse、並列スタイルでトランスフォーマーとCNNを組み合わせた新しい2ブランチアーキテクチャが提案されています。
TransFuseでは、グローバル依存性と低レベルの空間詳細の両方を、はるかに浅い方法で効率的にキャプチャできます。
論文 参考訳(メタデータ) (2021-02-16T08:09:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。