Fugu-MT 論文翻訳(概要): ΩSFormer: Dual-Modal Ω-like Super-Resolution Transformer Network for Cross-scale and High-accuracy Terraced Field Vectorization Extraction

論文の概要: ΩSFormer: Dual-Modal Ω-like Super-Resolution Transformer Network for Cross-scale and High-accuracy Terraced Field Vectorization Extraction

arxiv url: http://arxiv.org/abs/2411.17088v1
Date: Tue, 26 Nov 2024 04:00:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:51.043436
Title: ΩSFormer: Dual-Modal Ω-like Super-Resolution Transformer Network for Cross-scale and High-accuracy Terraced Field Vectorization Extraction
Title（参考訳）: ΩSFormer: 大規模・高精度テラスフィールドベクトル抽出のためのデュアルモーダルΩ様超解像トランスネットワーク
Authors: Chang Li, Yu Wang, Ce Zhang, Yongjun Zhang,
Abstract要約: 棚田は土壌・水質保全(SWC)の重要な工学的実践である本研究は,知的TFVEのための新しい2モードOmega型超解像トランスネットワークを提案する最初のものである。
参考スコア（独自算出の注目度）: 14.821191612452418
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Terraced field is a significant engineering practice for soil and water conservation (SWC). Terraced field extraction from remotely sensed imagery is the foundation for monitoring and evaluating SWC. This study is the first to propose a novel dual-modal {\Omega}-like super-resolution Transformer network for intelligent TFVE, offering the following advantages: (1) reducing edge segmentation error from conventional multi-scale downsampling encoder, through fusing original high-resolution features with downsampling features at each step of encoder and leveraging a multi-head attention mechanism; (2) improving the accuracy of TFVE by proposing a {\Omega}-like network structure, which fully integrates rich high-level features from both spectral and terrain data to form cross-scale super-resolution features; (3) validating an optimal fusion scheme for cross-modal and cross-scale (i.e., inconsistent spatial resolution between remotely sensed imagery and DEM) super-resolution feature extraction; (4) mitigating uncertainty between segmentation edge pixels by a coarse-to-fine and spatial topological semantic relationship optimization (STSRO) segmentation strategy; (5) leveraging contour vibration neural network to continuously optimize parameters and iteratively vectorize terraced fields from semantic segmentation results. Moreover, a DMRVD for deep-learning-based TFVE was created for the first time, which covers nine study areas in four provinces of China, with a total coverage area of 22441 square kilometers. To assess the performance of {\Omega}SFormer, classic and SOTA networks were compared. The mIOU of {\Omega}SFormer has improved by 0.165, 0.297 and 0.128 respectively, when compared with best accuracy single-modal remotely sensed imagery, single-modal DEM and dual-modal result.
Abstract（参考訳）: 棚田は土壌と水の保全(SWC)のための重要な工学的実践である。リモートセンシング画像からのテラスフィールド抽出がSWCの監視と評価の基礎となっている。本研究は,従来のマルチスケールダウンサンプリングエンコーダからエッジセグメンテーション誤差を低減し,エンコーダの各ステップにおけるダウンサンプリング特徴を融合し,マルチヘッドアテンション機構を活用することによる,インテリジェントTFVEのための新しいデュアルモーダル型超解像トランスフォーマーネットワークを提案する。(2)スペクトルデータと地形データの両方からリッチな高レベル特徴を十分に統合して超解像特徴を形成することによるTFVEの精度向上,(3)クロスモーダル・クロススケールの最適融合スキームの検証(例えば,リモートセンシングとDEM間の不整合空間分解),(4)エッジセグメンテーション・セグメンテーション・セグメンテーションの精度向上,(5) セグメンテーション・セグメンテーションの最適化,(5) セグメンテーション・セグメンテーションの最適化,(5) セグメンテーション・セグメンテーション・セグメンテーションの最適化,(5) セグメンテーション・セグメンテーションの最適化,(5) セグメンテーション・セグメンテーションの最適化, セグメンテーション・セグメンテーションの最適化,(5) セグメンテーション・セグメンテーションの最適化, セグメンテーション・セグメンテーション, TFVEのセグメンテーションのセグメンテーション, 。さらに、中国4州9つの研究エリアをカバーし、総面積は22441平方キロメートルである深層学習型TFVEのためのDMRVDを初めて作成した。 Omega}SFormerの性能を評価するために,古典的ネットワークとSOTAネットワークを比較した。 Omega {\displaystyle {\Omega}SFormerのmIOUはそれぞれ0.165, 0.297, 0.128に改善されている。

関連論文リスト

Any Resolution Any Geometry: From Multi-View To Multi-Patch [46.8276232687626]
Ultra Resolution Geometry Transformer (URGT) は、VGGT (Visual Geometry Grounded Transformer) をモノクル高分解能深度正規推定のための統一マルチパッチトランスに適合させる。 1つの高解像度画像は、事前訓練されたモデルから粗い深さと通常の先行値で拡張されたパッチに分割され、1つの前方通過で共同処理され、洗練された幾何出力を予測する。提案手法はUnrealStereo4Kの最先端化を実現し,AbsRelを0.0582から0.0291に,RMSEを2.17から1.3に削減する。
論文参考訳（メタデータ） (2026-03-03T14:18:24Z)
BasicAVSR: Arbitrary-Scale Video Super-Resolution via Image Priors and Enhanced Motion Compensation [70.27358326228399]
任意スケールビデオ超解像(AVSR)のためのベーシックAVSRを提案する。 AVSRは、ビデオフレームの解像度、潜在的に様々なスケーリング要素を強化することを目的としている。超高分解能, 一般化能力, 推論速度の点で, BasicAVSR は既存手法よりも優れていた。
論文参考訳（メタデータ） (2025-10-30T05:08:45Z)
Scale-DiT: Ultra-High-Resolution Image Generation with Hierarchical Local Attention [50.391914489898774]
Scale-DiTは、階層的な局所的注意を低解像度のグローバルガイダンスで導入する新しい拡散フレームワークである。軽量なLoRA適応は、デノナイズ中のグローバルパスとローカルパスをブリッジし、構造と詳細の整合性を確保する。実験によると、Scale-DiTは2ドル以上の高速な推論とメモリ使用量の削減を実現している。
論文参考訳（メタデータ） (2025-10-18T03:15:26Z)
Meta-training of diffractive meta-neural networks for super-resolution direction of arrival estimation [2.8163062697198744]
そこで我々は, 拡散型メタニューラルネットワーク (DMNN) を提案する。 DMNNはトレーニング済みのミニメタネットを統合し、異なる分極と周波数のメタ原子の振幅と位相応答を特徴付ける。広視野超解像角推定には、xとyの偏光チャネルを通して方位角と高度角を同時に解決する。
論文参考訳（メタデータ） (2025-09-07T04:49:51Z)
NexViTAD: Few-shot Unsupervised Cross-Domain Defect Detection via Vision Foundation Models and Multi-Task Learning [1.7603474309877931]
NexViTADは、視覚基盤モデルに基づくクロスドメイン異常検出フレームワークである。産業的異常検出における領域シフト問題に、革新的な共有部分空間投影機構を通じて対処する。 AUCは97.5%、APは70.4%、PRは95.2%である。
論文参考訳（メタデータ） (2025-07-10T09:29:26Z)
A Gradient Meta-Learning Joint Optimization for Beamforming and Antenna Position in Pinching-Antenna Systems [63.213207442368294]
マルチ導波路ピンチアンテナシステムの新しい最適化設計について検討する。提案したGML-JOアルゴリズムは,既存の最適化手法と比較して,様々な選択や性能に頑健である。
論文参考訳（メタデータ） (2025-06-14T17:35:27Z)
Lightweight RGB-D Salient Object Detection from a Speed-Accuracy Tradeoff Perspective [54.91271106816616]
現在のRGB-D法は通常、大規模なバックボーンを利用して精度を向上させるが効率を犠牲にする。本稿では,軽量RGB-D SODのためのSATNet(Speed-Accuracy Tradeoff Network)を提案する。深度について,高品質の深度マップを生成するための深度任意のモデルを導入する。モダリティ融合において,モダリティ間の整合性を検討するために,DAM(Decoupled Attention Module)を提案する。特徴表現のために,双方向の反転フレームワークを用いたDIRM (Dual Information Representation Module) を開発した。
論文参考訳（メタデータ） (2025-05-07T19:37:20Z)
RSRWKV: A Linear-Complexity 2D Attention Mechanism for Efficient Remote Sensing Vision Task [20.16344973940904]
高分解能リモートセンシング分析は、シーンの複雑さとスケールの多様性による課題に直面している。逐次処理と2次元空間推論を橋渡しする新しい2D-WKVスキャン機構を特徴とするSRWKVを提案する。
論文参考訳（メタデータ） (2025-03-26T10:03:46Z)
Super-Resolution for Remote Sensing Imagery via the Coupling of a Variational Model and Deep Learning [20.697932997351813]
リモートセンシング画像再構成のための勾配誘導マルチフレーム超解像(MFSR)フレームワークリモートセンシング画像再構成のための新しい勾配誘導型マルチフレーム超解像(MFSR)フレームワークを提案する。
論文参考訳（メタデータ） (2024-12-13T04:19:48Z)
High-Precision Dichotomous Image Segmentation via Probing Diffusion Capacity [69.32473738284374]
拡散モデルは、例外的な品質、詳細な解像度、強い文脈認識を提供することによって、テキストと画像の合成に革命をもたらした。本稿では,拡散モデルにおける事前学習されたU-Netのポテンシャルを利用する拡散駆動セグメンテーションモデルDiffDISを提案する。 DIS5Kデータセットの実験は、DiffDISの優位性を示し、合理化された推論プロセスを通じて最先端の結果を達成する。
論文参考訳（メタデータ） (2024-10-14T02:49:23Z)
Remote Sensing Image Segmentation Using Vision Mamba and Multi-Scale Multi-Frequency Feature Fusion [9.098711843118629]
本稿では、状態空間モデル(SSM)を導入し、視覚マンバ(CVMH-UNet)に基づく新しいハイブリッドセマンティックセマンティックネットワークを提案する。本手法は、クロス2Dスキャン(CS2D)を用いて、複数の方向からグローバル情報をフルにキャプチャする、クロス走査型視覚状態空間ブロック(CVSSBlock)を設計する。ローカル情報取得におけるビジョン・マンバ(VMamba)の制約を克服するために畳み込みニューラルネットワークのブランチを組み込むことにより、このアプローチはグローバル機能とローカル機能の両方の包括的な分析を促進する。
論文参考訳（メタデータ） (2024-10-08T02:17:38Z)
UDHF2-Net: Uncertainty-diffusion-model-based High-Frequency TransFormer Network for Remotely Sensed Imagery Interpretation [12.24506241611653]
不確実拡散モデルに基づく高周波トランスフォーマーネットワーク(UDHF2-Net)が最初に提案される。 UDHF2-Netは空間定常非定常高周波接続パラダイム(SHCP)である Mask-and-geo-knowledge-based uncertainty diffusion module (MUDM) は自己指導型学習戦略である。周波数ワイド半擬似半擬似UDHF2-Netは、変更検出の精度と複雑さのバランスをとるために提案された最初のものである。
論文参考訳（メタデータ） (2024-06-23T15:03:35Z)
CMTNet: Convolutional Meets Transformer Network for Hyperspectral Images Classification [3.821081081400729]
現在の畳み込みニューラルネットワーク(CNN)は、ハイパースペクトルデータの局所的な特徴に焦点を当てている。 Transformerフレームワークは、ハイパースペクトル画像からグローバルな特徴を抽出する。本研究は、CMTNet(Convolutional Meet Transformer Network)を紹介する。
論文参考訳（メタデータ） (2024-06-20T07:56:51Z)
ESSAformer: Efficient Transformer for Hyperspectral Image Super-resolution [76.7408734079706]
単一ハイパースペクトル像超解像(単一HSI-SR)は、低分解能観測から高分解能ハイパースペクトル像を復元することを目的としている。本稿では,1つのHSI-SRの繰り返し精製構造を持つESSA注目組込みトランスフォーマネットワークであるESSAformerを提案する。
論文参考訳（メタデータ） (2023-07-26T07:45:14Z)
Hyperspectral Image Super-Resolution via Dual-domain Network Based on Hybrid Convolution [6.3814314790000415]
本稿ではハイブリッド畳み込み(SRDNet)に基づく新しいHSI超解像アルゴリズムを提案する。スペクトル間自己相似性を捉えるため、空間領域に自己注意学習機構(HSL)を考案する。 HSIの知覚品質をさらに向上するため、周波数領域のモデルを最適化するために周波数損失(HFL)を導入した。
論文参考訳（メタデータ） (2023-04-10T13:51:28Z)
Task-Oriented Sensing, Computation, and Communication Integration for Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文参考訳（メタデータ） (2022-07-03T06:57:07Z)
Joint Spatial-Temporal and Appearance Modeling with Transformer for Multiple Object Tracking [59.79252390626194]
本稿ではTransSTAMという新しい手法を提案する。Transformerを利用して各オブジェクトの外観特徴とオブジェクト間の空間的時間的関係の両方をモデル化する。提案手法はMOT16, MOT17, MOT20を含む複数の公開ベンチマークで評価され, IDF1とHOTAの両方で明確な性能向上を実現している。
論文参考訳（メタデータ） (2022-05-31T01:19:18Z)
Pyramid Grafting Network for One-Stage High Resolution Saliency Detection [29.013012579688347]
我々は、異なる解像度画像から特徴を独立して抽出する、Praamid Grafting Network (PGNet) と呼ばれるワンステージフレームワークを提案する。 CNNブランチが壊れた詳細情報をよりホモロジーに組み合わせられるように、アテンションベースのクロスモデルグラフティングモジュール (CMGM) が提案されている。我々は,4K-8K解像度で5,920個の画像を含む超高分解能塩度検出データセットUHRSDを新たに提供した。
論文参考訳（メタデータ） (2022-04-11T12:22:21Z)
CSformer: Bridging Convolution and Transformer for Compressive Sensing [65.22377493627687]
本稿では,CNNからの詳細な空間情報を活用するためのハイブリッドフレームワークと,表現学習の強化を目的としたトランスフォーマーが提供するグローバルコンテキストを統合することを提案する。提案手法は、適応的なサンプリングとリカバリからなるエンドツーエンドの圧縮画像センシング手法である。実験により, 圧縮センシングにおける専用トランスアーキテクチャの有効性が示された。
論文参考訳（メタデータ） (2021-12-31T04:37:11Z)
Joint Multi-Dimension Pruning via Numerical Gradient Update [120.59697866489668]
本稿では,空間,深さ,チャネルの3つの重要な側面において,ネットワークを同時に切断する方法であるジョイント・マルチディメンジョン・プルーニング(ジョイント・プルーニング)を提案する。本手法は,1つのエンドツーエンドトレーニングにおいて3次元にわたって協調的に最適化され,従来よりも効率がよいことを示す。
論文参考訳（メタデータ） (2020-05-18T17:57:09Z)
Spatial-Spectral Residual Network for Hyperspectral Image Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文参考訳（メタデータ） (2020-01-14T03:34:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。