Fugu-MT 論文翻訳(概要): Learning to Holistically Detect Bridges from Large-Size VHR Remote Sensing Imagery

論文の概要: Learning to Holistically Detect Bridges from Large-Size VHR Remote Sensing Imagery

arxiv url: http://arxiv.org/abs/2312.02481v1
Date: Tue, 5 Dec 2023 04:15:22 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-06 16:54:04.003752
Title: Learning to Holistically Detect Bridges from Large-Size VHR Remote Sensing Imagery
Title（参考訳）: 大規模VHRリモートセンシング画像からの橋梁のホログラフィー検出の学習
Authors: Yansheng Li, Junwei Luo, Yongjun Zhang, Yihua Tan, Jin-Gang Yu, Song Bai
Abstract要約: 大規模超高分解能(VHR)RSIにおける全体的橋梁検出は不可欠である。大規模なVHR RSIを備えたデータセットの欠如は、ブリッジ検出におけるディープラーニングアルゴリズムのパフォーマンスを制限している。本稿では,多様な地理的位置から採取した6,000VHR RSIからなるGLH-Bridgeという大規模データセットを提案する。
参考スコア（独自算出の注目度）: 40.001753733290464
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Bridge detection in remote sensing images (RSIs) plays a crucial role in various applications, but it poses unique challenges compared to the detection of other objects. In RSIs, bridges exhibit considerable variations in terms of their spatial scales and aspect ratios. Therefore, to ensure the visibility and integrity of bridges, it is essential to perform holistic bridge detection in large-size very-high-resolution (VHR) RSIs. However, the lack of datasets with large-size VHR RSIs limits the deep learning algorithms' performance on bridge detection. Due to the limitation of GPU memory in tackling large-size images, deep learning-based object detection methods commonly adopt the cropping strategy, which inevitably results in label fragmentation and discontinuous prediction. To ameliorate the scarcity of datasets, this paper proposes a large-scale dataset named GLH-Bridge comprising 6,000 VHR RSIs sampled from diverse geographic locations across the globe. These images encompass a wide range of sizes, varying from 2,048*2,048 to 16,38*16,384 pixels, and collectively feature 59,737 bridges. Furthermore, we present an efficient network for holistic bridge detection (HBD-Net) in large-size RSIs. The HBD-Net presents a separate detector-based feature fusion (SDFF) architecture and is optimized via a shape-sensitive sample re-weighting (SSRW) strategy. Based on the proposed GLH-Bridge dataset, we establish a bridge detection benchmark including the OBB and HBB tasks, and validate the effectiveness of the proposed HBD-Net. Additionally, cross-dataset generalization experiments on two publicly available datasets illustrate the strong generalization capability of the GLH-Bridge dataset.
Abstract（参考訳）: リモートセンシング画像(RSI)におけるブリッジ検出は,様々なアプリケーションにおいて重要な役割を担っているが,他のオブジェクトの検出と比較して,ユニークな課題が生じる。 RSIでは、橋は空間スケールとアスペクト比の点でかなりのバリエーションを示す。したがって,橋梁の視認性と整合性を確保するためには,大規模超高分解能(VHR)RSIにおいて全体的橋梁検出を行う必要がある。しかし、大規模なVHR RSIを持つデータセットの欠如は、ブリッジ検出におけるディープラーニングアルゴリズムのパフォーマンスを制限している。大規模画像に対処する際のGPUメモリの制限のため、ディープラーニングに基づくオブジェクト検出手法は、一般的には収穫戦略を採用しており、必然的にラベルの断片化や不連続予測をもたらす。データセットの不足を緩和するために,世界中の多様な地域から採取された6,000VHR RSIからなるGLH-Bridgeという大規模データセットを提案する。画像サイズは2,048*2,048から16,38*16,384ピクセルまで様々で、合計59,737本の橋がある。さらに,大規模RCIにおけるHBD-Netの効率的なネットワークを提案する。 HBD-Netは、別々の検出器ベースの特徴融合(SDFF)アーキテクチャを示し、形状感受性サンプル再重み付け(SSRW)戦略によって最適化されている。提案したGLH-Bridgeデータセットに基づいて,OBBおよびHBBタスクを含むブリッジ検出ベンチマークを構築し,提案したHBD-Netの有効性を検証する。さらに、2つの公開データセットにおけるクロスデータセットの一般化実験は、GLH-Bridgeデータセットの強力な一般化能力を示している。

関連論文リスト

Hyperspectral Remote Sensing Images Salient Object Detection: The First Benchmark Dataset and Baseline [14.081609886645555]
HRSI-SODデータセットはHRSSDと呼ばれ,704個のハイパースペクトル画像と5327個のピクセルレベルのアノテート・サリエント・オブジェクトを含む。 HRSSDデータセットは、大規模な変動、さまざまなフォアグラウンド・バックグラウンド・リレーション、マルチサリアント・オブジェクトのために、健全なオブジェクト検出アルゴリズムに重大な課題を提起する。我々は、ディープ・スペクトル・サリエンシ・ネットワーク(DSSN)と呼ばれるHRSI-SODの革新的で効率的なベースラインモデルを提案する。
論文参考訳（メタデータ） (2025-04-03T09:12:42Z)
Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。 KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。 RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文参考訳（メタデータ） (2024-09-09T13:56:22Z)
PGNeXt: High-Resolution Salient Object Detection via Pyramid Grafting Network [24.54269823691119]
本稿では、データセットとネットワークフレームワークの両方の観点から、より難解な高分解能サルエントオブジェクト検出(HRSOD)について述べる。 HRSODデータセットの欠如を補うため、UHRSDと呼ばれる大規模高解像度の高分解能物体検出データセットを慎重に収集した。すべての画像はピクセルレベルで微妙にアノテートされ、以前の低解像度のSODデータセットをはるかに上回っている。
論文参考訳（メタデータ） (2024-08-02T09:31:21Z)
SARDet-100K: Towards Open-Source Benchmark and ToolKit for Large-Scale SAR Object Detection [79.23689506129733]
我々は,大規模SARオブジェクト検出のための新しいベンチマークデータセットとオープンソース手法を構築した。私たちのデータセットであるSARDet-100Kは、10の既存のSAR検出データセットの厳格な調査、収集、標準化の結果です。私たちの知る限りでは、SARDet-100KはCOCOレベルの大規模マルチクラスSARオブジェクト検出データセットとしては初めてのものです。
論文参考訳（メタデータ） (2024-03-11T09:20:40Z)
Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。提案手法は平均精度(MAP)を約45.7%向上させる。この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文参考訳（メタデータ） (2023-11-21T19:49:13Z)
Pyramid Grafting Network for One-Stage High Resolution Saliency Detection [29.013012579688347]
我々は、異なる解像度画像から特徴を独立して抽出する、Praamid Grafting Network (PGNet) と呼ばれるワンステージフレームワークを提案する。 CNNブランチが壊れた詳細情報をよりホモロジーに組み合わせられるように、アテンションベースのクロスモデルグラフティングモジュール (CMGM) が提案されている。我々は,4K-8K解像度で5,920個の画像を含む超高分解能塩度検出データセットUHRSDを新たに提供した。
論文参考訳（メタデータ） (2022-04-11T12:22:21Z)
Learning Efficient Representations for Enhanced Object Detection on Large-scene SAR Images [16.602738933183865]
SAR(Synthetic Aperture Radar)画像のターゲットの検出と認識は難しい問題である。近年開発されたディープラーニングアルゴリズムは,SAR画像の固有の特徴を自動的に学習することができる。本稿では,効率的かつ堅牢なディープラーニングに基づくターゲット検出手法を提案する。
論文参考訳（メタデータ） (2022-01-22T03:25:24Z)
RGB-D Saliency Detection via Cascaded Mutual Information Minimization [122.8879596830581]
既存のRGB-Dサリエンシ検出モデルは、RGBと深さを効果的にマルチモーダル学習を実現するために明示的に奨励するものではない。本稿では,RGB画像と深度データ間のマルチモーダル情報を「明示的」にモデル化するために,相互情報最小化による新しい多段階学習フレームワークを提案する。
論文参考訳（メタデータ） (2021-09-15T12:31:27Z)
Locality-Aware Rotated Ship Detection in High-Resolution Remote Sensing Imagery Based on Multi-Scale Convolutional Network [7.984128966509492]
マルチスケール畳み込みニューラルネットワーク(CNN)に基づく局所性認識型回転船検出(LARSD)フレームワークを提案する。提案フレームワークはUNetのようなマルチスケールCNNを用いて高解像度の情報を持つマルチスケール特徴マップを生成する。検出データセットを拡大するために、新しい高解像度船舶検出(HRSD)データセットを構築し、2499の画像と9269のインスタンスを異なる解像度でGoogle Earthから収集した。
論文参考訳（メタデータ） (2020-07-24T03:01:42Z)
Bifurcated backbone strategy for RGB-D salient object detection [168.19708737906618]
我々は、RGB-Dの高次物体検出に固有のマルチモーダル・マルチレベルの性質を活用して、新しいカスケードリファインメントネットワークを考案する。アーキテクチャは Bifurcated Backbone Strategy Network (BBS-Net) と呼ばれ、シンプルで効率的でバックボーンに依存しない。
論文参考訳（メタデータ） (2020-07-06T13:01:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。