Fugu-MT 論文翻訳(概要): PLGAN: Generative Adversarial Networks for Power-Line Segmentation in Aerial Images

論文の概要: PLGAN: Generative Adversarial Networks for Power-Line Segmentation in Aerial Images

arxiv url: http://arxiv.org/abs/2204.07243v1
Date: Thu, 14 Apr 2022 21:43:31 GMT
ステータス: 翻訳完了
システム内更新日: 2022-04-18 11:21:50.564017
Title: PLGAN: Generative Adversarial Networks for Power-Line Segmentation in Aerial Images
Title（参考訳）: PLGAN: 航空画像における電力線分割のための生成逆ネットワーク
Authors: Rabab Abdelfattah, Xiaofeng Wang, Song Wang
Abstract要約: PLGANは、異なる背景を持つ空中画像から電力線を分割するシンプルで効果的な方法である。生成した画像の適切な形状を高品質な特徴埋め込みに活用する。提案するPLGANは, セマンティックセグメンテーションや線検出において, 従来の最先端手法よりも優れていた。
参考スコア（独自算出の注目度）: 15.504887854179666
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Accurate segmentation of power lines in various aerial images is very important for UAV flight safety. The complex background and very thin structures of power lines, however, make it an inherently difficult task in computer vision. This paper presents PLGAN, a simple yet effective method based on generative adversarial networks, to segment power lines from aerial images with different backgrounds. Instead of directly using the adversarial networks to generate the segmentation, we take their certain decoding features and embed them into another semantic segmentation network by considering more context, geometry, and appearance information of power lines. We further exploit the appropriate form of the generated images for high-quality feature embedding and define a new loss function in the Hough-transform parameter space to enhance the segmentation of very thin power lines. Extensive experiments and comprehensive analysis demonstrate that our proposed PLGAN outperforms the prior state-of-the-art methods for semantic segmentation and line detection.
Abstract（参考訳）: 様々な空中画像における電力線の正確なセグメンテーションは、UAVの飛行安全にとって非常に重要である。しかし、複雑な背景と非常に薄い電力線構造は、コンピュータビジョンにおいて本質的に困難である。本稿では,異なる背景を持つ空中画像から電力線を分割する,生成的敵ネットワークに基づく簡易かつ効果的なPLGANを提案する。敵ネットワークを直接使用してセグメンテーションを生成する代わりに、特定のデコード機能を用いて、パワーラインのコンテキスト、幾何学、外観情報を考慮し、別のセグメンテーションネットワークに組み込む。さらに,高品質な特徴埋め込みのために生成された画像の適切な形式を活用し,ハフ変換パラメータ空間における新たな損失関数を定義し,非常に薄い電力線のセグメンテーションを強化する。包括的実験と包括的解析により,提案したPLGANは,セマンティックセグメンテーションや線検出の最先端手法よりも優れていることが示された。

関連論文リスト

Deep Unfolding Multi-modal Image Fusion Network via Attribution Analysis [16.6226059346127]
セマンティックセグメンテーションのために、より効率的に融合画像を調整するための「Unfolding Analysis Fusion Network」 (UAAFusion) を提案する。帰属分析技術を用いて,課題識別のためのソース画像中の意味領域の寄与を探索する。提案手法は,帰属分析から導かれる最適化目的を用いたモデル駆動型展開ネットワークを構築する。
論文参考訳（メタデータ） (2025-02-03T16:00:21Z)
WTDUN: Wavelet Tree-Structured Sampling and Deep Unfolding Network for Image Compressed Sensing [51.94493817128006]
マルチスケールウェーブレットサブバンド上で直接動作するWTDUNという新しいウェーブレットドメインの深層展開フレームワークを提案する。本手法は,ウェーブレット係数の固有間隔とマルチスケール構造を利用して,木構造によるサンプリングと再構成を実現する。
論文参考訳（メタデータ） (2024-11-25T12:31:03Z)
TransResNet: Integrating the Strengths of ViTs and CNNs for High Resolution Medical Image Segmentation via Feature Grafting [6.987177704136503]
医用画像領域で高解像度画像が好ましいのは、基礎となる方法の診断能力を大幅に向上させるためである。医用画像セグメンテーションのための既存のディープラーニング技術のほとんどは、空間次元が小さい入力画像に最適化されており、高解像度画像では不十分である。我々はTransResNetという並列処理アーキテクチャを提案し、TransformerとCNNを並列的に組み合わせ、マルチ解像度画像から特徴を独立して抽出する。
論文参考訳（メタデータ） (2024-10-01T18:22:34Z)
Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。 PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文参考訳（メタデータ） (2024-07-26T06:29:09Z)
Enhancing Polygonal Building Segmentation via Oriented Corners [0.3749861135832072]
本稿では,入力画像から直接ポリゴンを抽出する,OriCornerNetという新しいディープ畳み込みニューラルネットワークを提案する。我々のアプローチは、隣接する角への方向を示すフットプリントマスク、コーナー、配向ベクトルを予測できる深いモデルを含む。 SpaceNet VegasとCrowdAIの小さなデータセットで行った性能評価は、我々のアプローチの競争力を示すものである。
論文参考訳（メタデータ） (2024-07-17T01:59:06Z)
Shape-Sensitive Loss for Catheter and Guidewire Segmentation [5.115480059688438]
カテーテルとガイドワイヤセグメンテーションのための形状感受性損失関数を導入する。我々は、大規模なX線画像データセット上に新しい最先端結果を確立するために、ビジョントランスフォーマーネットワークでこれを利用する。
論文参考訳（メタデータ） (2023-11-19T03:05:21Z)
Dual-Augmented Transformer Network for Weakly Supervised Semantic Segmentation [4.02487511510606]
弱教師付きセマンティックセグメンテーション(WSSS)は、クラスレベルのラベルのみにオブジェクトを分割することを目的とした、基本的なコンピュータビジョンタスクである。従来の手法では、CNNベースのネットワークを採用し、クラスアクティベーションマップ(CAM)戦略を用いて対象領域を発見する。別の方法は、視覚変換器(ViT)を探索して画像を符号化し、グローバルな意味情報を取得することである。相互補完学習のためのCNNベースネットワークとトランスフォーマーネットワークを併用したデュアルネットワークを提案する。
論文参考訳（メタデータ） (2023-09-30T08:41:11Z)
Autonomous Point Cloud Segmentation for Power Lines Inspection in Smart Grid [56.838297900091426]
高電圧と低電圧の両方の電力線の特徴を検出し,抽出し,解析するために,教師なし機械学習(ML)フレームワークを提案する。提案フレームワークは電力線を効率よく検出し,PLCに基づくハザード解析を行う。
論文参考訳（メタデータ） (2023-08-14T17:14:58Z)
DUFormer: Solving Power Line Detection Task in Aerial Images using Semantic Segmentation [17.77548837421917]
無人航空機(UAV)は、電力線を検査したり高解像度の空中画像を撮影するために頻繁に使用される。この問題に対処するために,航空画像中の電力線を明示的に検出するセマンティックセグメンテーションアルゴリズムであるDUFormerを導入する。提案手法は,TTPLAデータセット上での電力線セグメンテーションにおけるすべての最先端手法より優れている。
論文参考訳（メタデータ） (2023-04-12T12:59:02Z)
DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients [105.25109274550607]
ラインセグメントは、視覚タスクでますます使われています。画像勾配に基づく従来の線検出器は非常に高速で精度が高いが、ノイズの多い画像や困難な条件では頑丈さに欠ける。我々は、両方の世界を最大限に活用するために、伝統的なアプローチと学習されたアプローチを組み合わせることを提案する。
論文参考訳（メタデータ） (2022-12-15T12:36:49Z)
Weakly-supervised fire segmentation by visualizing intermediate CNN layers [82.75113406937194]
画像やビデオにおける火の局所化は、火災事故に対処するための自律システムにとって重要なステップである。我々は,ネットワークのトレーニングに画像ラベルのみを使用する,画像中の火の弱い制御セグメント化について検討する。 CNNの中間層における特徴量の平均値は,2値セグメンテーション問題である火災セグメンテーションの場合,従来のクラスアクティベーションマッピング(CAM)法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-11-16T11:56:28Z)
Less is More: Pay Less Attention in Vision Transformers [61.05787583247392]
注意の少ないvIsion Transformerは、畳み込み、完全接続層、自己アテンションが、画像パッチシーケンスを処理するためにほぼ同等な数学的表現を持つという事実に基づいている。提案したLITは、画像分類、オブジェクト検出、インスタンス分割を含む画像認識タスクにおいて有望な性能を達成する。
論文参考訳（メタデータ） (2021-05-29T05:26:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。