論文の概要: PLGAN: Generative Adversarial Networks for Power-Line Segmentation in
Aerial Images
- arxiv url: http://arxiv.org/abs/2204.07243v1
- Date: Thu, 14 Apr 2022 21:43:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-18 11:21:50.564017
- Title: PLGAN: Generative Adversarial Networks for Power-Line Segmentation in
Aerial Images
- Title(参考訳): PLGAN: 航空画像における電力線分割のための生成逆ネットワーク
- Authors: Rabab Abdelfattah, Xiaofeng Wang, Song Wang
- Abstract要約: PLGANは、異なる背景を持つ空中画像から電力線を分割するシンプルで効果的な方法である。
生成した画像の適切な形状を高品質な特徴埋め込みに活用する。
提案するPLGANは, セマンティックセグメンテーションや線検出において, 従来の最先端手法よりも優れていた。
- 参考スコア(独自算出の注目度): 15.504887854179666
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate segmentation of power lines in various aerial images is very
important for UAV flight safety. The complex background and very thin
structures of power lines, however, make it an inherently difficult task in
computer vision. This paper presents PLGAN, a simple yet effective method based
on generative adversarial networks, to segment power lines from aerial images
with different backgrounds. Instead of directly using the adversarial networks
to generate the segmentation, we take their certain decoding features and embed
them into another semantic segmentation network by considering more context,
geometry, and appearance information of power lines. We further exploit the
appropriate form of the generated images for high-quality feature embedding and
define a new loss function in the Hough-transform parameter space to enhance
the segmentation of very thin power lines. Extensive experiments and
comprehensive analysis demonstrate that our proposed PLGAN outperforms the
prior state-of-the-art methods for semantic segmentation and line detection.
- Abstract(参考訳): 様々な空中画像における電力線の正確なセグメンテーションは、UAVの飛行安全にとって非常に重要である。
しかし、複雑な背景と非常に薄い電力線構造は、コンピュータビジョンにおいて本質的に困難である。
本稿では,異なる背景を持つ空中画像から電力線を分割する,生成的敵ネットワークに基づく簡易かつ効果的なPLGANを提案する。
敵ネットワークを直接使用してセグメンテーションを生成する代わりに、特定のデコード機能を用いて、パワーラインのコンテキスト、幾何学、外観情報を考慮し、別のセグメンテーションネットワークに組み込む。
さらに,高品質な特徴埋め込みのために生成された画像の適切な形式を活用し,ハフ変換パラメータ空間における新たな損失関数を定義し,非常に薄い電力線のセグメンテーションを強化する。
包括的実験と包括的解析により,提案したPLGANは,セマンティックセグメンテーションや線検出の最先端手法よりも優れていることが示された。
関連論文リスト
- Shape-Sensitive Loss for Catheter and Guidewire Segmentation [5.115480059688438]
カテーテルとガイドワイヤセグメンテーションのための形状感受性損失関数を導入する。
我々は、大規模なX線画像データセット上に新しい最先端結果を確立するために、ビジョントランスフォーマーネットワークでこれを利用する。
論文 参考訳(メタデータ) (2023-11-19T03:05:21Z) - Dual-Augmented Transformer Network for Weakly Supervised Semantic
Segmentation [4.02487511510606]
弱教師付きセマンティックセグメンテーション(WSSS)は、クラスレベルのラベルのみにオブジェクトを分割することを目的とした、基本的なコンピュータビジョンタスクである。
従来の手法では、CNNベースのネットワークを採用し、クラスアクティベーションマップ(CAM)戦略を用いて対象領域を発見する。
別の方法は、視覚変換器(ViT)を探索して画像を符号化し、グローバルな意味情報を取得することである。
相互補完学習のためのCNNベースネットワークとトランスフォーマーネットワークを併用したデュアルネットワークを提案する。
論文 参考訳(メタデータ) (2023-09-30T08:41:11Z) - Autonomous Point Cloud Segmentation for Power Lines Inspection in Smart
Grid [56.838297900091426]
高電圧と低電圧の両方の電力線の特徴を検出し,抽出し,解析するために,教師なし機械学習(ML)フレームワークを提案する。
提案フレームワークは電力線を効率よく検出し,PLCに基づくハザード解析を行う。
論文 参考訳(メタデータ) (2023-08-14T17:14:58Z) - DUFormer: Solving Power Line Detection Task in Aerial Images using
Semantic Segmentation [17.77548837421917]
無人航空機(UAV)は、電力線を検査したり高解像度の空中画像を撮影するために頻繁に使用される。
この問題に対処するために,航空画像中の電力線を明示的に検出するセマンティックセグメンテーションアルゴリズムであるDUFormerを導入する。
提案手法は,TTPLAデータセット上での電力線セグメンテーションにおけるすべての最先端手法より優れている。
論文 参考訳(メタデータ) (2023-04-12T12:59:02Z) - Human Vision Based 3D Point Cloud Semantic Segmentation of Large-Scale
Outdoor Scene [0.5735035463793007]
EyeNetは、ポイントクラウドのための新しいセマンティックセマンティックセマンティクスネットワークである。
人間の周辺視にインスパイアされたEyeNetは、シンプルだが効率的なマルチパターン入力を導入することで、従来のネットワークの限界を克服する。
提案手法は,我々のアブレーション研究や大規模屋外データセットの最先端性能など,高密度点雲の課題に効果的に対処する。
論文 参考訳(メタデータ) (2023-01-30T15:20:13Z) - DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients [105.25109274550607]
ラインセグメントは、視覚タスクでますます使われています。
画像勾配に基づく従来の線検出器は非常に高速で精度が高いが、ノイズの多い画像や困難な条件では頑丈さに欠ける。
我々は、両方の世界を最大限に活用するために、伝統的なアプローチと学習されたアプローチを組み合わせることを提案する。
論文 参考訳(メタデータ) (2022-12-15T12:36:49Z) - Structural Prior Guided Generative Adversarial Transformers for
Low-Light Image Enhancement [51.22694467126883]
低照度画像強調を実現するために,SPGAT (Structure Prior Guided Generative Adversarial Transformer) を提案する。
このジェネレータはU字型のトランスフォーマーをベースとしており、非局所的な情報を探り、画像の鮮明な復元に役立てている。
より現実的な画像を生成するために,生成器と識別器のスキップ接続を構築することによって,新しい構造的事前学習手法を開発した。
論文 参考訳(メタデータ) (2022-07-16T04:05:40Z) - Weakly-supervised segmentation of referring expressions [81.73850439141374]
テキスト基底セマンティックSEGmentationは、ピクセルレベルのアノテーションなしで画像レベルの参照式から直接セグメンテーションマスクを学習する。
提案手法は,PhraseCutおよびRefCOCOデータセット上での表現セグメンテーションを弱教師付きで参照する際の有望な結果を示す。
論文 参考訳(メタデータ) (2022-05-10T07:52:24Z) - Weakly-supervised fire segmentation by visualizing intermediate CNN
layers [82.75113406937194]
画像やビデオにおける火の局所化は、火災事故に対処するための自律システムにとって重要なステップである。
我々は,ネットワークのトレーニングに画像ラベルのみを使用する,画像中の火の弱い制御セグメント化について検討する。
CNNの中間層における特徴量の平均値は,2値セグメンテーション問題である火災セグメンテーションの場合,従来のクラスアクティベーションマッピング(CAM)法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-16T11:56:28Z) - Less is More: Pay Less Attention in Vision Transformers [61.05787583247392]
注意の少ないvIsion Transformerは、畳み込み、完全接続層、自己アテンションが、画像パッチシーケンスを処理するためにほぼ同等な数学的表現を持つという事実に基づいている。
提案したLITは、画像分類、オブジェクト検出、インスタンス分割を含む画像認識タスクにおいて有望な性能を達成する。
論文 参考訳(メタデータ) (2021-05-29T05:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。