論文の概要: End-to-End Trainable Deep Active Contour Models for Automated Image
Segmentation: Delineating Buildings in Aerial Imagery
- arxiv url: http://arxiv.org/abs/2007.11691v1
- Date: Wed, 22 Jul 2020 21:27:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-07 23:05:15.626724
- Title: End-to-End Trainable Deep Active Contour Models for Automated Image
Segmentation: Delineating Buildings in Aerial Imagery
- Title(参考訳): 自動画像分割のための終端から終端訓練可能な深部活動輪郭モデル:空中画像における建物配置
- Authors: Ali Hatamizadeh, Debleena Sengupta, Demetri Terzopoulos
- Abstract要約: Trainable Deep Active Contours (TDAC)は、CNN(Convolutional Networks)とACM(Active Contour Models)を結合した自動イメージセグメンテーションフレームワークである。
TDACは、画像中の多くの建物を高速で、正確で、完全に自動で同時に配置する。
- 参考スコア(独自算出の注目度): 12.442780294349049
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The automated segmentation of buildings in remote sensing imagery is a
challenging task that requires the accurate delineation of multiple building
instances over typically large image areas. Manual methods are often laborious
and current deep-learning-based approaches fail to delineate all building
instances and do so with adequate accuracy. As a solution, we present Trainable
Deep Active Contours (TDACs), an automatic image segmentation framework that
intimately unites Convolutional Neural Networks (CNNs) and Active Contour
Models (ACMs). The Eulerian energy functional of the ACM component includes
per-pixel parameter maps that are predicted by the backbone CNN, which also
initializes the ACM. Importantly, both the ACM and CNN components are fully
implemented in TensorFlow and the entire TDAC architecture is end-to-end
automatically differentiable and backpropagation trainable without user
intervention. TDAC yields fast, accurate, and fully automatic simultaneous
delineation of arbitrarily many buildings in the image. We validate the model
on two publicly available aerial image datasets for building segmentation, and
our results demonstrate that TDAC establishes a new state-of-the-art
performance.
- Abstract(参考訳): リモートセンシング画像における建物の自動セグメンテーションは、通常、大きな画像領域にまたがる複数のビルディングインスタンスの正確なデライン化を必要とする課題である。
手動メソッドは、しばしば手間がかかり、現在のディープラーニングベースのアプローチでは、すべてのビルディングインスタンスのリライン化に失敗し、適切な精度で実行できない。
そこで本研究では,CNN(Convolutional Neural Networks)とACM(Active Contour Models)を密接に結合する自動画像分割フレームワークであるTDAC(Traiable Deep Active Contours)を提案する。
ACMコンポーネントのユーレアンエネルギー関数は、バックボーンCNNによって予測されるピクセル単位のパラメータマップを含み、ACMを初期化する。
重要なのは、ACMとCNNの両方のコンポーネントがTensorFlowで完全に実装されており、TDACアーキテクチャ全体がエンド・ツー・エンドで自動的に微分可能で、ユーザの介入なしにトレーニング可能なバックプロパゲーションである。
TDACは、画像中の多くの建物を高速で、正確で、完全に自動で同時に配置する。
本研究は,TDACが新たに最先端の性能を確立したことを示すものである。
関連論文リスト
- RSBuilding: Towards General Remote Sensing Image Building Extraction and Change Detection with Foundation Model [22.56227565913003]
本稿では、基礎モデルの観点から、RSBuildingと呼ばれる総合的なリモートセンシング画像構築モデルを提案する。
RSBuildingはクロスシーンの一般化とタスク理解を強化するように設計されている。
我々のモデルは最大245,000の画像からなるデータセットでトレーニングされ、複数のビルの抽出と変更検出データセットで検証された。
論文 参考訳(メタデータ) (2024-03-12T11:51:59Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Improving Human-Object Interaction Detection via Virtual Image Learning [68.56682347374422]
人間-物体相互作用(Human-Object Interaction、HOI)は、人間と物体の相互作用を理解することを目的としている。
本稿では,仮想画像学習(Virtual Image Leaning, VIL)による不均衡分布の影響を軽減することを提案する。
ラベルからイメージへの新たなアプローチであるMultiple Steps Image Creation (MUSIC)が提案され、実際の画像と一貫した分布を持つ高品質なデータセットを作成する。
論文 参考訳(メタデータ) (2023-08-04T10:28:48Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - Efficient Semantic Segmentation on Edge Devices [7.5562201794440185]
本研究は,災害時の緊急応答にこれらのモデルを適用する可能性を検討するために,現在のセマンティックセマンティックセマンティクスモデルを解析する。
実時間セマンティックセグメンテーションモデルと非実時間セマンティックセグメンテーションモデルの性能を, 対向条件下での空中画像によって制約された非実時間セマンティックセグメンテーションモデルと比較する。
さらに,Hurricane Harveyの後に捉えたUAV画像を含むFlood-Netデータセット上で,複数のモデルをトレーニングし,浸水した建物と非流出した建物と浸水した道路と非流出した道路とをベンチマークした。
論文 参考訳(メタデータ) (2022-12-28T04:13:11Z) - CM-GAN: Image Inpainting with Cascaded Modulation GAN and Object-Aware
Training [112.96224800952724]
複雑な画像に大きな穴をあける際の可視像構造を生成するためのカスケード変調GAN(CM-GAN)を提案する。
各デコーダブロックにおいて、まず大域変調を適用し、粗い意味認識合成構造を行い、次に大域変調の出力に空間変調を適用し、空間適応的に特徴写像を更に調整する。
さらに,ネットワークがホール内の新たな物体を幻覚させるのを防ぐため,実世界のシナリオにおける物体除去タスクのニーズを満たすために,オブジェクト認識型トレーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-03-22T16:13:27Z) - DAFormer: Improving Network Architectures and Training Strategies for
Domain-Adaptive Semantic Segmentation [99.88539409432916]
教師なしドメイン適応(UDA)プロセスについて検討する。
ベンチマーク結果に基づいて,新しい UDA 手法である DAFormer を提案する。
DAFormerは,GTA->Cityscapesの10.8 mIoU,Synthia->Cityscapesの5.4 mIoUにより,最先端の性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-11-29T19:00:46Z) - Contextual Pyramid Attention Network for Building Segmentation in Aerial
Imagery [12.241693880896348]
航空画像からの抽出は、都市計画、変更検出、災害管理といった問題にいくつかの応用がある。
コンテキストピラミッドアテンション(CPA)を用いた長距離依存関係のキャプチャにより,異なるサイズのセグメンテーションを改善することを提案する。
提案手法は,現在の最先端手法よりも1.8点,既存のベースラインよりも12.6点高い1.8点を後処理なしで改善する。
論文 参考訳(メタデータ) (2020-04-15T11:36:26Z) - Concurrently Extrapolating and Interpolating Networks for Continuous
Model Generation [34.72650269503811]
本稿では,一組の特定効果ラベル画像のみを必要とするモデル列を形成するための,シンプルで効果的なモデル生成戦略を提案する。
提案手法は一連の連続モデルの生成が可能であり,画像平滑化のための最先端手法よりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-01-12T04:44:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。