論文の概要: Hybrid Feature Embedding For Automatic Building Outline Extraction
- arxiv url: http://arxiv.org/abs/2307.10609v1
- Date: Thu, 20 Jul 2023 06:07:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 14:27:47.420561
- Title: Hybrid Feature Embedding For Automatic Building Outline Extraction
- Title(参考訳): ビルアウトライン自動抽出のためのハイブリッド特徴埋め込み
- Authors: Weihang Ran, Wei Yuan, Xiaodan Shi, Zipei Fan, Ryosuke Shibasaki
- Abstract要約: 高解像度空中画像から抽出した建物概要は, 変化検出や災害評価など, 様々な応用分野に利用することができる。
従来のCNNモデルは、元の画像から非常に正確に輪郭を認識できない。
本稿では,CNNとTransformerをベースとしたモデルとアクティブな輪郭モデルを提案し,この問題に対処する。
- 参考スコア(独自算出の注目度): 9.902549957257875
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Building outline extracted from high-resolution aerial images can be used in
various application fields such as change detection and disaster assessment.
However, traditional CNN model cannot recognize contours very precisely from
original images. In this paper, we proposed a CNN and Transformer based model
together with active contour model to deal with this problem. We also designed
a triple-branch decoder structure to handle different features generated by
encoder. Experiment results show that our model outperforms other baseline
model on two datasets, achieving 91.1% mIoU on Vaihingen and 83.8% on Bing
huts.
- Abstract(参考訳): 高解像度空中画像から抽出した建物概要は, 変化検出や災害評価など, 様々な応用分野に利用することができる。
しかし、従来のcnnモデルはオリジナル画像から非常に正確に輪郭を認識できない。
本稿では,CNNとTransformerをベースとしたモデルとアクティブな輪郭モデルを提案し,この問題に対処する。
また,エンコーダが生成する異なる特徴を処理するために,トリプルブランチデコーダ構造も設計した。
実験の結果、我々のモデルは2つのデータセットで他のベースラインモデルよりも優れており、ベイヒンゲンでは91.1% mIoU、ビング小屋では83.8%であることがわかった。
関連論文リスト
- GeoLRM: Geometry-Aware Large Reconstruction Model for High-Quality 3D Gaussian Generation [65.33726478659304]
GeoLRM(Geometry-Aware Large Restruction Model)は、512kガウスと21の入力画像で11GBのGPUメモリで高品質な資産を予測できる手法である。
従来の作品では、3D構造の本質的な空間性は無視されており、3D画像と2D画像の間の明示的な幾何学的関係は利用されていない。
GeoLRMは、3Dポイントを直接処理し、変形可能なクロスアテンション機構を使用する新しい3D対応トランスフォーマー構造を導入することで、これらの問題に対処する。
論文 参考訳(メタデータ) (2024-06-21T17:49:31Z) - Rock Classification Based on Residual Networks [4.256045122451066]
岩盤分類の問題に対処するために,残差ニューラルネットワークを用いた2つのアプローチを提案する。
ResNet34に基づくカーネルサイズや正規化メソッド,コンポジションを変更することで,テストデータセット上での精度を70.1%向上する。
マルチヘッド・セルフ・アテンションを組み込んだBoTNetのようなバックボーンを使って、モデルの内部残余接続も利用しています。
これにより、モデルのパフォーマンスが向上し、テストデータセットで73.7%の精度が達成される。
論文 参考訳(メタデータ) (2024-02-19T04:45:15Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Learning to Generate 3D Representations of Building Roofs Using
Single-View Aerial Imagery [68.3565370706598]
本研究では,空撮画像から建物屋根メッシュの条件分布を学習するための新しいパイプラインを提案する。
同一物体の複数の画像を必要とする代替手法とは違って,本手法では,一つの画像のみを用いて予測を行う3次元屋根メッシュを推定できる。
論文 参考訳(メタデータ) (2023-03-20T15:47:05Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Pixel2Mesh++: 3D Mesh Generation and Refinement from Multi-View Images [82.32776379815712]
カメラポーズの有無にかかわらず、少数のカラー画像から3次元メッシュ表現における形状生成の問題について検討する。
我々は,グラフ畳み込みネットワークを用いたクロスビュー情報を活用することにより,形状品質をさらに向上する。
我々のモデルは初期メッシュの品質とカメラポーズの誤差に頑健であり、テスト時間最適化のための微分関数と組み合わせることができる。
論文 参考訳(メタデータ) (2022-04-21T03:42:31Z) - Efficient Quantum Feature Extraction for CNN-based Learning [5.236201168829204]
本稿では,古典的CNNモデルの識別可能性を高めるために,量子古典的なディープネットワーク構造を提案する。
我々は、より強力な関数近似器であるPQCを構築し、受容場内の特徴を捉えるためにより複雑な構造を持つ。
その結果, アンザッツの表現性が高いモデルでは, 低コストで精度が高いことが判明した。
論文 参考訳(メタデータ) (2022-01-04T17:04:07Z) - Forward-Looking Sonar Patch Matching: Modern CNNs, Ensembling, and
Uncertainty [0.0]
畳み込みニューラルネットワーク(CNN)は類似性関数を学習し、2つの入力ソナー画像が似ているかどうかを予測する。
最高の性能モデルは、0.955 AUCのDenseNet Two-Channelネットワーク、0.949 AUCのVGG-Siamese、0.921 AUCのDenseNet Siameseである。
論文 参考訳(メタデータ) (2021-08-02T17:49:56Z) - Generating Diverse Structure for Image Inpainting With Hierarchical
VQ-VAE [74.29384873537587]
本稿では,異なる構造を持つ複数の粗い結果を第1段階で生成し,第2段階ではテクスチャを増補して各粗い結果を別々に洗練する,多彩な塗布用2段階モデルを提案する。
CelebA-HQ, Places2, ImageNetデータセットによる実験結果から,本手法は塗布ソリューションの多様性を向上するだけでなく,生成した複数の画像の視覚的品質も向上することが示された。
論文 参考訳(メタデータ) (2021-03-18T05:10:49Z) - Road Segmentation for Remote Sensing Images using Adversarial Spatial
Pyramid Networks [28.32775611169636]
合成画像生成と道路分割に構造化領域適応を適用した新しいモデルを提案する。
マルチレベルの特徴マップから学び、特徴のセマンティクスを改善するために、新しいスケールワイズアーキテクチャが導入された。
我々のモデルは、14.89Mパラメータと86.78B FLOPを持つマサチューセッツのデータセット上で、最先端の78.86 IOUを達成し、4倍少ないFLOPを持つが、より高精度(+3.47% IOU)である。
論文 参考訳(メタデータ) (2020-08-10T11:00:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。