論文の概要: Prompt-Driven Building Footprint Extraction in Aerial Images with
Offset-Building Model
- arxiv url: http://arxiv.org/abs/2310.16717v3
- Date: Mon, 11 Mar 2024 15:54:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 15:39:11.140478
- Title: Prompt-Driven Building Footprint Extraction in Aerial Images with
Offset-Building Model
- Title(参考訳): オフセット構築モデルを用いた空中画像からのプロンプト駆動型建築用フットプリント抽出
- Authors: Kai Li, Yupeng Deng, Yunlong Kong, Diyou Liu, Jingbo Chen, Yu Meng,
Junxian Ma
- Abstract要約: 屋上・オフセット抽出のための高速化可能なフレームワークを提案する。
本フレームワークでは,新しいオフセット構築モデル(OBM)を提案する。
我々のモデルはオフセット誤差を16.6%削減し、他のモデルに比べて10.8%改善した。
- 参考スコア(独自算出の注目度): 11.1278832358904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: More accurate extraction of invisible building footprints from
very-high-resolution (VHR) aerial images relies on roof segmentation and
roof-to-footprint offset extraction. Existing state-of-the-art methods based on
instance segmentation suffer from poor generalization when extended to
large-scale data production and fail to achieve low-cost human interactive
annotation. The latest prompt paradigms inspire us to design a promptable
framework for roof and offset extraction, which transforms end-to-end
algorithms into promptable methods. Within this framework, we propose a novel
Offset-Building Model (OBM). To rigorously evaluate the algorithm's
capabilities, we introduce a prompt-based evaluation method, where our model
reduces offset errors by 16.6% and improves roof Intersection over Union (IoU)
by 10.8% compared to other models. Leveraging the common patterns in predicting
offsets, we propose Distance-NMS (DNMS) algorithms, enabling the model to
further reduce offset vector loss by 6.5%. To further validate the
generalization of models, we tested them using a new dataset with over 7,000
manually annotated instance samples. Our algorithms and dataset are available
at https://anonymous.4open.science/r/OBM-B3EC.
- Abstract(参考訳): 超高解像度(VHR)空中画像からの見えない建物のフットプリントのより正確な抽出は、屋根のセグメンテーションと屋根からフットプリントまでのオフセット抽出に依存している。
インスタンスセグメンテーションに基づく既存の最先端のメソッドは、大規模データプロダクションに拡張された場合の一般化が貧弱で、低コストなヒューマンインタラクティブアノテーションが実現できない。
最新のプロンプトパラダイムは、屋根とオフセット抽出のためのプロンプト可能なフレームワークを設計するきっかけとなり、エンドツーエンドのアルゴリズムをプロンプト可能なメソッドに変換する。
本稿では,新しいOffset-Building Model (OBM)を提案する。
アルゴリズムの性能を厳格に評価するために,本モデルでは,オフセット誤差を16.6%削減し,屋根間交差(IoU)を10.8%改善するプロンプトベース評価手法を提案する。
オフセット予測における共通パターンを活用することで,距離NMS(Distance-NMS)アルゴリズムを提案し,オフセットベクトル損失を6.5%削減する。
モデルの一般化をさらに検証するため、7000以上のアノテーション付きインスタンスサンプルを新たにデータセットとしてテストした。
私たちのアルゴリズムとデータセットはhttps://anonymous.4open.science/r/obm-b3ecで利用可能です。
関連論文リスト
- Connecting the Dots: Collaborative Fine-tuning for Black-Box
Vision-Language Models [129.8887432965761]
本稿では,下流タスクに対するブラックボックス視覚言語モデルの微調整のための textbfCraFT' アプローチを提案する。
CraFTは、2つのモジュールと、テキストプロンプトを学習するプロンプト生成モジュールと、残差スタイルの出力予測を強化する予測改善モジュールとから構成される。
15以上のデータセットに対する数ショットの分類実験は、CraFTの優位性を示している。
論文 参考訳(メタデータ) (2024-02-06T14:53:19Z) - Shrub of a thousand faces: an individual segmentation from satellite
images using deep learning [1.7736307382785161]
本研究では,Mask R-CNNを用いたインスタンス分割モデルと併用して,リモートセンシングされたRGB画像を活用する新しい手法を提案する。
本研究では,フォトインタプリタ(PI)とフィールドワーク(FW)データを用いて,モデルの開発と外部検証を行う新しいデータ構築設計を提案する。
最後に,ユニペロス個体の壁面マップを生成するために,開発したモデルを初めて展開する。
論文 参考訳(メタデータ) (2024-01-31T16:44:20Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Post-Processing Temporal Action Detection [134.26292288193298]
時間的行動検出(TAD)法は、通常、入力された可変長のビデオを固定長のスニペット表現シーケンスに変換する際に、前処理のステップを踏む。
この前処理ステップは、ビデオを時間的にダウンサンプリングし、推論の解像度を低減し、元の時間分解における検出性能を阻害する。
モデルの再設計や再学習を伴わない新しいモデル非依存のポストプロセッシング手法を提案する。
論文 参考訳(メタデータ) (2022-11-27T19:50:37Z) - Denoising diffusion models for out-of-distribution detection [2.113925122479677]
我々は,確率拡散モデル(DDPM)を自己エンコーダの復号化として活用する。
DDPMを用いてノイズレベルの範囲の入力を再構成し,結果の多次元再構成誤差を用いてアウト・オブ・ディストリビューション入力を分類する。
論文 参考訳(メタデータ) (2022-11-14T20:35:11Z) - Interpretations Steered Network Pruning via Amortized Inferred Saliency
Maps [85.49020931411825]
限られたリソースを持つエッジデバイスにこれらのモデルをデプロイするには、畳み込みニューラルネットワーク(CNN)圧縮が不可欠である。
本稿では,新しい視点からチャネルプルーニング問題に対処するために,モデルの解釈を活用して,プルーニング過程を解析する手法を提案する。
本研究では,実時間スムーズなスムーズなスムーズなスムーズなマスク予測を行うセレクタモデルを導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2022-09-07T01:12:11Z) - Self-Supervised Training with Autoencoders for Visual Anomaly Detection [55.52743265122446]
ディープオートエンコーダは視覚領域における異常検出のタスクに使われてきた。
我々は、訓練中に識別情報を使用することが可能な自己指導型学習体制を適用することで、この問題に対処する。
MVTec ADデータセットを用いた実験では,高い検出性能と局所化性能を示した。
論文 参考訳(メタデータ) (2022-06-23T14:16:30Z) - Adversarial Gradient Driven Exploration for Deep Click-Through Rate
Prediction [39.61776002290324]
textbfAdrial textbfGradientversa Driven textbfExploration (AGE) と呼ばれる新しい探索手法を提案する。
AGEは勾配更新プロセスをシミュレートし、モデルに対する探索項目のサンプルの影響を近似することができる。
本手法の有効性を,オープンアクセス学術データセットで実証した。
論文 参考訳(メタデータ) (2021-12-21T12:13:07Z) - Bayes DistNet -- A Robust Neural Network for Algorithm Runtime
Distribution Predictions [1.8275108630751844]
ランダム化アルゴリズムは制約満足度問題 (CSP) やブール満足度問題 (SAT) の多くの最先端の解法で用いられている。
従来の最先端の手法は、入力インスタンスが従う固定パラメトリック分布を直接予測しようとする。
この新モデルは,低観測環境下での堅牢な予測性能と,検閲された観測処理を実現する。
論文 参考訳(メタデータ) (2020-12-14T01:15:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。