論文の概要: Prompt-Driven Building Footprint Extraction in Aerial Images with
Offset-Building Model
- arxiv url: http://arxiv.org/abs/2310.16717v3
- Date: Mon, 11 Mar 2024 15:54:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 15:39:11.140478
- Title: Prompt-Driven Building Footprint Extraction in Aerial Images with
Offset-Building Model
- Title(参考訳): オフセット構築モデルを用いた空中画像からのプロンプト駆動型建築用フットプリント抽出
- Authors: Kai Li, Yupeng Deng, Yunlong Kong, Diyou Liu, Jingbo Chen, Yu Meng,
Junxian Ma
- Abstract要約: 屋上・オフセット抽出のための高速化可能なフレームワークを提案する。
本フレームワークでは,新しいオフセット構築モデル(OBM)を提案する。
我々のモデルはオフセット誤差を16.6%削減し、他のモデルに比べて10.8%改善した。
- 参考スコア(独自算出の注目度): 11.1278832358904
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: More accurate extraction of invisible building footprints from
very-high-resolution (VHR) aerial images relies on roof segmentation and
roof-to-footprint offset extraction. Existing state-of-the-art methods based on
instance segmentation suffer from poor generalization when extended to
large-scale data production and fail to achieve low-cost human interactive
annotation. The latest prompt paradigms inspire us to design a promptable
framework for roof and offset extraction, which transforms end-to-end
algorithms into promptable methods. Within this framework, we propose a novel
Offset-Building Model (OBM). To rigorously evaluate the algorithm's
capabilities, we introduce a prompt-based evaluation method, where our model
reduces offset errors by 16.6% and improves roof Intersection over Union (IoU)
by 10.8% compared to other models. Leveraging the common patterns in predicting
offsets, we propose Distance-NMS (DNMS) algorithms, enabling the model to
further reduce offset vector loss by 6.5%. To further validate the
generalization of models, we tested them using a new dataset with over 7,000
manually annotated instance samples. Our algorithms and dataset are available
at https://anonymous.4open.science/r/OBM-B3EC.
- Abstract(参考訳): 超高解像度(VHR)空中画像からの見えない建物のフットプリントのより正確な抽出は、屋根のセグメンテーションと屋根からフットプリントまでのオフセット抽出に依存している。
インスタンスセグメンテーションに基づく既存の最先端のメソッドは、大規模データプロダクションに拡張された場合の一般化が貧弱で、低コストなヒューマンインタラクティブアノテーションが実現できない。
最新のプロンプトパラダイムは、屋根とオフセット抽出のためのプロンプト可能なフレームワークを設計するきっかけとなり、エンドツーエンドのアルゴリズムをプロンプト可能なメソッドに変換する。
本稿では,新しいOffset-Building Model (OBM)を提案する。
アルゴリズムの性能を厳格に評価するために,本モデルでは,オフセット誤差を16.6%削減し,屋根間交差(IoU)を10.8%改善するプロンプトベース評価手法を提案する。
オフセット予測における共通パターンを活用することで,距離NMS(Distance-NMS)アルゴリズムを提案し,オフセットベクトル損失を6.5%削減する。
モデルの一般化をさらに検証するため、7000以上のアノテーション付きインスタンスサンプルを新たにデータセットとしてテストした。
私たちのアルゴリズムとデータセットはhttps://anonymous.4open.science/r/obm-b3ecで利用可能です。
関連論文リスト
- Effort: Efficient Orthogonal Modeling for Generalizable AI-Generated Image Detection [66.16595174895802]
既存のAI生成画像(AIGI)検出手法は、しばしば限定的な一般化性能に悩まされる。
本稿では、AIGI検出において、これまで見過ごされてきた重要な非対称性現象を同定する。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - REFINE on Scarce Data: Retrieval Enhancement through Fine-Tuning via Model Fusion of Embedding Models [14.023953508288628]
検索拡張生成(RAG)パイプラインは、質問応答(QA)などのタスクで一般的に使用される。
本稿では,利用可能な文書から合成データを生成する新しい手法であるREFINEを提案する。
論文 参考訳(メタデータ) (2024-10-16T08:43:39Z) - Rethinking Iterative Stereo Matching from Diffusion Bridge Model Perspective [0.0]
本稿では,拡散モデルを反復最適化プロセスに組み込む新しいトレーニング手法を提案する。
我々のモデルはScene Flowデータセットで第1位であり、競合する手法と比較して7%以上の改善が達成されている。
論文 参考訳(メタデータ) (2024-04-13T17:31:11Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - LoLep: Single-View View Synthesis with Locally-Learned Planes and
Self-Attention Occlusion Inference [66.45326873274908]
本稿では,1枚のRGB画像から局所学習平面を回帰してシーンを正確に表現するLoLepを提案する。
MINEと比較して、LPIPSは4.8%-9.0%、RVは73.9%-83.5%である。
論文 参考訳(メタデータ) (2023-07-23T03:38:55Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - Post-Processing Temporal Action Detection [134.26292288193298]
時間的行動検出(TAD)法は、通常、入力された可変長のビデオを固定長のスニペット表現シーケンスに変換する際に、前処理のステップを踏む。
この前処理ステップは、ビデオを時間的にダウンサンプリングし、推論の解像度を低減し、元の時間分解における検出性能を阻害する。
モデルの再設計や再学習を伴わない新しいモデル非依存のポストプロセッシング手法を提案する。
論文 参考訳(メタデータ) (2022-11-27T19:50:37Z) - Denoising diffusion models for out-of-distribution detection [2.113925122479677]
我々は,確率拡散モデル(DDPM)を自己エンコーダの復号化として活用する。
DDPMを用いてノイズレベルの範囲の入力を再構成し,結果の多次元再構成誤差を用いてアウト・オブ・ディストリビューション入力を分類する。
論文 参考訳(メタデータ) (2022-11-14T20:35:11Z) - Interpretations Steered Network Pruning via Amortized Inferred Saliency
Maps [85.49020931411825]
限られたリソースを持つエッジデバイスにこれらのモデルをデプロイするには、畳み込みニューラルネットワーク(CNN)圧縮が不可欠である。
本稿では,新しい視点からチャネルプルーニング問題に対処するために,モデルの解釈を活用して,プルーニング過程を解析する手法を提案する。
本研究では,実時間スムーズなスムーズなスムーズなスムーズなマスク予測を行うセレクタモデルを導入することで,この問題に対処する。
論文 参考訳(メタデータ) (2022-09-07T01:12:11Z) - Bayes DistNet -- A Robust Neural Network for Algorithm Runtime
Distribution Predictions [1.8275108630751844]
ランダム化アルゴリズムは制約満足度問題 (CSP) やブール満足度問題 (SAT) の多くの最先端の解法で用いられている。
従来の最先端の手法は、入力インスタンスが従う固定パラメトリック分布を直接予測しようとする。
この新モデルは,低観測環境下での堅牢な予測性能と,検閲された観測処理を実現する。
論文 参考訳(メタデータ) (2020-12-14T01:15:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。