論文の概要: Geometric Coastline Localization using Vision-Language Models
- arxiv url: http://arxiv.org/abs/2606.10468v1
- Date: Tue, 09 Jun 2026 06:37:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.351813
- Title: Geometric Coastline Localization using Vision-Language Models
- Title(参考訳): 視覚言語モデルを用いた幾何学的海岸線位置推定
- Authors: Rafia Malik, Bernhard Pfahringer, Karin Bryan, Mark Dickson, Eibe Frank,
- Abstract要約: 我々はGeoChat-7B/LLaVA-1.5アーキテクチャ上に構築された視覚言語モデル(VLM)を開発した。
このモデルは、密度の高いセグメンテーションマスクではなく、海岸線をポリリンとして直接予測する。
その結果,ジオメトリに基づく測度は,画素オーバーラップの測度よりも海岸線の測位精度を評価するのに適していることが示唆された。
- 参考スコア(独自算出の注目度): 4.985181911781127
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coastline detection in remote sensing imagery is commonly formulated as a pixel-wise segmentation problem, where the final coastline is extracted from a predicted mask through post-processing. This formulation relegates coastline geometry, the primary representation used in coastal change analysis, to a secondary artifact rather than the learning objective. In practice, coastlines are defined by geomorphic proxies such as vegetation lines, dune toes, or cliff edges, rather than an instantaneous land-water boundary often used in pixel-based segmentation approaches. In this work, we revisit coastline extraction from a representation perspective and formulate the task as geometric boundary localization. We use the New Zealand Coastal Change Dataset (NZCCD) and high-resolution aerial imagery from Land Information New Zealand (LINZ) to develop CoastlineVLM-7B, a vision-language model (VLM) built on the GeoChat-7B/LLaVA-1.5 architecture that jointly performs coastline presence detection, proxy-type classification, and coastline grounding. The model directly predicts a coastline as a polyline rather than a dense segmentation mask. We evaluate CoastlineVLM-7B against segmentation baselines under strict one-pixel boundary supervision. Results show that geometry-based metrics are more suitable for assessing coastline localization quality than pixel-overlap metrics such as Intersection over Union (IoU). CoastlineVLM-7B improves global geometric alignment with reference coastlines, reducing Hausdorff distance from 37.74 m to 31.84 m and Earth Mover's Distance from 21.12 m to 17.32 m. These results indicate that output representation is a critical design choice in coastline extraction, and that geometry-oriented learning, combined with the semantic reasoning capabilities of vision-language models, aligns well with how coastlines are defined and evaluated in operational coastal monitoring.
- Abstract(参考訳): リモートセンシング画像における海岸線検出は、一般的に、予測マスクから最終海岸線を後処理により抽出する画素ワイドセグメンテーション問題として定式化される。
この定式化は、海岸変動解析で使われる主要な表現である海岸線の幾何学を学習目的ではなく二次的な人工物に還元する。
実際には、海岸線は、しばしばピクセルベースのセグメンテーションアプローチで使用される瞬間的な陸水境界よりも、植生線、砂丘のつま先、崖の縁などの地形的プロキシによって定義される。
本研究では,海岸線を表現的視点から抽出し,その課題を幾何学的境界位置化として定式化する。
ニュージーランドの沿岸変動データセット(NZCCD)とランドインフォメーション・ニュージーランド(LINZ)の高解像度空中画像を用いて,GeoChat-7B/LLaVA-1.5アーキテクチャ上に構築された視覚言語モデル(VLM)であるCostlineVLM-7Bを開発した。
このモデルは、密度の高いセグメンテーションマスクではなく、海岸線をポリリンとして直接予測する。
厳密な1画素境界監督の下で, セグメンテーションベースラインに対するコーストラインVLM-7Bの評価を行った。
その結果,IoU (Intersection over Union) などの画素オーバーラップ測度よりも,海岸線の局部化品質を評価するのに幾何に基づく測度の方が適していることが示唆された。
コーストラインVLM-7Bは、基準海岸線とグローバルな幾何学的アライメントを改善し、ハウスドルフ距離を37.74mから31.84mに減らし、アースモーバー距離を21.12mから17.32mに減らした。
これらの結果は, 海岸線抽出において, 出力表現が重要な設計選択であり, 幾何指向学習と視覚言語モデルの意味論的推論能力が組み合わさって, 海岸線がどう定義され, 沿岸モニタリングで評価されるかとよく一致していることを示している。
関連論文リスト
- Real-Scale Island Area and Coastline Estimation using Only its Place Name or Coordinates [16.428253509804627]
本稿では,純粋単眼視に基づく幾何学的一貫した実スケール島計測フレームワークを提案する。
本研究は,全自動処理によるマッピングコストを大幅に削減し,GISデータを使わずに高効率な計測を実現する。
実験の結果, システムの最終測定誤差は約10%であり, 精度とロバスト性に優れていた。
論文 参考訳(メタデータ) (2026-05-11T21:45:09Z) - Unifying UAV Cross-View Geo-Localization via 3D Geometric Perception [51.687842983240564]
無人航空機(UAV)のクロスビューな地上局地化は、斜めのUAV画像と衛星地図との厳密な幾何学的相違により、いまだに困難である。
本稿では,3次元シーン形状を明示的にモデル化し,粗い位置認識ときめ細かなポーズ推定を統一する,幾何認識型UAV測位フレームワークを提案する。
提案手法は, 最先端のベースラインを著しく上回り, ロバストメータレベルのローカライゼーション精度を実現し, 複雑な都市環境における一般化を向上する。
論文 参考訳(メタデータ) (2026-04-02T08:08:41Z) - Geodiffussr: Generative Terrain Texturing with Elevation Fidelity [48.82552523546255]
テキスト誘導テクスチャマップを合成するフローマッチングパイプラインであるGeodiffussrを紹介する。
マルチスケールコンテンツアグリゲーション(MCA): DEM機能は、複数の解像度でUNetブロックに注入され、グローバルからローカライズされた高度の一貫性が強制される。
Geodiffussrを訓練し,評価するために,SRTM由来のDEMとSentinel-2画像と視覚接地型自然出現キャプションを組み合わせた三重項のグローバル分布,バイオメ-および気候成層コーパスを組み立てた。
論文 参考訳(メタデータ) (2025-11-28T09:52:44Z) - Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。
地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。
実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文 参考訳(メタデータ) (2025-09-11T18:52:16Z) - A Methodology to extract Geo-Referenced Standard Routes from AIS Data [0.0]
本研究では,海洋における関心点間の経路を解析し,地理的に基準となる経路を抽出する手法を提案する。
このアプローチは、北極地域とヨーロッパ、中東、北アフリカ地域をカバーする6年間のAISデータセットのデータに基づいてテストされている。
論文 参考訳(メタデータ) (2025-03-26T13:29:41Z) - Enhancing coastal water body segmentation with Landsat Irish Coastal Segmentation (LICS) dataset [2.3592914313389253]
本稿では,沿岸水域セグメンテーションのための深層学習手法の開発を支援するLandsat Irish Coastal (LICS)データセットを提案する。
データセットはセグメンテーションのための様々な自動化アプローチを評価するために使用され、U-NETは95.0%の精度を達成した。
この研究は、より正確なトレーニングデータと代替の浸食測定を考慮し、ディープラーニングアプローチをさらに改善できることを示唆している。
論文 参考訳(メタデータ) (2024-09-05T10:49:26Z) - Boosting Cross-Domain Point Classification via Distilling Relational Priors from 2D Transformers [59.0181939916084]
従来の3Dネットワークは主に局所幾何学的詳細に焦点を当て、局所幾何学間の位相構造を無視する。
そこで本稿では,大規模画像上においてよく訓練されたトランスフォーマーから前駆体を抽出する,新しい先駆体蒸留法を提案する。
PointDA-10とSim-to-Realデータセットの実験は、提案手法が点クラウド分類におけるUDAの最先端性能を一貫して達成していることを検証する。
論文 参考訳(メタデータ) (2024-07-26T06:29:09Z) - HED-UNet: Combined Segmentation and Edge Detection for Monitoring the
Antarctic Coastline [14.235722825330493]
深層学習モデルにおける海岸線検出のための2つのアプローチを結合する新しいモデルを考案した。
複数の解像度でサイド予測を深く監視し、トレーニングを効率化します。
このアプローチの実装はurlhttps://github.com/kr/HED-UNetで公開されている。
論文 参考訳(メタデータ) (2021-03-02T16:35:05Z) - GeoNet++: Iterative Geometric Neural Network with Edge-Aware Refinement
for Joint Depth and Surface Normal Estimation [204.13451624763735]
本研究では,エッジアウェア・リファインメント(GeoNet++)を用いた幾何ニューラルネットワークを提案し,単一の画像から深さと表面正規写像の両方を共同で予測する。
geonet++は、強い3d一貫性と鋭い境界を持つ深さと表面の正常を効果的に予測する。
画素単位の誤差/精度を評価することに焦点を当てた現在の測定値とは対照的に、3DGMは予測深度が高品質な3D表面の正常を再構築できるかどうかを測定する。
論文 参考訳(メタデータ) (2020-12-13T06:48:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。