論文の概要: Recov-Vision: Linking Street View Imagery and Vision-Language Models for Post-Disaster Recovery
- arxiv url: http://arxiv.org/abs/2509.20628v1
- Date: Thu, 25 Sep 2025 00:01:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-26 20:58:12.631662
- Title: Recov-Vision: Linking Street View Imagery and Vision-Language Models for Post-Disaster Recovery
- Title(参考訳): Recov-Vision: 災害後の復旧のためのストリートビュー画像と視覚言語モデルのリンク
- Authors: Yiming Xiao, Archit Gupta, Miguel Esparza, Yu-Hsuan Ho, Antonia Sebastian, Hannah Weas, Rose Houck, Ali Mostafavi,
- Abstract要約: 災害後のビルレベルの占有は、トリアージ、検査、ユーティリティーの再エネルギー化、資源配分等に不可欠である。
本稿では、パノラマ動画をパーセルにリンクし、ファサードにビューを修正し、解釈可能な属性を付与するフレームワークであるFacadeTrackを紹介する。
2段階のアプローチは、0.927の精度、0.781のリコール、F-1のスコアを0.848の精度で達成し、1段階のベースラインの0.943の精度、0.728のリコール、F-1のスコアを0.822の精度で達成する。
- 参考スコア(独自算出の注目度): 4.895685497002736
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Building-level occupancy after disasters is vital for triage, inspections, utility re-energization, and equitable resource allocation. Overhead imagery provides rapid coverage but often misses facade and access cues that determine habitability, while street-view imagery captures those details but is sparse and difficult to align with parcels. We present FacadeTrack, a street-level, language-guided framework that links panoramic video to parcels, rectifies views to facades, and elicits interpretable attributes (for example, entry blockage, temporary coverings, localized debris) that drive two decision strategies: a transparent one-stage rule and a two-stage design that separates perception from conservative reasoning. Evaluated across two post-Hurricane Helene surveys, the two-stage approach achieves a precision of 0.927, a recall of 0.781, and an F-1 score of 0.848, compared with the one-stage baseline at a precision of 0.943, a recall of 0.728, and an F-1 score of 0.822. Beyond accuracy, intermediate attributes and spatial diagnostics reveal where and why residual errors occur, enabling targeted quality control. The pipeline provides auditable, scalable occupancy assessments suitable for integration into geospatial and emergency-management workflows.
- Abstract(参考訳): 災害後のビルレベルの占有は、トリアージ、検査、ユーティリティーの再エネルギー化、資源配分等に不可欠である。
オーバーヘッド画像は急速なカバレッジを提供するが、ファサードやアクセス手段を見逃し、居住可能性を決定する一方、ストリートビュー画像はそれらの詳細を捉えているが、小包と整合しにくい。
FacadeTrackは、パノラマ動画をパーセルにリンクし、ビューをファサードに修正し、解釈可能な属性(例えば、エントリブロック、一時的なカバー、局所的なデブリ)を付与し、透過的な1段階ルールと、保守的な推論から認識を分離する2段階の設計である。
ハリケーン後の2つの調査で評価され、2段階のアプローチは0.927の精度、0.781のリコール、F-1のスコアを0.848の精度で達成し、1段階のベースラインの0.943の精度、0.728のリコール、F-1のスコアを0.822の精度で達成した。
精度を超えて、中間属性と空間診断は、残留エラーの発生場所と原因を明らかにし、ターゲット品質制御を可能にする。
このパイプラインは、地理空間と緊急管理ワークフローの統合に適した監査可能でスケーラブルな占有率評価を提供する。
関連論文リスト
- RoSe: Robust Self-supervised Stereo Matching under Adverse Weather Conditions [58.37558408672509]
本稿では,ロバストな自己監督型環境対応学習と悪天候蒸留という2つの重要なステップからなる,堅牢な自己監督型訓練パラダイムを提案する。
提案手法の有効性と汎用性を実証し,既存の最先端の自己管理手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-09-23T15:41:40Z) - RF-DETR for Robust Mitotic Figure Detection: A MIDOG 2025 Track 1 Approach [0.0]
本稿では,MIDOG 2025 チャレンジトラック 1 へのアプローチを,多様な組織学的文脈における堅牢な有糸分裂型人物検出に焦点をあてる。
RF-DETR (Roboflow Detection Transformer) を用いて,MIDOG++データセットをトレーニングした。
予備試験では,0.789点,0.839点,精度0.746点のF1値を得た。
論文 参考訳(メタデータ) (2025-08-29T16:04:50Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - Pix2Geomodel: A Next-Generation Reservoir Geomodeling with Property-to-Property Translation [2.004012818482403]
本研究では、Pix2Pixをベースとした新しい条件付き生成対向ネットワーク(cGAN)フレームワークであるPix2Geomodelを紹介する。
グローニンゲンガス田のロトリーゲンド貯水池から貯水池特性(空洞、ポーシティ、透水性、飽和度)を予測するように設計されている。
その結果, 病状 (PA 0.88, FWIoU 0.85) と水飽和 (PA 0.96, FWIoU 0.95) の精度が高く, 気孔率 (PA 0.70, FWIoU 0.55) と透過性 (PA 0.74, FWIoU 0.60) が適度に向上し, 翻訳性能も良好であった。
論文 参考訳(メタデータ) (2025-06-21T15:58:27Z) - Interpretable Multimodal Framework for Human-Centered Street Assessment: Integrating Visual-Language Models for Perceptual Urban Diagnostics [0.0]
本稿では,新しいマルチモーダルストリート評価フレームワーク(MSEF)を紹介する。
パラメータ効率適応のためにLoRAとP-Tuning v2を用いてフレームワークを微調整する。
このモデルは、客観的特徴に関するF1スコアの0.84と、集約された居住者の知覚との89.3%の一致を達成している。
論文 参考訳(メタデータ) (2025-06-05T14:34:04Z) - Hyperlocal disaster damage assessment using bi-temporal street-view imagery and pre-trained vision models [13.378498271374662]
本研究の目的は,双方向のストリートビュー画像と高度な事前学習型視覚モデルを用いて,局地的かつ地上的な災害被害を推定することである。
Swin Transformerベースラインで66.14%の精度が、デュアルチャネルのFeature-Fusion ConvNeXtモデルで77.11%に向上した。
論文 参考訳(メタデータ) (2025-04-12T03:52:31Z) - Enhancing Pavement Crack Classification with Bidirectional Cascaded Neural Networks [3.23451089389063]
本稿では,2方向カスケードニューラルネットワーク(BCNN)の実装と評価について述べる。
提案したBCNNモデルは,前向き情報流と後向き情報流の両方を活用するために設計され,そのカスケード構造により検出精度が向上した。
総合精度は87%で,精度,リコール,F1スコアは各カテゴリーで高い有効性を示した。
論文 参考訳(メタデータ) (2025-03-27T20:08:15Z) - Lie Detector: Unified Backdoor Detection via Cross-Examination Framework [68.45399098884364]
半正直な設定で一貫したバックドア検出フレームワークを提案する。
本手法は,SoTAベースラインよりも5.4%,1.6%,11.9%の精度で検出性能が向上する。
特に、マルチモーダルな大規模言語モデルにおいて、バックドアを効果的に検出するのは、これが初めてである。
論文 参考訳(メタデータ) (2025-03-21T06:12:06Z) - Adaptive Feature Selection for No-Reference Image Quality Assessment by Mitigating Semantic Noise Sensitivity [55.399230250413986]
上流タスクから有害なセマンティックノイズを除去するためのQFM-IQM(Quality-Aware Feature Matching IQA Metric)を提案する。
提案手法は,8つの標準IQAデータセット上での最先端NR-IQA法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2023-12-11T06:50:27Z) - Towards Image-based Automatic Meter Reading in Unconstrained Scenarios:
A Robust and Efficient Approach [60.63996472100845]
本稿では,制約のないシナリオに着目したAMR(Automatic Meter Reading)のエンドツーエンドアプローチを提案する。
我々の主な貢献は、コーナー検出とカウンタ分類と呼ばれる新しいステージをAMRパイプラインに挿入することである。
信頼度が低い読みを拒絶した場合,AMRシステムは印象的な認識率(すなわち99%)を達成することを示す。
論文 参考訳(メタデータ) (2020-09-21T21:21:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。