論文の概要: WeatherReasonSeg: A Benchmark for Weather-Aware Reasoning Segmentation in Visual Language Models
- arxiv url: http://arxiv.org/abs/2603.17680v1
- Date: Wed, 18 Mar 2026 12:57:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.704664
- Title: WeatherReasonSeg: A Benchmark for Weather-Aware Reasoning Segmentation in Visual Language Models
- Title(参考訳): WeatherReasonSeg:ビジュアル言語モデルにおける天気認識推論セグメンテーションのベンチマーク
- Authors: Wanjun Du, Zifeng Yuan, Tingting Chen, Fucai Ke, Beibei Lin, Shunli Zhang,
- Abstract要約: 本稿では,悪天候条件下での推論に基づくセグメンテーションにおけるVLM性能評価のためのベンチマークであるWeatherReasonSegを紹介する。
まず,既存のセグメンテーションデータセットに重度レベルの異なる合成気象を適用して,制御可能な推論データセットを構築する。
第二に、実世界の複雑さを捉えるために、意味的に一貫したクエリで現実世界の悪天候推論セグメンテーションデータセットをキュレートする。
- 参考スコア(独自算出の注目度): 15.970876520993954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing vision-language models (VLMs) have demonstrated impressive performance in reasoning-based segmentation. However, current benchmarks are primarily constructed from high-quality images captured under idealized conditions. This raises a critical question: when visual cues are severely degraded by adverse weather conditions such as rain, snow, or fog, can VLMs sustain reliable reasoning segmentation capabilities? In response to this challenge, we introduce WeatherReasonSeg, a benchmark designed to evaluate VLM performance in reasoning-based segmentation under adverse weather conditions. It consists of two complementary components. First, we construct a controllable reasoning dataset by applying synthetic weather with varying severity levels to existing segmentation datasets, enabling fine-grained robustness analysis. Second, to capture real-world complexity, we curate a real-world adverse-weather reasoning segmentation dataset with semantically consistent queries generated via mask-guided LLM prompting. We further broaden the evaluation scope across five reasoning dimensions, including functionality, application scenarios, structural attributes, interactions, and requirement matching. Extensive experiments across diverse VLMs reveal two key findings: (1) VLM performance degrades monotonically with increasing weather severity, and (2) different weather types induce distinct vulnerability patterns. We hope WeatherReasonSeg will serve as a foundation for advancing robust, weather-aware reasoning.
- Abstract(参考訳): 既存の視覚言語モデル (VLM) は推論に基づくセグメンテーションにおいて顕著な性能を示した。
しかし、現在のベンチマークは主に理想化された条件下で撮影された高品質な画像から構築されている。
雨、雪、霧などの悪天候によって視覚的手がかりがひどく劣化した場合、VLMは信頼できる推論セグメンテーション能力を維持することができるのか?
この課題に対応するために、悪天候条件下での推論に基づくセグメンテーションにおいて、VLMの性能を評価するために設計されたベンチマークであるWeatherReasonSegを紹介する。
2つの相補的な構成要素から構成される。
まず、既存のセグメンテーションデータセットに様々な重大度レベルの合成気象を適用して、制御可能な推論データセットを構築し、きめ細かいロバスト性解析を可能にする。
第二に、現実世界の複雑さを捉えるために、マスク誘導LPMプロンプトによって意味的に一貫したクエリによって、現実世界の悪天候推論セグメンテーションデータセットをキュレートする。
さらに、機能、アプリケーションシナリオ、構造的属性、インタラクション、要求マッチングを含む5つの推論領域で評価範囲を広げます。
1) VLMの性能は、天候の重大度の増加とともに単調に低下し、(2)異なる気象タイプは、異なる脆弱性パターンを誘発する。
WeatherReasonSegが、堅牢で気象に配慮した推論の基盤になることを期待している。
関連論文リスト
- A Semantic Decoupling-Based Two-Stage Rainy-Day Attack for Revealing Weather Robustness Deficiencies in Vision-Language Models [9.92574905741706]
現実的な天気を利用して視覚言語モデル(VLM)を攻撃するための最初の敵フレームワークを紹介する。
雨による意思決定の変化を分析するために,セマンティックデカップリングに基づく2段階のパラメータ化摂動モデルを用いた。
我々の枠組みは物理的基盤と解釈可能な摂動を生成する。
論文 参考訳(メタデータ) (2026-01-19T17:16:30Z) - RoSe: Robust Self-supervised Stereo Matching under Adverse Weather Conditions [58.37558408672509]
本稿では,ロバストな自己監督型環境対応学習と悪天候蒸留という2つの重要なステップからなる,堅牢な自己監督型訓練パラダイムを提案する。
提案手法の有効性と汎用性を実証し,既存の最先端の自己管理手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-09-23T15:41:40Z) - Reinforcing Video Reasoning Segmentation to Think Before It Segments [67.5703457389657]
本稿では,ビデオ推論セグメンテーションのためのLVLMであるVeason-R1を紹介する。
Veason-R1 は、Chain-of-Thought trajectories を付加した Group Relative Policy Optimization (O) を通じて訓練される。
空間的アライメントと時間的整合性を高める包括的報酬機構を組み込んだ。
Veason-R1は、複数のベンチマークで最先端のパフォーマンスを達成し、先行技術を上回っている。
論文 参考訳(メタデータ) (2025-08-15T15:34:56Z) - Towards Generalized Range-View LiDAR Segmentation in Adverse Weather [65.22588361803942]
我々は、厳しい天候下でのLiDARセグメンテーションの一般化に影響を及ぼす固有の課題を特定し、分析する。
既存のモデルのコアアーキテクチャを変更することなく、ロバスト性を高めるモジュール式で軽量なフレームワークを提案する。
提案手法は,推定オーバーヘッドを最小限に抑え,悪天候への一般化を著しく改善する。
論文 参考訳(メタデータ) (2025-06-10T16:48:27Z) - WXImpactBench: A Disruptive Weather Impact Understanding Benchmark for Evaluating Large Language Models [12.16198010132936]
WXImpactBenchは、大きな言語モデル(LLM)の破壊的な気象影響を評価するための最初のベンチマークである。
構築されたデータセットと評価フレームワークのコードは、社会が災害からの脆弱性を保護するのに役立つ。
論文 参考訳(メタデータ) (2025-05-26T17:23:29Z) - GEOBench-VLM: Benchmarking Vision-Language Models for Geospatial Tasks [84.86699025256705]
本稿では,地理空間的タスクの視覚言語モデル(VLM)を評価するためのベンチマークであるGEOBench-VLMを提案する。
私たちのベンチマークでは、手動で検証された命令が1万以上あり、さまざまな視覚条件、オブジェクトタイプ、スケールにまたがっています。
地理空間固有の課題における性能を評価するために,いくつかの最先端のVLMを評価した。
論文 参考訳(メタデータ) (2024-11-28T18:59:56Z) - WeatherQA: Can Multimodal Language Models Reason about Severe Weather? [45.43764278625153]
干し草、竜巻、雷雨などの激しい対流的な気象イベントは、しばしば急速に起こるが、大きな被害を招き、毎年何十億ドルもの費用がかかる。
このことは、気象学者や住民のリスクの高い地域での適切な準備のために、前もって厳しい天候の脅威を予知することの重要性を強調している。
我々は、気象パラメータの複雑な組み合わせを推論し、現実のシナリオで厳しい天候を予測するために、機械用に設計された最初のマルチモーダルデータセットであるWeatherQAを紹介する。
論文 参考訳(メタデータ) (2024-06-17T05:23:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。