論文の概要: Forecasting and Visualizing Air Quality from Sky Images with Vision-Language Models
- arxiv url: http://arxiv.org/abs/2509.15076v1
- Date: Thu, 18 Sep 2025 15:36:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 17:26:53.305121
- Title: Forecasting and Visualizing Air Quality from Sky Images with Vision-Language Models
- Title(参考訳): 視覚言語モデルを用いた空画像からの空気質の予測と可視化
- Authors: Mohammad Saleh Vahdatpour, Maryam Eyvazi, Yanqing Zhang,
- Abstract要約: 大気汚染は公衆衛生と環境の持続可能性にとって重要な脅威である。
本稿では,スカイイメージから環境大気汚染レベルを予測するAI駆動エージェントを提案する。
提案手法は, 統計的テクスチャ解析と教師あり学習を組み合わせた汚染分類手法である。
- 参考スコア(独自算出の注目度): 0.4317207251910848
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Air pollution remains a critical threat to public health and environmental sustainability, yet conventional monitoring systems are often constrained by limited spatial coverage and accessibility. This paper proposes an AI-driven agent that predicts ambient air pollution levels from sky images and synthesizes realistic visualizations of pollution scenarios using generative modeling. Our approach combines statistical texture analysis with supervised learning for pollution classification, and leverages vision-language model (VLM)-guided image generation to produce interpretable representations of air quality conditions. The generated visuals simulate varying degrees of pollution, offering a foundation for user-facing interfaces that improve transparency and support informed environmental decision-making. These outputs can be seamlessly integrated into intelligent applications aimed at enhancing situational awareness and encouraging behavioral responses based on real-time forecasts. We validate our method using a dataset of urban sky images and demonstrate its effectiveness in both pollution level estimation and semantically consistent visual synthesis. The system design further incorporates human-centered user experience principles to ensure accessibility, clarity, and public engagement in air quality forecasting. To support scalable and energy-efficient deployment, future iterations will incorporate a green CNN architecture enhanced with FPGA-based incremental learning, enabling real-time inference on edge platforms.
- Abstract(参考訳): 大気汚染は公衆の健康と環境の持続可能性にとって重要な脅威であり続けているが、従来の監視システムは空間的な範囲とアクセシビリティに制限されることが多い。
本稿では, 大気汚染レベルをスカイイメージから予測し, 生成モデルを用いて環境汚染シナリオの現実的な可視化を合成するAI駆動エージェントを提案する。
提案手法は,汚染分類のための統計的テクスチャ解析と教師付き学習を併用し,視覚言語モデル(VLM)誘導画像生成を利用して,空気質条件の解釈可能な表現を生成する。
生成した視覚は、様々なレベルの汚染をシミュレートし、透明性を改善し、情報的環境意思決定をサポートするユーザインタフェースの基礎を提供する。
これらの出力は、状況認識の向上とリアルタイム予測に基づく行動応答の促進を目的としたインテリジェントなアプリケーションにシームレスに統合することができる。
都市空画像のデータセットを用いて本手法の有効性を検証し,大気汚染レベル推定と意味論的に一貫した視覚合成の両面での有効性を実証する。
システム設計は、空気質予測におけるアクセシビリティ、明確性、公的な関与を保証するために、人間中心のユーザーエクスペリエンス原則をさらに取り入れている。
スケーラブルでエネルギー効率の高いデプロイメントをサポートするため、将来のイテレーションではFPGAベースのインクリメンタルラーニングによって強化されたグリーンCNNアーキテクチャが導入され、エッジプラットフォームでのリアルタイム推論が可能になる。
関連論文リスト
- DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge [41.030494146004806]
本稿では,逆動力学モデリングを実現するために,包括的世界知識予測を統合した新しいVLAフレームワークであるDreamVLAを提案する。
DreamVLAは、動的領域誘導の世界知識予測を導入し、空間的および意味的な手がかりと統合し、アクション計画のためのコンパクトで包括的な表現を提供する。
実世界とシミュレーション環境での実験では、ドリームVLAが実際のロボットタスクで76.7%の成功率を達成したことが示されている。
論文 参考訳(メタデータ) (2025-07-06T16:14:29Z) - Data Augmentation and Resolution Enhancement using GANs and Diffusion Models for Tree Segmentation [49.13393683126712]
都市森林は、環境の質を高め、都市における生物多様性を支援する上で重要な役割を担っている。
複雑な地形と異なる衛星センサーやUAV飛行高度による画像解像度の変化により、正確に木を検知することは困難である。
低解像度空中画像の品質を高めるため,GANと拡散モデルとドメイン適応を統合した新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2025-05-21T03:57:10Z) - An AI-driven framework for the prediction of personalised health response to air pollution [30.858937705130106]
大気汚染は公衆衛生にとって重大な脅威となり、多くの呼吸器や心臓血管疾患を発生または悪化させる。
個人感覚の最近の進歩は、行動や生理的なデータの収集に変化をもたらした。
本研究では、ウェアラブルフィットネスデバイスからの生理データをリアルタイム環境暴露と統合することで、汚染に対する個人化された健康反応を予測する新しいワークフローを提案する。
論文 参考訳(メタデータ) (2025-05-15T17:59:07Z) - Learning Underwater Active Perception in Simulation [51.205673783866146]
タービディティは、検査された構造物の正確な視覚的記録を阻止する可能性があるため、ミッション全体を危険に晒す可能性がある。
従来の研究は、濁度や後方散乱に適応する手法を導入してきた。
本研究では, 広範囲の水環境下での高品質な画像取得を実現するための, 単純かつ効率的なアプローチを提案する。
論文 参考訳(メタデータ) (2025-04-23T06:48:38Z) - Can Deep Learning Trigger Alerts from Mobile-Captured Images? [0.0594961162060159]
本研究は,データ拡張手法の検証,大気質予測のためのCNNに基づく回帰モデリング,モバイル技術によるユーザ中心の大気質モニタリングに寄与する。
提案システムは,個人が情報的環境衛生と幸福な意思決定を行うための実践的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-01-07T03:39:43Z) - Water quality polluted by total suspended solids classified within an Artificial Neural Network approach [0.0]
懸濁液による水質汚染は、環境と健康に重大なリスクをもたらす。
これらの課題に対処するために, 全懸濁固体から水質の包括的データセットを活用するモデルを開発した。
畳み込みニューラルネットワークは, 異なる懸濁液濃度に対応するデータを用いて, 伝達学習手法で訓練された。
論文 参考訳(メタデータ) (2024-10-19T01:33:08Z) - Environmental Insights: Democratizing Access to Ambient Air Pollution
Data and Predictive Analytics with an Open-Source Python Package [0.0]
Environmental Insightsは、大気汚染濃度データへのアクセスを民主化するために設計されたオープンソースのPythonパッケージである。
このツールを使うと、ユーザーは過去の大気汚染データを検索し、機械学習モデルを使って将来の状況を予測することができる。
論文 参考訳(メタデータ) (2024-03-06T12:34:50Z) - Towards an end-to-end artificial intelligence driven global weather forecasting system [57.5191940978886]
我々は,地球規模の気象変動に対するAIに基づくデータ同化モデル,すなわちAdasを提案する。
我々は,アダスが地球観測を同化して高品質な分析を行い,長期にわたって安定して運用できることを実証した。
この手法を現実のシナリオに適用するのは,私たちが初めてです。
論文 参考訳(メタデータ) (2023-12-18T09:05:28Z) - Conditioned Human Trajectory Prediction using Iterative Attention Blocks [70.36888514074022]
本研究では,都市環境における歩行者位置予測を目的とした,簡易かつ効果的な歩行者軌道予測モデルを提案する。
我々のモデルは、複数のアテンションブロックとトランスフォーマーを反復的に実行できるニューラルネットワークアーキテクチャである。
ソーシャルマスク, 動的モデル, ソーシャルプーリング層, 複雑なグラフのような構造を明示的に導入することなく, SoTAモデルと同等の結果が得られることを示す。
論文 参考訳(メタデータ) (2022-06-29T07:49:48Z) - AirSPEC: An IoT-empowered Air Quality Monitoring System integrated with
a Machine Learning Framework to Detect and Predict defined Air Quality
parameters [0.0]
機械学習モデルにより実装が容易で、セマンティックに配布され、権限を与える新しいモノのインターネットフレームワークが提案されている。
提案システムは,一次センサデータを処理,可視化,保存するNodeREDダッシュボードを備えている。
ダッシュボードは、時間的および地理空間的な空気質予測を得るために、機械学習モデルと統合されている。
論文 参考訳(メタデータ) (2021-11-28T12:13:30Z) - Federated Learning in the Sky: Aerial-Ground Air Quality Sensing
Framework with UAV Swarms [53.38353133198842]
空気質は人間の健康に大きく影響し、空気質指数(AQI)の正確かつタイムリーな予測がますます重要になっている。
本稿では, 精密な3次元空気質モニタリングと予測を行うための, 新たなフェデレーション学習型地上空気質検知フレームワークを提案する。
地中センシングシステムでは, グラフ畳み込みニューラルネットワークを用いたLong Short-Term Memory (GC-LSTM) モデルを提案し, 高精度, リアルタイム, 将来的なAQI推論を実現する。
論文 参考訳(メタデータ) (2020-07-23T13:32:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。