論文の概要: Effective Damage Data Generation by Fusing Imagery with Human Knowledge Using Vision-Language Models
- arxiv url: http://arxiv.org/abs/2508.01380v1
- Date: Sat, 02 Aug 2025 14:22:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-05 18:25:21.847372
- Title: Effective Damage Data Generation by Fusing Imagery with Human Knowledge Using Vision-Language Models
- Title(参考訳): 視覚言語モデルを用いた人間の知識を融合した画像による効果的な損傷データ生成
- Authors: Jie Wei, Erika Ardiles-Cruz, Aleksey Panasyuk, Erik Blasch,
- Abstract要約: 現在のディープラーニングアプローチは、データクラスの不均衡と中程度の損傷例の不足により、効果的な一般化に苦慮している。
我々は、視覚言語モデルにおける最先端技術を利用して、画像と人間の知識の理解を融合させる。
実験結果から,データ生成品質の向上が示唆され,構造的損傷のレベルが異なるシーンの分類精度の向上が示されている。
- 参考スコア(独自算出の注目度): 6.633325784470945
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: It is of crucial importance to assess damages promptly and accurately in humanitarian assistance and disaster response (HADR). Current deep learning approaches struggle to generalize effectively due to the imbalance of data classes, scarcity of moderate damage examples, and human inaccuracy in pixel labeling during HADR situations. To accommodate for these limitations and exploit state-of-the-art techniques in vision-language models (VLMs) to fuse imagery with human knowledge understanding, there is an opportunity to generate a diversified set of image-based damage data effectively. Our initial experimental results suggest encouraging data generation quality, which demonstrates an improvement in classifying scenes with different levels of structural damage to buildings, roads, and infrastructures.
- Abstract(参考訳): 人道支援・災害対応(HADR)において、ダメージを迅速かつ正確に評価することが重要である。
現在のディープラーニングアプローチは、データクラスの不均衡、中程度の損傷例の不足、HADRの状況下でのピクセルラベリングにおける人間の不正確さにより、効果的な一般化に苦慮している。
これらの制限に対処し、視覚言語モデル(VLM)の最先端技術を活用して人間の知識を融合させるため、画像に基づく損傷データを多種多様なデータに効果的に生成する機会がある。
最初の実験結果から,建物,道路,インフラの構造的損傷のレベルが異なるシーンの分類の改善を示すデータ生成品質の向上が示唆された。
関連論文リスト
- Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。
本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。
本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文 参考訳(メタデータ) (2024-11-28T13:04:45Z) - Addressing the Pitfalls of Image-Based Structural Health Monitoring: A Focus on False Positives, False Negatives, and Base Rate Bias [0.0]
本研究では, 画像に基づく構造的健康モニタリング技術(SHM)の限界について検討した。
画像ベースのSHMの信頼性は、偽陽性、偽陰性、環境変動などの課題に影響を受けている。
複数のデータソースを組み合わせたハイブリッドシステムなど、これらの制限を緩和するための戦略について議論する。
論文 参考訳(メタデータ) (2024-10-27T09:15:05Z) - EnTruth: Enhancing the Traceability of Unauthorized Dataset Usage in Text-to-image Diffusion Models with Minimal and Robust Alterations [73.94175015918059]
本稿では、未承認のデータセット使用のトレーサビリティを高める新しいアプローチであるEnTruthを紹介する。
テンプレートの暗記を戦略的に取り入れることで、EnTruthは不正なモデルの特定の振る舞いを侵害の証拠として引き起こすことができる。
本手法は, 暗記の正当性を調査し, 著作権保護に利用し, 呪いを祝福する最初の方法である。
論文 参考訳(メタデータ) (2024-06-20T02:02:44Z) - Image Prior and Posterior Conditional Probability Representation for
Efficient Damage Assessment [51.631659414455825]
人的援助及び災害対応のための被害評価の定量化が重要である。
本稿では,画像先行と後部条件付き確率(IP2CP)を有効計算画像表現として開発する。
一致した前と後の画像は、1つの画像に効果的に符号化され、その画像は深層学習アプローチを用いて処理され、損傷レベルが決定される。
論文 参考訳(メタデータ) (2023-10-26T22:17:37Z) - Exploring the Robustness of Human Parsers Towards Common Corruptions [99.89886010550836]
我々は,LIP-C,ATR-C,Pascal-Person-Part-Cという3つの汚職堅牢性ベンチマークを構築し,人間の解析モデルのリスク許容度を評価する。
データ強化戦略に触発されて、一般に破損した条件下で頑健性を高めるための新しい異種強化機構を提案する。
論文 参考訳(メタデータ) (2023-09-02T13:32:14Z) - One-class Damage Detector Using Deeper Fully-Convolutional Data
Descriptions for Civil Application [0.0]
モデルパラメータを最適化するために、通常の画像を使用することができる点において、一級損傷検出アプローチには利点がある。
本稿では,FCDDをベースラインモデルとして再現した一級損傷検出の汎用アプリケーションを提案する。
論文 参考訳(メタデータ) (2023-03-03T06:27:15Z) - Multi-view deep learning for reliable post-disaster damage
classification [0.0]
本研究は,人工知能(AI)と多視点画像を用いた,より信頼性の高い建築損傷分類を実現することを目的とする。
提案モデルでは, ハリケーン・ハーヴェイに続き, 調査対象の建物について, 専門家ラベル付きジオタグ付き画像を含む偵察視覚データセットを訓練し, 検証した。
論文 参考訳(メタデータ) (2022-08-06T01:04:13Z) - Interpretability in Convolutional Neural Networks for Building Damage
Classification in Satellite Imagery [0.0]
我々は、プレサスタ衛星画像とポストサスタ衛星画像とをラベル付けしたデータセットを使用して、建物ごとの損傷を評価する。
複数の畳み込みニューラルネットワーク(CNN)をトレーニングし、建物ごとの損傷を評価する。
我々の研究は、人為的気候変動による人道的危機の進行に、計算的に貢献することを目指している。
論文 参考訳(メタデータ) (2022-01-24T16:55:56Z) - Assessing out-of-domain generalization for robust building damage
detection [78.6363825307044]
建築損傷検出は、衛星画像にコンピュータビジョン技術を適用することで自動化することができる。
モデルは、トレーニングで利用可能な災害画像と、新しいイベントの画像の間の分散の変化に対して堅牢でなければならない。
今後はOOD体制に重点を置くべきだと我々は主張する。
論文 参考訳(メタデータ) (2020-11-20T10:30:43Z) - Deep Learning Benchmarks and Datasets for Social Media Image
Classification for Disaster Response [5.610924570214424]
本研究では,災害タイプ検出,情報度分類,被害重大度評価のための新しいデータセットを提案する。
我々は、最先端のディープラーニングモデルをいくつかベンチマークし、有望な結果を得る。
我々は、適切なベースラインを提供するとともに、危機情報化コミュニティにおけるさらなる研究を促進するために、データセットとモデルを公開しています。
論文 参考訳(メタデータ) (2020-11-17T20:15:49Z) - RescueNet: Joint Building Segmentation and Damage Assessment from
Satellite Imagery [83.49145695899388]
RescueNetは、建物を同時に分割し、個々の建物に対する損傷レベルを評価し、エンドツーエンドでトレーニングできる統一モデルである。
RescueNetは大規模で多様なxBDデータセットでテストされており、従来の手法よりもはるかに優れたセグメンテーションと損傷分類性能を実現している。
論文 参考訳(メタデータ) (2020-04-15T19:52:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。