論文の概要: Robust Disaster Assessment from Aerial Imagery Using Text-to-Image Synthetic Data
- arxiv url: http://arxiv.org/abs/2405.13779v1
- Date: Wed, 22 May 2024 16:07:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-24 23:25:17.847372
- Title: Robust Disaster Assessment from Aerial Imagery Using Text-to-Image Synthetic Data
- Title(参考訳): テキスト合成データを用いた航空画像からのロバスト災害評価
- Authors: Tarun Kalluri, Jihyeon Lee, Kihyuk Sohn, Sahil Singla, Manmohan Chandraker, Joseph Xu, Jeremiah Liu,
- Abstract要約: 航空画像からの損傷評価のタスクのための大規模合成監視を作成する際に,新たなテキスト・画像生成モデルを活用する。
低リソース領域から何千ものポストディスアスター画像を生成するために、効率的でスケーラブルなパイプラインを構築しています。
我々は,xBDおよびSKAI画像のクロスジオグラフィー領域転送設定におけるフレームワークの強度を,単一ソースとマルチソースの両方で検証する。
- 参考スコア(独自算出の注目度): 66.49494950674402
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a simple and efficient method to leverage emerging text-to-image generative models in creating large-scale synthetic supervision for the task of damage assessment from aerial images. While significant recent advances have resulted in improved techniques for damage assessment using aerial or satellite imagery, they still suffer from poor robustness to domains where manual labeled data is unavailable, directly impacting post-disaster humanitarian assistance in such under-resourced geographies. Our contribution towards improving domain robustness in this scenario is two-fold. Firstly, we leverage the text-guided mask-based image editing capabilities of generative models and build an efficient and easily scalable pipeline to generate thousands of post-disaster images from low-resource domains. Secondly, we propose a simple two-stage training approach to train robust models while using manual supervision from different source domains along with the generated synthetic target domain data. We validate the strength of our proposed framework under cross-geography domain transfer setting from xBD and SKAI images in both single-source and multi-source settings, achieving significant improvements over a source-only baseline in each case.
- Abstract(参考訳): 本稿では,航空画像からの損傷評価作業のための大規模合成監督を行う上で,新たなテキスト・画像生成モデルを活用するための簡易かつ効率的な手法を提案する。
近年、航空画像や衛星画像による損傷評価技術の改善が進んでいるが、手動ラベル付きデータが利用できない領域では、依然としてロバスト性に乏しいため、未資源の地理において、災害後の人道支援に直接影響している。
このシナリオにおけるドメインの堅牢性向上への私たちの貢献は2つあります。
まず、生成モデルのテキスト誘導マスクベースの画像編集機能を活用し、効率よくスケーラブルなパイプラインを構築し、低リソース領域から何千ものポストディザスター画像を生成する。
第2に、生成された合成対象ドメインデータとともに、異なるソースドメインから手動で監督しながら、ロバストモデルのトレーニングを行うための簡易な2段階トレーニング手法を提案する。
我々は,xBD画像とSKAI画像のクロスジオグラフィー領域転送設定におけるフレームワークの強度を,単一ソースと複数ソース設定の両方で検証し,ソースのみのベースラインよりも大幅に改善した。
関連論文リスト
- Semantic Segmentation for Real-World and Synthetic Vehicle's Forward-Facing Camera Images [0.8562182926816566]
これは、車両の前向きカメラからの実世界の画像と合成画像の両方におけるセマンティックセグメンテーション問題の解決策である。
我々は、さまざまな屋外状況の様々な領域でよく機能するロバストモデルの構築に集中する。
本稿では,意味的セグメンテーション問題における領域適応のための実世界のデータと合成データの併用の有効性について検討する。
論文 参考訳(メタデータ) (2024-07-07T17:28:45Z) - Source-Free Online Domain Adaptive Semantic Segmentation of Satellite
Images under Image Degradation [20.758637391023345]
我々は、衛星画像のソースフリーおよびオンラインドメイン適応、すなわちテスト時間適応(TTA)に対処する。
2つの効果的な戦略を含む新しいTTA手法を提案する。
まず、ターゲット分布のグローバルバッチ正規化統計を着信データストリームで段階的に推定する。
第2に,グローバルなクラスセンターを用いて予測マスクを精錬することにより,予測品質を向上させる。
論文 参考訳(メタデータ) (2024-01-04T07:49:32Z) - Enhancing Visual Domain Adaptation with Source Preparation [5.287588907230967]
ドメイン適応技術は、ソースドメイン自体の特性を考慮できません。
本稿では,ソース領域バイアスを軽減する手法であるソース準備(SP)を提案する。
また,ベースライン上のmIoUでは最大40.64%の改善が見られた。
論文 参考訳(メタデータ) (2023-06-16T18:56:44Z) - Source-Free Domain Adaptation for Real-world Image Dehazing [10.26945164141663]
本稿では,SFUDA(Source-Free Unsupervised Domain Adaptation)画像デハージングパラダイムを提案する。
ドメイン表現正規化(DRN)モジュールを考案し、実際のハジードメイン特徴の表現を合成ドメインの表現と一致させる。
プラグアンドプレイのDRNモジュールを使えば、ラベルのない実画像は、既存のよく訓練されたソースネットワークに適応できる。
論文 参考訳(メタデータ) (2022-07-14T03:37:25Z) - Single Image Internal Distribution Measurement Using Non-Local
Variational Autoencoder [11.985083962982909]
本稿では,非局所変分オートエンコーダ(textttNLVAE)という画像固有解を提案する。
textttNLVAEは,非局所領域からの非絡み合った情報を用いて高解像度画像を再構成する自己教師型戦略として導入された。
7つのベンチマークデータセットによる実験結果から,textttNLVAEモデルの有効性が示された。
論文 参考訳(メタデータ) (2022-04-02T18:43:55Z) - Domain Adaptation for Underwater Image Enhancement [51.71570701102219]
本稿では,ドメイン間およびドメイン内ギャップを最小限に抑えるために,新しい2相水中ドメイン適応ネットワーク(TUDA)を提案する。
第1段階では、入力画像のリアリズムを強化する翻訳部と、拡張部とを含む新しい二重配向ネットワークを設計する。
第2フェーズでは、ランクベースの水中品質評価手法が組み込まれている強化画像の評価品質に応じて、実データを簡単に分類する。
論文 参考訳(メタデータ) (2021-08-22T06:38:19Z) - Towards Unsupervised Sketch-based Image Retrieval [126.77787336692802]
本稿では,教師なし表現学習とスケッチ写真領域アライメントを同時に行う新しいフレームワークを提案する。
このフレームワークは,新しい教師なし設定では優れた性能を達成し,ゼロショット設定では最先端以上の性能を発揮する。
論文 参考訳(メタデータ) (2021-05-18T02:38:22Z) - Enhancing Photorealism Enhancement [83.88433283714461]
本稿では,畳み込みネットワークを用いた合成画像のリアリズム向上手法を提案する。
一般的に使用されるデータセットのシーンレイアウトの分布を分析し、重要な方法で異なることを見つけます。
近年のイメージ・ツー・イメージ翻訳法と比較して,安定性とリアリズムの大幅な向上が報告されている。
論文 参考訳(メタデータ) (2021-05-10T19:00:49Z) - Few-shot Image Generation via Cross-domain Correspondence [98.2263458153041]
限られた例を含む対象領域におけるGANなどの生成モデルの訓練は、容易に過度な適合をもたらす。
本研究では,多様性情報をソースからターゲットにプリトレーニングし,転送するために,大きなソースドメインを活用することを目指す。
さらに,オーバーフィッティングを減らすために,潜在空間内の異なる領域に対して異なるレベルのリアリズムを奨励するアンカーベースの戦略を提案する。
論文 参考訳(メタデータ) (2021-04-13T17:59:35Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。