Fugu-MT 論文翻訳(概要): FMARS: Annotating Remote Sensing Images for Disaster Management using Foundation Models

論文の概要: FMARS: Annotating Remote Sensing Images for Disaster Management using Foundation Models

arxiv url: http://arxiv.org/abs/2405.20109v1
Date: Thu, 30 May 2024 14:45:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-31 13:58:47.046736
Title: FMARS: Annotating Remote Sensing Images for Disaster Management using Foundation Models
Title（参考訳）: FMARS:基礎モデルを用いた災害管理のためのリモートセンシング画像の注釈付け
Authors: Edoardo Arnaudo, Jacopo Lungo Vaschetti, Lorenzo Innocenti, Luca Barco, Davide Lisi, Vanina Fissore, Claudio Rossi,
Abstract要約: FMARS(Foundation Model s in Remote Sensing)は、VHR画像と基礎モデルを高速で堅牢なアノテーションに活用する方法論である。災害管理に焦点をあて,19件の災害イベントの事前画像から得られたラベルを用いた大規模データセットを提供する。実世界のシナリオへの転送可能性を高めるために、Unsupervised Adaptation (UDA) 技術を用いて、生成されたラベルのセグメンテーションモデルを訓練する。
参考スコア（独自算出の注目度）: 0.8795040582681392
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Very-High Resolution (VHR) remote sensing imagery is increasingly accessible, but often lacks annotations for effective machine learning applications. Recent foundation models like GroundingDINO and Segment Anything (SAM) provide opportunities to automatically generate annotations. This study introduces FMARS (Foundation Model Annotations in Remote Sensing), a methodology leveraging VHR imagery and foundation models for fast and robust annotation. We focus on disaster management and provide a large-scale dataset with labels obtained from pre-event imagery over 19 disaster events, derived from the Maxar Open Data initiative. We train segmentation models on the generated labels, using Unsupervised Domain Adaptation (UDA) techniques to increase transferability to real-world scenarios. Our results demonstrate the effectiveness of leveraging foundation models to automatically annotate remote sensing data at scale, enabling robust downstream models for critical applications. Code and dataset are available at \url{https://github.com/links-ads/igarss-fmars}.
Abstract（参考訳）: 超高解像度(VHR)リモートセンシング画像はますますアクセスしやすくなっているが、効果的な機械学習アプリケーションのためのアノテーションが欠けていることが多い。 GroundingDINOやSegment Anything(SAM)といった最近の基盤モデルは、アノテーションを自動的に生成する機会を提供する。本研究では,FMARS(Foundation Model Annotations in Remote Sensing)について紹介する。我々は災害管理に重点を置いており、Maxar Open Dataイニシアチブから派生した19の災害イベントに関する事前イベントの画像から得られたラベル付き大規模データセットを提供する。実世界のシナリオへの転送可能性を高めるために、Unsupervised Domain Adaptation (UDA) 技術を用いて、生成されたラベルのセグメンテーションモデルをトレーニングする。本研究は, リモートセンシングデータの自動アノテートに基礎モデルを活用することの有効性を実証し, 重要なアプリケーションにロバストな下流モデルを実現することを目的とする。コードとデータセットは \url{https://github.com/links-ads/igarss-fmars} で公開されている。

関連論文リスト

DRAG: Data Reconstruction Attack using Guided Diffusion [20.2532929124365]
本稿では,大規模データセットに事前学習した潜在拡散モデル(LDM)に埋め込まれた豊富な事前知識を活用する,ガイド付き拡散に基づく新しいデータ再構成攻撃を提案する。本手法は,視覚基礎モデルの深層赤外線からのデータ再構成において,定性的かつ定量的に,最先端の手法よりも優れる。
論文参考訳（メタデータ） (2025-09-15T09:26:19Z)
Zero-Shot Image Anomaly Detection Using Generative Foundation Models [2.241618130319058]
本研究は,意味的異常検出のための基礎的ツールとしてスコアベース生成モデルの利用について検討する。スタインスコアの誤差を解析することにより,各ターゲットデータセットの再学習を必要とせず,異常サンプルを識別する新しい手法を提案する。このアプローチは最先端よりも改善され、ひとつのデータセット — CelebA -- 上で単一のモデルをトレーニングすることに依存しています。
論文参考訳（メタデータ） (2025-07-30T13:56:36Z)
DUSE: A Data Expansion Framework for Low-resource Automatic Modulation Recognition based on Active Learning [17.651073556023167]
動的不確実性駆動型サンプル拡張(DUSE)と呼ばれるデータ拡張フレームワークを導入する。 DUSEは不確実性スコアリング機能を使用して、関連するAMRデータセットから有用なサンプルをフィルタリングする。実験によると、DUSEはクラスバランスとクラスバランスの設定の両方で8コアセット選択ベースラインを一貫して上回っている。
論文参考訳（メタデータ） (2025-07-16T08:09:41Z)
Continuous Visual Autoregressive Generation via Score Maximization [69.67438563485887]
本稿では,ベクトル量子化なしで直接視覚的自己回帰生成を可能にする連続VARフレームワークを提案する。このフレームワークの中で必要なのは、厳密な適切なスコアを選択し、最適化のトレーニング目標として設定することだけです。
論文参考訳（メタデータ） (2025-05-12T17:58:14Z)
SAM2-ELNet: Label Enhancement and Automatic Annotation for Remote Sensing Segmentation [1.7906674529114799]
この研究は、ラベリングモジュールとエッジアテンション機構を組み込んだ、SAM2-ELNetと呼ばれるエッジ強化ラベリングネットワークを提案する。本手法では,事前学習した大規模モデルセグメントのHieraバックボーンをエンコーダとして使用する。その結果, ラベルの強化によりトレーニングしたモデルの性能が向上し, 最終損失が低くなり, 実際のデータ分布との密接な一致が示唆された。
論文参考訳（メタデータ） (2025-03-16T08:11:11Z)
A Recipe for Improving Remote Sensing VLM Zero Shot Generalization [0.4427533728730559]
本稿では,リモートセンシング基礎モデルのトレーニングのための2つの新しい画像キャプチャーデータセットを提案する。最初のデータセットは、Google Mapsから抽出されたランドマークを使用して、Geminiによって生成されたキャプションと航空画像と衛星画像のペアである。第2のデータセットは、リモートセンシングドメインのためにフィルタリングされたパブリックWebイメージとそれに対応するalt-textを利用する。
論文参考訳（メタデータ） (2025-03-10T21:09:02Z)
Boosting Salient Object Detection with Knowledge Distillated from Large Foundation Models [7.898092154590899]
Salient Object Detectionは、シーン内の顕著な領域を特定し、セグメンテーションすることを目的としている。従来のモデルは、正確なピクセルレベルの精度で手動でアノテートされた擬似ラベルに依存している。本研究では,低コストで高精度なアノテーション手法を開発し,課題に対処する。
論文参考訳（メタデータ） (2025-01-08T15:56:21Z)
A Plug-and-Play Method for Rare Human-Object Interactions Detection by Bridging Domain Gap [50.079224604394]
textbfContext-textbfEnhanced textbfFeature textbfAment (CEFA) と呼ばれる新しいモデルに依存しないフレームワークを提案する。 CEFAは機能アライメントモジュールとコンテキスト拡張モジュールで構成される。本手法は, 稀なカテゴリにおけるHOIモデルの検出性能を向上させるために, プラグアンドプレイモジュールとして機能する。
論文参考訳（メタデータ） (2024-07-31T08:42:48Z)
InfRS: Incremental Few-Shot Object Detection in Remote Sensing Images [11.916941756499435]
本稿では,リモートセンシング画像におけるインクリメンタルな数ショット物体検出の複雑な課題について検討する。本稿では,新しい授業の漸進的な学習を促進するために,InfRSと呼ばれる先駆的な微調整技術を導入する。我々はワッサーシュタイン距離に基づく原型校正戦略を開発し、破滅的な忘れ問題を軽減する。
論文参考訳（メタデータ） (2024-05-18T13:39:50Z)
Few-shot Online Anomaly Detection and Segmentation [29.693357653538474]
本稿では,難易度の高いオンライン異常検出・セグメンテーション(FOADS)の課題に対処することに焦点を当てる。 FOADSフレームワークでは、モデルを数ショットの通常のデータセットでトレーニングし、その後、正常サンプルと異常サンプルの両方を含む未ラベルのストリーミングデータを活用することで、その能力の検査と改善を行う。限られたトレーニングサンプルを用いた性能向上のために,ImageNetで事前学習したCNNから抽出したマルチスケール特徴埋め込みを用いて,ロバストな表現を得る。
論文参考訳（メタデータ） (2024-03-27T02:24:00Z)
Text2Seg: Remote Sensing Image Semantic Segmentation via Text-Guided Visual Foundation Models [7.452422412106768]
リモートセマンティックセマンティックセグメンテーションのためのText2Segという新しい手法を提案する。自動プロンプト生成プロセスを使用することで、広範なアノテーションへの依存を克服する。我々は,Text2SegがバニラSAMモデルと比較してゼロショット予測性能を著しく向上することを示した。
論文参考訳（メタデータ） (2023-04-20T18:39:41Z)
Enhancing Multiple Reliability Measures via Nuisance-extended Information Bottleneck [77.37409441129995]
トレーニングデータに制限がある現実的なシナリオでは、データ内の多くの予測信号は、データ取得のバイアスからより多く得る。我々は,相互情報制約の下で,より広い範囲の摂動をカバーできる敵の脅威モデルを考える。そこで本研究では,その目的を実現するためのオートエンコーダベーストレーニングと,提案したハイブリッド識別世代学習を促進するための実用的なエンコーダ設計を提案する。
論文参考訳（メタデータ） (2023-03-24T16:03:21Z)
SRoUDA: Meta Self-training for Robust Unsupervised Domain Adaptation [25.939292305808934]
教師なしドメイン適応(UDA)は、リッチラベルデータセットから学習した知識をラベルなしターゲットデータセットに転送することができる。本稿では,UDAモデルの対角的ロバスト性を改善するために,SRoUDAというメタ自己学習パイプラインを提案する。
論文参考訳（メタデータ） (2022-12-12T14:25:40Z)
Cluster-level pseudo-labelling for source-free cross-domain facial expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文参考訳（メタデータ） (2022-10-11T08:24:50Z)
CausalAgents: A Robustness Benchmark for Motion Forecasting using Causal Relationships [8.679073301435265]
既存のデータに摂動を適用することにより、モデルロバスト性の評価と改善のための新しいベンチマークを構築する。我々はこれらのラベルを使用して、現場から非因果的エージェントを削除することでデータを摂動する。非因果摂動下では, minADE の相対的な変化は, 原型と比較して25$-$38%である。
論文参考訳（メタデータ） (2022-07-07T21:28:23Z)
Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文参考訳（メタデータ） (2021-11-30T18:42:42Z)
Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-08-02T07:50:50Z)
Semi-Supervised Domain Adaptation with Prototypical Alignment and Consistency Learning [86.6929930921905]
本稿では,いくつかの対象サンプルがラベル付けされていれば,ドメインシフトに対処するのにどの程度役立つか検討する。ランドマークの可能性を最大限に追求するために、ランドマークから各クラスのターゲットプロトタイプを計算するプロトタイプアライメント(PA)モジュールを組み込んでいます。具体的には,ラベル付き画像に深刻な摂動を生じさせ,PAを非自明にし,モデル一般化性を促進する。
論文参考訳（メタデータ） (2021-04-19T08:46:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。