論文の概要: DynamicEarth: How Far are We from Open-Vocabulary Change Detection?
- arxiv url: http://arxiv.org/abs/2501.12931v1
- Date: Wed, 22 Jan 2025 15:02:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 13:29:37.708632
- Title: DynamicEarth: How Far are We from Open-Vocabulary Change Detection?
- Title(参考訳): DynamicEarth: オープン・ボキャブラリ・チェンジ検出からどのくらい離れていますか?
- Authors: Kaiyu Li, Xiangyong Cao, Yupeng Deng, Chao Pang, Zepeng Xin, Deyu Meng, Zhi Wang,
- Abstract要約: OVCD(Open-vocabulary Change Detection)は、視覚と言語をブリッジして、あらゆるカテゴリにまたがる変化を検出する新しいタスクである。
高品質なデータとアノテーションの欠如を考慮し,M-C-IとI-M-Cの2つのトレーニングフリーフレームワークを提案する。
探索の継続を支援するため,我々は,OVCDの研究と応用を促進するために設計された専用一般化であるDynamicEarthをリリースした。
- 参考スコア(独自算出の注目度): 46.29452583152582
- License:
- Abstract: Monitoring Earth's evolving land covers requires methods capable of detecting changes across a wide range of categories and contexts. Existing change detection methods are hindered by their dependency on predefined classes, reducing their effectiveness in open-world applications. To address this issue, we introduce open-vocabulary change detection (OVCD), a novel task that bridges vision and language to detect changes across any category. Considering the lack of high-quality data and annotation, we propose two training-free frameworks, M-C-I and I-M-C, which leverage and integrate off-the-shelf foundation models for the OVCD task. The insight behind the M-C-I framework is to discover all potential changes and then classify these changes, while the insight of I-M-C framework is to identify all targets of interest and then determine whether their states have changed. Based on these two frameworks, we instantiate to obtain several methods, e.g., SAM-DINOv2-SegEarth-OV, Grounding-DINO-SAM2-DINO, etc. Extensive evaluations on 5 benchmark datasets demonstrate the superior generalization and robustness of our OVCD methods over existing supervised and unsupervised methods. To support continued exploration, we release DynamicEarth, a dedicated codebase designed to advance research and application of OVCD. https://likyoo.github.io/DynamicEarth
- Abstract(参考訳): 地球の土地の進化をモニタリングするには、様々なカテゴリーや状況の変化を検出する方法が必要である。
既存の変更検出方法は、事前に定義されたクラスへの依存によって妨げられ、オープンワールドアプリケーションでの有効性が低下する。
この問題に対処するために,任意のカテゴリにまたがる変化を検出するために視覚と言語をブリッジする新しいタスクであるOVCD(Open-vocabulary Change Detection)を導入する。
高品質なデータとアノテーションが欠如していることを踏まえ、OVCDタスクの既製の基盤モデルを活用し統合する2つのトレーニングフリーフレームワークであるM-C-IとI-M-Cを提案する。
M-C-Iフレームワークの背後にある洞察は、すべての潜在的な変更を発見し、これらの変更を分類することであり、一方、I-M-Cフレームワークの洞察は、すべての関心の対象を特定し、その状態が変更されたかどうかを決定することである。
これら2つのフレームワークに基づいて,SAM-DINOv2-SegEarth-OV, Grounding-DINO-SAM2-DINOなど,いくつかの手法をインスタンス化する。
5つのベンチマークデータセットの大規模な評価は、既存の教師なしおよび教師なしの手法よりも、OVCD手法のより優れた一般化とロバスト性を示す。
調査の継続を支援するため、私たちは、OVCDの研究と応用を促進するために設計された専用のコードベースであるDynamicEarthをリリースした。
https://likyoo.github.io/DynamicEarth
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.65760006883248]
我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。
CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。
QAG-360Kと呼ばれる最初のCDQAGベンチマークデータセットを構築し、360K以上の質問、テキスト回答、およびそれに対応する高品質な視覚マスクを含む。
論文 参考訳(メタデータ) (2024-10-31T11:20:13Z) - A Late-Stage Bitemporal Feature Fusion Network for Semantic Change Detection [32.112311027857636]
そこで本研究では,意味変化検出の課題に対処するため,新しい2段階の時間的特徴融合ネットワークを提案する。
具体的には,特徴融合を強化するため,局所的グローバルアテンショナルアグリゲーションモジュールを提案し,重要なセマンティクスを強調するために,局所的グローバルなコンテキスト拡張モジュールを提案する。
提案モデルにより,両データセットの最先端性能が向上する。
論文 参考訳(メタデータ) (2024-06-15T16:02:10Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector [72.05791402494727]
本稿では,CD-FSODを用いたクロスドメイン小ショット検出法について検討する。
最小限のラベル付き例で、新しいドメインのための正確なオブジェクト検出器を開発することを目的としている。
論文 参考訳(メタデータ) (2024-02-05T15:25:32Z) - Change Detection Between Optical Remote Sensing Imagery and Map Data via
Segment Anything Model (SAM) [20.985372561774415]
光高解像度画像とOpenStreetMap(OSM)データという2つの主要なリモートセンシングデータソース間の教師なしマルチモーダル変化検出について検討する。
我々はSAMのセグメンテーションプロセスを導くための2つの戦略、すなわち'no-prompt'と'box/mask prompt'メソッドを紹介した。
3つのデータセットの実験結果から,提案手法がより競争力のある結果が得られることが示唆された。
論文 参考訳(メタデータ) (2024-01-17T07:30:52Z) - Exchanging Dual Encoder-Decoder: A New Strategy for Change Detection
with Semantic Guidance and Spatial Localization [10.059696915598392]
セマンティックガイダンスと空間的ローカライゼーションを用いたバイナリ変更検出のための2つのエンコーダ・デコーダ構造を交換した新しい戦略を提案する。
この戦略に基づいてバイナリ変更検出モデルを構築し、それを6つのデータセット上で18の最先端の変更検出手法と比較する。
論文 参考訳(メタデータ) (2023-11-19T11:30:43Z) - Robust Object Detection via Instance-Level Temporal Cycle Confusion [89.1027433760578]
物体検出器の分布外一般化を改善するための補助的自己監視タスクの有効性を検討する。
最大エントロピーの原理に触発されて,新しい自己監督タスクであるインスタンスレベル時間サイクル混乱(cycconf)を導入する。
それぞれのオブジェクトに対して、タスクは、ビデオ内の隣接するフレームで最も異なるオブジェクトの提案を見つけ、自己スーパービジョンのために自分自身にサイクルバックすることです。
論文 参考訳(メタデータ) (2021-04-16T21:35:08Z) - Distilling Knowledge from Refinement in Multiple Instance Detection
Networks [0.0]
弱教師付きオブジェクト検出(WSOD)は、ラベル付き画像カテゴリのみを監督として、オブジェクト検出の問題に取り組むことを目的としている。
そこで本研究では,各改良モジュールの監督期間中に,基幹クラス,背景,あるいは無視されるボックスの選択基準を動的に変更する適応型監視アグリゲーション機能を提案する。
論文 参考訳(メタデータ) (2020-04-23T02:49:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。