論文の概要: ReA-OVCD: Reliability-Aware Open-Vocabulary Change Detection via Semantic and Spatial Refinement
- arxiv url: http://arxiv.org/abs/2606.20032v1
- Date: Thu, 18 Jun 2026 10:05:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.786555
- Title: ReA-OVCD: Reliability-Aware Open-Vocabulary Change Detection via Semantic and Spatial Refinement
- Title(参考訳): ReA-OVCD:セマンティック・空間的リファインメントによる信頼性を考慮したオープン語彙変化検出
- Authors: Hongming Zhu, Huaji Chen, Bowen Du, Sicong Liu, Qin Liu,
- Abstract要約: 本稿では, 信頼性に配慮したオープンボキャブラリ変化検出フレームワークを提案する。
まず、ピクセル単位のセマンティックな違いから候補変更領域を導出し、フレキシブルで詳細なローカライゼーションを保証する。
次に、意味的視点と空間的視点の両方から変化の妥当性を明示的にモデル化するための協調的な改善戦略を導入する。
- 参考スコア(独自算出の注目度): 8.855406881644702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike traditional remote sensing change detection that relies on predefined categories, Open-Vocabulary Change Detection (OVCD) identifies land cover changes flexibly using arbitrary text prompts. However, existing methods suffer from an inherent trade-off when modeling changes: instance-level comparison overlooks fine-grained semantic variations (e.g., partial building extensions), while direct pixel comparison proves unreliable, yielding unstable responses and boundary artifacts due to semantic ambiguity and spatial inconsistency. To this end, we propose an efficient training-free Reliability-Aware Open-Vocabulary Change Detection (ReA-OVCD) framework. It first derives candidate change regions from pixel-wise semantic discrepancies to ensure flexible and detailed localization. To ensure reliability, it subsequently introduces a collaborative refinement strategy to explicitly model change validity from both semantic and spatial perspectives. Specifically, we develop a Semantic Change Reasoning (SCR) module that reassesses changes by jointly analyzing distributional divergence and response variation, enabling the suppression of incidental inconsistencies while preserving reliable semantic shifts. In addition, a Boundary-aware Change Refinement (BCR) module is designed to mitigate artifacts stemming from boundary misalignment and uncertainty through validating whether candidate regions are supported by reliable interior pixels. Extensive experiments across multiple datasets (LEVIR-CD, WHU-CD, DSIFN, and SECOND) demonstrate that our method consistently outperforms state-of-the-art approaches, achieving $\mathrm{F}_{1}^{C}$ improvements of 2.13\% to 9.75\% with higher computational efficiency. The code is publicly available at \https://github.com/Funny0101/ReA-OVCD
- Abstract(参考訳): 予め定義されたカテゴリに依存する従来のリモートセンシング変更検出とは異なり、OVCD(Open-Vocabulary Change Detection)は任意のテキストプロンプトを使用して柔軟に土地被覆の変更を特定する。
インスタンスレベルの比較は、細粒度のセマンティックなバリエーション(例えば、部分的なビルディング拡張)を見落とし、直接ピクセル比較は、セマンティックな曖昧さと空間的不整合によって不安定な応答と境界アーチファクトをもたらす。
そこで本研究では,Reliability-Aware Open-Vocabulary Change Detection (ReA-OVCD) フレームワークを提案する。
まず、ピクセル単位のセマンティックな違いから候補変更領域を導出し、フレキシブルで詳細なローカライゼーションを保証する。
信頼性を確保するために、セマンティックと空間の両方の観点から変化の妥当性を明示的にモデル化するための協調的な改善戦略を導入する。
具体的には、分散のばらつきと応答のばらつきを共同で解析することで変化を再評価するセマンティック・チェンジ・推論(SCR)モジュールを開発し、信頼性のあるセマンティック・シフトを保ちながら、偶発的不整合の抑制を可能にする。
さらに,BCRモジュールは,境界の不整合や不確実性から生じるアーティファクトを,信頼性のある内部画素で候補領域がサポートされているかどうかを検証することで軽減する。
複数のデータセット(LEVIR-CD, WHU-CD, DSIFN, SECOND)にまたがる大規模な実験により、我々の手法は高い計算効率で2.13\%から9.75\%の改善を達成し、最先端のアプローチを一貫して上回ることを示した。
コードはhttps://github.com/Funny0101/ReA-OVCDで公開されている。
関連論文リスト
- Hierarchical Consistency Learning for Test-time Adaptation in Camouflage Perception [50.278200968044665]
カモフラージュされた物体検出(COD)は、物理的属性を通して背景から最小限の知覚差を示すターゲットをローカライズすることを目的としている。
既存のメソッドは、静的なTrain-then-freezeパラダイムによって制約されており、ドメインの剛性と依存性のアノテーションに悩まされている。
動的表現再構成のためのテスト時間適応を統合した階層的一貫性学習フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-25T09:57:46Z) - MoASE++: Mixture of Activation Sparsity Experts with Domain-Adaptive On-policy Distillation for Continual Test Time Adaptation [65.068801413044]
連続的なテスト時間適応は、非定常な未ラベルのターゲットストリームにソース予測モデルを適用する。
ドメインに依存しない構造をドメイン固有のテクスチャから切り離す。
論文 参考訳(メタデータ) (2026-05-18T01:52:12Z) - ChangeFlow -- Latent Rectified Flow for Change Detection in Remote Sensing [0.0]
ChangeFlowは、修正フローを通じて潜在空間における変更マスクの合成として、変更検出を再構成する生成フレームワークである。
平均F1は80.4%で、前回のベストメソッドよりも平均1.3ポイント改善されている。
論文 参考訳(メタデータ) (2026-05-14T20:04:16Z) - Reward-Guided Semantic Evolution for Test-time Adaptive Object Detection [82.2968697030677]
Grounding DINOのような視覚言語モデル(VLM)を用いたオープン語彙オブジェクト検出は、テスト時間分布シフト時の性能劣化に悩まされる。
Reward-Guided Semantic Evolution (RGSE) は、テスト時にテキストの埋め込みを直接洗練するトレーニング不要のフレームワークである。
論文 参考訳(メタデータ) (2026-05-06T06:17:41Z) - Back to Source: Open-Set Continual Test-Time Adaptation via Domain Compensation [18.70132691409063]
Test-Time Adaptationは、推論時間におけるトレーニングとテストドメイン間の分散シフトを軽減することを目的としている。
ドメインとセマンティックシフトの結合は、しばしば特徴空間を崩壊させ、分類とアウト・オブ・ディストリビューションの検出の両方を著しく劣化させる。
ドメイン適応とOOD検出を相乗的で閉ループで堅牢に行う軽量かつ効果的なフレームワークであるDOCOを提案する。
論文 参考訳(メタデータ) (2026-04-23T15:29:29Z) - CoRegOVCD: Consistency-Regularized Open-Vocabulary Change Detection [16.119542774408597]
オープン語彙変化検出(OVCD)は、クエリされた概念の変化マスクを求める。
RegOVCDは、概念固有の変化を後続の相違として再構成する、トレーニング不要のフレームワークである。
CoRegOVCDは、最強のトレーニングフリーベースラインを2.24F1$_Cポイントから4.98F1$_Cポイントまで継続的に改善している。
論文 参考訳(メタデータ) (2026-04-02T15:28:29Z) - UniVCD: A New Method for Unsupervised Change Detection in the Open-Vocabulary Era [0.0]
変化検出(CD)は、多時間観測によるシーン変化を特定し、都市開発や環境モニタリングに広く利用されている。
既存のCD手法の多くは教師あり学習に依存しており、パフォーマンスはデータセットに依存し、高いアノテーションコストがかかる。
凍ったSAM2とCLIP上に構築された教師なしのオープン語彙変化検出手法Unified Open-Vocabulary Change Detection (UniVCD)を提案する。
論文 参考訳(メタデータ) (2025-12-15T08:42:23Z) - PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは、ポイントクラウドマスマスキングオートエンコーダのグローバルな特徴表現を強化する。
本研究では,ネットワークが識別的表現を保ちながら,よりリッチな変換キューをキャプチャできる新たな損失を提案する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - Coarse-to-Fine Proposal Refinement Framework for Audio Temporal Forgery Detection and Localization [60.899082019130766]
本稿では、フレームレベル検出ネットワーク(FDN)と、音声の時間的偽造検出とローカライゼーションのための改良ネットワーク(PRN)を提案する。
FDNは、偽のフレーム間で情報的不整合の手がかりを抽出し、偽の領域を大まかに示すのに有用な識別的特徴を得る。
PRNは、FDNから派生した粗粒度の提案を洗練するために、信頼スコアと回帰オフセットを予測する責任がある。
論文 参考訳(メタデータ) (2024-07-23T15:07:52Z) - Diagnosing and Rectifying Fake OOD Invariance: A Restructured Causal
Approach [51.012396632595554]
不変表現学習(IRL)は、不変因果的特徴から環境から切り離されたラベルへの予測を促進する。
最近の理論的結果は、IRLによって回復されたいくつかの因果的特徴は、訓練環境ではドメイン不変のふりをするが、目に見えない領域では失敗する。
本研究では,RS-SCMに関する条件付き相互情報に基づく手法を開発し,その効果を巧みに補正する。
論文 参考訳(メタデータ) (2023-12-15T12:58:05Z) - Align, Perturb and Decouple: Toward Better Leverage of Difference
Information for RSI Change Detection [24.249552791014644]
変化検出は、リモートセンシング画像(RSI)解析において広く採用されている手法である。
そこで我々は,アライメント,摂動,デカップリングといった差分情報を完全に活用するための一連の操作を提案する。
論文 参考訳(メタデータ) (2023-05-30T03:39:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。