Fugu-MT 論文翻訳(概要): Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence

論文の概要: Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence

arxiv url: http://arxiv.org/abs/2501.05555v2
Date: Thu, 16 Jan 2025 16:00:37 GMT
ステータス: 翻訳完了
システム内更新日: 2025-01-17 14:35:15.056164
Title: Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence
Title（参考訳）: 視覚対応の導入によるゼロショットオブジェクトレベル変化検出の改善
Authors: Hung Huy Nguyen, Pooyan Rahmanzadehgervi, Long Mai, Anh Totti Nguyen,
Abstract要約: 既存の変更検出アプローチには3つの大きな制限がある。本稿では,変化検出精度を向上させるために,学習中の変化対応を利用した新しい手法を提案する。また、推定ホモグラフィーとハンガリーのアルゴリズムを用いて検出された変化のペア間の対応を予測した最初の人物である。
参考スコア（独自算出の注目度）: 13.479857959236345
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Detecting object-level changes between two images across possibly different views is a core task in many applications that involve visual inspection or camera surveillance. Existing change-detection approaches suffer from three major limitations: (1) lack of evaluation on image pairs that contain no changes, leading to unreported false positive rates; (2) lack of correspondences (i.e., localizing the regions before and after a change); and (3) poor zero-shot generalization across different domains. To address these issues, we introduce a novel method that leverages change correspondences (a) during training to improve change detection accuracy, and (b) at test time, to minimize false positives. That is, we harness the supervision labels of where an object is added or removed to supervise change detectors, improving their accuracy over previous work by a large margin. Our work is also the first to predict correspondences between pairs of detected changes using estimated homography and the Hungarian algorithm. Our model demonstrates superior performance over existing methods, achieving state-of-the-art results in change detection and change correspondence accuracy across both in-distribution and zero-shot benchmarks.
Abstract（参考訳）: 異なる視点で2つの画像間のオブジェクトレベルの変化を検出することは、視覚検査やカメラ監視を含む多くのアプリケーションの中核的なタスクである。既存の変化検出アプローチには、(1)変化を含まない画像対の評価の欠如、(2)未報告の偽陽性率、(2)対応の欠如(例えば、変更前後の領域のローカライズ)、(3)異なる領域にわたるゼロショットの一般化の欠如、の3つの大きな制限がある。これらの課題に対処するために,変化対応を利用した新しい手法を提案する。 (a) 変化検出精度を向上させるための訓練中、 b) テスト時に偽陽性を最小化する。すなわち、オブジェクトの追加や削除の場所の監督ラベルを利用して、変更検出を監督し、以前の作業よりも大きなマージンで精度を向上する。我々の研究は、推定されたホモグラフィーとハンガリーのアルゴリズムを用いて検出された変化のペア間の対応を予測する最初のものである。本モデルでは,既存手法よりも優れた性能を示し,非分布ベンチマークとゼロショットベンチマークの両方において,変化検出と対応精度の変化を実現する。

関連論文リスト

Leveraging Geometric Priors for Unaligned Scene Change Detection [53.523333385654546]
Unaligned Scene Change Detectionは、視点アライメントを仮定することなく、異なるタイミングでキャプチャされた画像ペア間のシーン変化を検出することを目的としている。非整合SCDの中核的課題に対処するために、初めて幾何学的事前を導入する。視覚基盤モデルの強力な表現とそれらを統合した学習自由フレームワークを提案する。
論文参考訳（メタデータ） (2025-09-14T14:31:08Z)
SChanger: Change Detection from a Semantic Change and Spatial Consistency Perspective [0.6749750044497732]
我々は,データ不足問題に対処するため,セマンティック・チェンジ・ネットワーク(SCN)と呼ばれる微調整戦略を開発した。両画像間の変化位置は空間的に同一であり,空間的整合性(空間的整合性)の概念である。これにより、マルチスケールな変更のモデリングが強化され、変更検出セマンティクスの基盤となる関係を捉えるのに役立ちます。
論文参考訳（メタデータ） (2025-03-26T17:15:43Z)
Detect Changes like Humans: Incorporating Semantic Priors for Improved Change Detection [41.80924135539708]
本稿では,セマンティック・アウェア・チェンジ検出ネットワーク,すなわちSA-CDNetを提案する。人間の視覚パラダイムにインスパイアされた新しいデュアルストリーム特徴デコーダは、変化を区別するために導出される。また,ランドスケープのセマンティック理解を高めるために,単一時間的セマンティック事前学習戦略を設計する。
論文参考訳（メタデータ） (2024-12-22T08:27:15Z)
Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文参考訳（メタデータ） (2024-10-31T13:13:32Z)
Show Me What and Where has Changed? Question Answering and Grounding for Remote Sensing Change Detection [82.65760006883248]
我々は,CDQAG (Change Detection Question Answering and Grounding) という新しいタスクを導入する。 CDQAGは、解釈可能なテキスト回答と直感的な視覚的証拠を提供することで、従来の変更検出タスクを拡張している。 QAG-360Kと呼ばれる最初のCDQAGベンチマークデータセットを構築し、360K以上の質問、テキスト回答、およびそれに対応する高品質な視覚マスクを含む。
論文参考訳（メタデータ） (2024-10-31T11:20:13Z)
ZeroSCD: Zero-Shot Street Scene Change Detection [2.3020018305241337]
Scene Change Detectionは、コンピュータビジョンとロボティクスにおいて難しいタスクである。従来の変更検出方法は、これらのイメージペアを入力として、変更を見積もるトレーニングモデルに依存しています。我々は,ゼロショットシーン変化検出フレームワークであるZeroSCDを提案する。
論文参考訳（メタデータ） (2024-09-23T17:53:44Z)
Detection-Driven Object Count Optimization for Text-to-Image Diffusion Models [54.641726517633025]
本稿では,事前学習したオブジェクトカウント技術とオブジェクト検出器を用いて生成をガイドする新しいフレームワークを提案する。まず、完全生成画像上で計算された外ループ損失を用いてカウントトークンを最適化する。第二に、視点や比例シフトによる誤差を補正する検出駆動スケーリング項を導入する。
論文参考訳（メタデータ） (2024-08-21T15:51:46Z)
Segment Any Change [64.23961453159454]
本稿では、ゼロショット予測と、見えない変更タイプやデータ分布の一般化をサポートする新しいタイプの変更検出モデルを提案する。 AnyChangeは、トレーニング不要適応法、バイテンポラルラテントマッチングを通じてSAM(Se segment Any Model)上に構築されます。また、AnyChangeのゼロショットオブジェクト中心の変更検出機能を有効にするためのポイントクエリ機構を提案する。
論文参考訳（メタデータ） (2024-02-02T07:17:39Z)
Cal-DETR: Calibrated Detection Transformer [67.75361289429013]
本稿では,Deformable-DETR,UP-DETR,DINOのキャリブレーション検出トランス(Cal-DETR)のメカニズムを提案する。我々は、不確実性を利用してクラスロジットを変調する不確実性誘導ロジット変調機構を開発する。その結果、Cal-DETRは、ドメイン内およびドメイン外の両方を校正する競合する列車時間法に対して有効であることがわかった。
論文参考訳（メタデータ） (2023-11-06T22:13:10Z)
Reducing False Alarms in Video Surveillance by Deep Feature Statistical Modeling [16.311150636417256]
我々は, 深部特徴の高次元統計的モデリングに基づいて, 弱教師付きa-コントラリオ検証法を開発した。実験結果から,提案したa-contrarioバリデーションにより,画素レベルとオブジェクトレベルの偽アラームの回数を大幅に削減できることがわかった。
論文参考訳（メタデータ） (2023-07-09T12:37:17Z)
Three ways to improve feature alignment for open vocabulary detection [88.65076922242184]
ゼロショットオープンボキャブラリ検出の鍵となる問題は、視覚的特徴とテキスト的特徴の整合性である。以前のアプローチでは、特徴ピラミッドと検出ヘッドをゼロからトレーニングし、事前トレーニング中に確立された視覚テキストの特徴アライメントを壊す。本稿では,これらの問題を緩和する3つの方法を提案する。まず,テキストの埋め込みを強化するための簡単なスキームを用いて,学習中に見られる少数のクラスへの過度な適合を防止する。次に、特徴ピラミッドネットワークと検出ヘッドをトレーニング可能なショートカットを含むように変更する。最後に、より大きなコーパスを活用するために、自己学習アプローチが使用される。
論文参考訳（メタデータ） (2023-03-23T17:59:53Z)
Self-Pair: Synthesizing Changes from Single Source for Object Change Detection in Remote Sensing Imagery [6.586756080460231]
本研究では,2つの空間的無関係な画像を用いて変化検出器をトレーニングする。本稿では,画像の残像としての操作が,変化検出の性能に不可欠であることを示す。本手法は, 単一時間監視に基づく既存手法よりも優れる。
論文参考訳（メタデータ） (2022-12-20T13:26:42Z)
Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。提案手法は,同数の視線シフトに対してF1スコアを2～3ポイント増加させる。
論文参考訳（メタデータ） (2022-08-24T14:59:28Z)
DASNet: Dual attentive fully convolutional siamese networks for change detection of high resolution satellite images [17.839181739760676]
研究の目的は、関心の変化情報を識別し、無関係な変更情報を干渉要因としてフィルタリングすることである。近年、ディープラーニングの台頭により、変化検出のための新しいツールが提供され、目覚ましい結果が得られた。我々は,高解像度画像における変化検出のための新しい手法,すなわち,二重注意型完全畳み込みシームズネットワーク(DASNet)を提案する。
論文参考訳（メタデータ） (2020-03-07T16:57:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。