論文の概要: Towards Generalizable Scene Change Detection
- arxiv url: http://arxiv.org/abs/2409.06214v1
- Date: Tue, 10 Sep 2024 04:45:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-11 19:00:01.283252
- Title: Towards Generalizable Scene Change Detection
- Title(参考訳): 一般化可能なシーン変化検出に向けて
- Authors: Jaewoo Kim, Uehwan Kim,
- Abstract要約: SCD(Scene Change Detection)は、視覚監視やモバイルロボティクスなどの応用に不可欠である。
現在のSCD法は、トレーニングデータセットの時間的順序と、目に見えない領域での限られた性能に偏っている。
本稿では,GeSCF(Generalizable Scene Change Detection Framework)を紹介する。
- 参考スコア(独自算出の注目度): 4.527270266697462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scene Change Detection (SCD) is vital for applications such as visual surveillance and mobile robotics. However, current SCD methods exhibit a bias to the temporal order of training datasets and limited performance on unseen domains; coventional SCD benchmarks are not able to evaluate generalization or temporal consistency. To tackle these limitations, we introduce a Generalizable Scene Change Detection Framework (GeSCF) in this work. The proposed GeSCF leverages localized semantics of a foundation model without any re-training or fine-tuning -- for generalization over unseen domains. Specifically, we design an adaptive thresholding of the similarity distribution derived from facets of the pre-trained foundation model to generate initial pseudo-change mask. We further utilize Segment Anything Model's (SAM) class-agnostic masks to refine pseudo-masks. Moreover, our proposed framework maintains commutative operations in all settings to ensure complete temporal consistency. Finally, we define new metrics, evaluation dataset, and evaluation protocol for Generalizable Scene Change Detection (GeSCD). Extensive experiments demonstrate that GeSCF excels across diverse and challenging environments -- establishing a new benchmark for SCD performance.
- Abstract(参考訳): SCD(Scene Change Detection)は、視覚監視やモバイルロボティクスなどの応用に不可欠である。
しかし、現在のSCD法は、訓練データセットの時間順と、目に見えない領域での限られた性能に偏りを示しており、コベンショナルSCDベンチマークは一般化や時間整合性を評価することができない。
このような制約に対処するため,本研究では,GeSCF(Generalizable Scene Change Detection Framework)を紹介する。
提案したGeSCFは、未確認のドメインを一般化するために、再トレーニングや微調整を行わずに、ファンデーションモデルのローカライズされたセマンティクスを活用する。
具体的には、事前学習された基礎モデルのファセットから導かれる類似度分布の適応しきい値を設計し、初期擬似変化マスクを生成する。
さらに、Segment Anything Model(SAM)のクラス非依存マスクを用いて擬似マスクを洗練する。
さらに,提案するフレームワークは,時間的整合性を確保するため,すべての設定で可換操作を継続する。
最後に,GeSCD(Generalizable Scene Change Detection)のための新しいメトリクス,評価データセット,評価プロトコルを定義する。
大規模な実験により、GeSCFは多様な、そして困難な環境にまたがって優れており、SCDパフォーマンスの新たなベンチマークを確立している。
関連論文リスト
- Not All Data are Good Labels: On the Self-supervised Labeling for Time Series Forecasting [18.25649205265032]
本稿では,候補データセットを自然に構築することで,時系列データセットを再ラベルする新たな自己教師型アプローチについて検討する。
単純な再構成ネットワークの最適化において、中間体は自己管理パラダイムの擬似ラベルとして使用される。
実世界の11のデータセットに対する実験により、SCAMは様々なバックボーンモデルの性能を一貫して改善することを示した。
論文 参考訳(メタデータ) (2025-02-20T16:29:37Z) - Feature-Space Semantic Invariance: Enhanced OOD Detection for Open-Set Domain Generalization [10.38552112657656]
本稿では、FSI(Feature-space Semantic Invariance)を導入して、オープンセット領域の一般化のための統一的なフレームワークを提案する。
FSIは機能領域内の異なるドメイン間のセマンティック一貫性を維持しており、見えないドメイン内のOODインスタンスをより正確に検出することができる。
また、新しいドメインスタイルやクラスラベルで合成データを生成するために生成モデルを採用し、モデルロバスト性を高めます。
論文 参考訳(メタデータ) (2024-11-11T21:51:45Z) - Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - GM-DF: Generalized Multi-Scenario Deepfake Detection [49.072106087564144]
既存の偽造検出は、通常、単一のドメインでのトレーニングモデルのパラダイムに従う。
本稿では,複数の顔偽造検出データセットを共同で訓練した場合のディープフェイク検出モデルの一般化能力について詳しく検討する。
論文 参考訳(メタデータ) (2024-06-28T17:42:08Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Activate and Reject: Towards Safe Domain Generalization under Category
Shift [71.95548187205736]
カテゴリーシフト(DGCS)下における領域一般化の実践的問題について検討する。
未知のクラスサンプルを同時に検出し、ターゲットドメイン内の既知のクラスサンプルを分類することを目的としている。
従来のDGと比較すると,1)ソースクラスのみを用いたトレーニングにおいて,未知の概念を学習する方法,2)ソーストレーニングされたモデルを未知の環境に適応する方法,の2つの新しい課題に直面している。
論文 参考訳(メタデータ) (2023-10-07T07:53:12Z) - S-Adapter: Generalizing Vision Transformer for Face Anti-Spoofing with Statistical Tokens [45.06704981913823]
Face Anti-Spoofing (FAS) は、スプーフされた顔を表示することによって、顔認識システムに侵入しようとする悪意のある試みを検出することを目的としている。
本稿では,局所的なトークンヒストグラムから局所的な識別や統計情報を収集する新しい統計適応器(S-Adapter)を提案する。
統計的トークンの一般化をさらに改善するために,新しいトークンスタイル正規化(TSR)を提案する。
提案したS-AdapterとTSRは、ゼロショットと少数ショットのクロスドメインテストの両方において、いくつかのベンチマークテストにおいて、最先端の手法よりも優れた、大きなメリットをもたらすことを示した。
論文 参考訳(メタデータ) (2023-09-07T22:36:22Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-10-19T04:25:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。