論文の概要: Segmentation Assisted Incremental Test Time Adaptation in an Open World
- arxiv url: http://arxiv.org/abs/2508.20029v1
- Date: Wed, 27 Aug 2025 16:33:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.706025
- Title: Segmentation Assisted Incremental Test Time Adaptation in an Open World
- Title(参考訳): オープンワールドにおけるインクリメンタルテスト時間適応を支援するセグメンテーション
- Authors: Manogna Sreenivas, Soma Biswas,
- Abstract要約: 動的環境においては、不慣れな物体や分布シフトがしばしば遭遇する。
この作業は、視覚言語モデルのインクリメンタルテスト時間適応(Incrmental Test Time Adaptation of Vision Language Models)に対処する。
本稿では, セグメンテーション支援型アクティブラベリングモジュールSegAssistを提案する。
- 参考スコア(独自算出の注目度): 11.054383308831001
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In dynamic environments, unfamiliar objects and distribution shifts are often encountered, which challenge the generalization abilities of the deployed trained models. This work addresses Incremental Test Time Adaptation of Vision Language Models, tackling scenarios where unseen classes and unseen domains continuously appear during testing. Unlike traditional Test Time Adaptation approaches, where the test stream comes only from a predefined set of classes, our framework allows models to adapt simultaneously to both covariate and label shifts, actively incorporating new classes as they emerge. Towards this goal, we establish a new benchmark for ITTA, integrating single image TTA methods for VLMs with active labeling techniques that query an oracle for samples potentially representing unseen classes during test time. We propose a segmentation assisted active labeling module, termed SegAssist, which is training free and repurposes the segmentation capabilities of VLMs to refine active sample selection, prioritizing samples likely to belong to unseen classes. Extensive experiments on several benchmark datasets demonstrate the potential of SegAssist to enhance the performance of VLMs in real world scenarios, where continuous adaptation to emerging data is essential. Project-page:https://manogna-s.github.io/segassist/
- Abstract(参考訳): 動的環境においては、不慣れなオブジェクトや分布シフトがしばしば遭遇し、デプロイされた訓練されたモデルの一般化能力に挑戦する。
この作業は、視覚言語モデルのインクリメンタルテスト時間適応(Incrmental Test Time Adaptation of Vision Language Models)に対処する。
従来のテスト時間適応アプローチとは異なり、テストストリームは事前に定義されたクラスのセットからのみ提供されます。
そこで我々は,ITTAの新しいベンチマークを構築し,VLMの単一イメージTTAメソッドと,テスト期間中に見つからないクラスを表す可能性のあるサンプルのオラクルを問合せするアクティブラベリング技術を統合する。
そこで本研究では,VLMのセグメンテーション機能を利用したセグメンテーション支援アクティブラベリングモジュールSegAssistを提案する。
いくつかのベンチマークデータセットに対する大規模な実験は、新興データへの継続的適応が不可欠である実世界のシナリオにおいて、VLMのパフォーマンスを向上させるSegAssistの可能性を実証している。
プロジェクトページ:https://manogna-s.github.io/segassist/
関連論文リスト
- Adapting Vision-Language Models Without Labels: A Comprehensive Survey [74.17944178027015]
VLM(Vision-Language Models)は、幅広いタスクにまたがる顕著な一般化機能を示す。
近年,ラベル付きデータに依存しない教師なし適応手法に注目が集まっている。
本稿では,未ラベルの視覚データの可用性と性質に基づく分類法を提案し,既存のアプローチを4つの重要なパラダイムに分類する。
論文 参考訳(メタデータ) (2025-08-07T16:27:37Z) - TAPS : Frustratingly Simple Test Time Active Learning for VLMs [0.0]
テスト時間最適化により、モデルはパラメータをオンザフライで更新することで、推論中に新しいデータに適応できる。
本研究では,不確実なサンプルを適応的にクエリし,動的に更新するテスト時アクティブラーニングフレームワークを提案する。
我々のフレームワークは、自律システムや医療診断などの安全クリティカルなアプリケーションに現実世界を配置するための実用的で効果的なソリューションを提供する。
論文 参考訳(メタデータ) (2025-07-26T18:04:49Z) - Test-Time Adaptation of Vision-Language Models for Open-Vocabulary Semantic Segmentation [18.33878596057853]
テスト時間適応は、画像分類のための視覚言語モデルの文脈に広く関心を集めている。
本稿では,テスト時間中にセグメンテーションに適応する新しいTTA手法を提案する。
当社のアプローチは,任意のセグメンテーションネットワークのプラグアンドプレイとして使用することができ,追加のトレーニングデータやラベルは必要とせず,単一のテストサンプルでも有効である。
論文 参考訳(メタデータ) (2025-05-28T00:24:47Z) - Task Consistent Prototype Learning for Incremental Few-shot Semantic Segmentation [20.49085411104439]
Incrmental Few-Shot Semantic (iFSS)は、新しいクラスにおけるセグメンテーション能力を継続的に拡張するモデルを必要とするタスクに取り組む。
本研究では,メタラーニングに基づくプロトタイプ手法を導入し,モデルに事前知識を保ちながら,迅速な適応方法の学習を促す。
PASCALとCOCOベンチマークに基づいて構築されたiFSSデータセットの実験は、提案手法の高度な性能を示している。
論文 参考訳(メタデータ) (2024-10-16T23:42:27Z) - Learn from the Learnt: Source-Free Active Domain Adaptation via Contrastive Sampling and Visual Persistence [60.37934652213881]
ドメイン適応(DA)は、ソースドメインから関連するターゲットドメインへの知識伝達を容易にする。
本稿では、ソースデータフリーなアクティブドメイン適応(SFADA)という実用的なDAパラダイムについて検討する。
本稿では,学習者学習(LFTL)というSFADAの新たなパラダイムを紹介し,学習した学習知識を事前学習モデルから活用し,余分なオーバーヘッドを伴わずにモデルを積極的に反復する。
論文 参考訳(メタデータ) (2024-07-26T17:51:58Z) - Efficient Open Set Single Image Test Time Adaptation of Vision Language Models [15.621092104244003]
動的で現実世界の環境にモデルを適応させることは、ディープラーニングにおける重要な課題である。
動的に更新された機能バンクを利用して信頼性の高いテストサンプルを識別する新しいフレームワークであるROSITAを提案する。
このアプローチは、未知のサンプルを拒絶しながら、既知のクラスに対するドメインシフトにモデルを効果的に適用する。
論文 参考訳(メタデータ) (2024-06-01T16:21:42Z) - Few-Shot Class-Incremental Learning by Sampling Multi-Phase Tasks [59.12108527904171]
モデルは新しいクラスを認識し、古いクラスに対する差別性を維持すべきである。
古いクラスを忘れずに新しいクラスを認識するタスクは、FSCIL ( few-shot class-incremental Learning) と呼ばれる。
我々は,LearnIng Multi-phase Incremental Tasks (LIMIT) によるメタラーニングに基づくFSCILの新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2022-03-31T13:46:41Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - Unsupervised Domain Adaptation for Spatio-Temporal Action Localization [69.12982544509427]
S時間動作の局所化はコンピュータビジョンにおいて重要な問題である。
本稿では、エンドツーエンドの教師なしドメイン適応アルゴリズムを提案する。
空間的特徴と時間的特徴を別々にあるいは共同的に適応した場合に,顕著な性能向上が達成できることを示す。
論文 参考訳(メタデータ) (2020-10-19T04:25:10Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。