論文の概要: RAIS: Robust and Accurate Interactive Segmentation via Continual
Learning
- arxiv url: http://arxiv.org/abs/2210.10984v1
- Date: Thu, 20 Oct 2022 03:05:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 14:49:17.410383
- Title: RAIS: Robust and Accurate Interactive Segmentation via Continual
Learning
- Title(参考訳): rais: 連続学習によるロバストで正確な対話的セグメンテーション
- Authors: Yuying Hao and Yi Liu and Juncai Peng and Haoyi Xiong and Guowei Chen
and Shiyu Tang and Zeyu Chen and Baohua Lai
- Abstract要約: 本稿では,対話型セグメンテーションと継続的学習のための堅牢で正確なアーキテクチャであるRAISを提案する。
テストセットを効率的に学習するために,グローバルパラメータとローカルパラメータを更新するための新しい最適化手法を提案する。
また,リモートセンシングと医用画像のデータセットにおけるロバスト性も示す。
- 参考スコア(独自算出の注目度): 16.382862088005087
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Interactive image segmentation aims at segmenting a target region through a
way of human-computer interaction. Recent works based on deep learning have
achieved excellent performance, while most of them focus on improving the
accuracy of the training set and ignore potential improvement on the test set.
In the inference phase, they tend to have a good performance on similar domains
to the training set, and lack adaptability to domain shift, so they require
more user efforts to obtain satisfactory results. In this work, we propose
RAIS, a robust and accurate architecture for interactive segmentation with
continuous learning, where the model can learn from both train and test data
sets. For efficient learning on the test set, we propose a novel optimization
strategy to update global and local parameters with a basic segmentation module
and adaptation module, respectively. Moreover, we perform extensive experiments
on several benchmarks that show our method can handle data distribution shifts
and achieves SOTA performance compared with recent interactive segmentation
methods. Besides, our method also shows its robustness in the datasets of
remote sensing and medical imaging where the data domains are completely
different between training and testing.
- Abstract(参考訳): インタラクティブなイメージセグメンテーションは、人間とコンピュータのインタラクションを通じてターゲット領域をセグメンテーションすることを目的としている。
ディープラーニングに基づく最近の研究は、トレーニングセットの精度向上とテストセットの潜在的な改善の無視に焦点を当てながら、優れたパフォーマンスを達成している。
推論フェーズでは、トレーニングセットと同じようなドメインで優れたパフォーマンスを示し、ドメインシフトへの適応性が欠如しているため、満足な結果を得るためにより多くのユーザ努力が必要になる。
本研究では,対話型セグメンテーションと連続学習を併用した堅牢で正確なアーキテクチャであるRAISを提案する。
テストセット上での効率的な学習のために,グローバルパラメータとローカルパラメータをそれぞれ基本セグメンテーションモジュールと適応モジュールで更新する新しい最適化戦略を提案する。
さらに,本手法がデータ分散シフトを処理可能であり,最近の対話的セグメンテーション手法と比較してSOTA性能が向上することを示すベンチマーク実験も行った。
さらに,データ領域がトレーニングとテストで完全に異なるリモートセンシングと医療画像のデータセットにおいても,その堅牢性を示す。
関連論文リスト
- PiPa++: Towards Unification of Domain Adaptive Semantic Segmentation via Self-supervised Learning [34.786268652516355]
教師なしドメイン適応セグメンテーションは、それらのドメインのラベル付きデータに頼ることなく、ターゲットドメイン上のモデルのセグメンテーション精度を向上させることを目的としている。
ソースドメイン(ラベル付きデータが利用可能な場所)とターゲットドメイン(ラベルなしデータのみが存在する場所)の特徴表現の整合を図る。
論文 参考訳(メタデータ) (2024-07-24T08:53:29Z) - Interactive segmentation in aerial images: a new benchmark and an open
access web-based tool [2.729446374377189]
近年,コンピュータビジョンにおける対話型セマンティックセマンティックセマンティクスは,人間とコンピュータの相互作用セマンティクスの理想的な状態を実現している。
本研究の目的は,対話型セグメンテーションモデルのベンチマークにより,対話型セグメンテーションとリモートセンシング分析のギャップを埋めることである。
論文 参考訳(メタデータ) (2023-08-25T04:49:49Z) - Consistency Regularization for Generalizable Source-free Domain
Adaptation [62.654883736925456]
ソースフリードメイン適応(source-free domain adapt, SFDA)は、ソースデータセットにアクセスすることなく、十分にトレーニングされたソースモデルを未学習のターゲットドメインに適応することを目的としている。
既存のSFDAメソッドは、ターゲットのトレーニングセット上で適用されたモデルを評価し、目に見えないが同一の分散テストセットからデータを無視する。
より一般化可能なSFDA法を開発するための整合正則化フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:45:53Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - IDA: Informed Domain Adaptive Semantic Segmentation [51.12107564372869]
クラスレベルのセグメンテーション性能に基づいてデータを混合する自己学習フレームワークであるDomain Informed Adaptation (IDA) モデルを提案する。
IDAモデルでは、クラスレベルの性能を期待信頼スコア(ECS)によって追跡し、動的スケジュールを用いて異なる領域のデータに対する混合比を決定する。
提案手法は,GTA-Vの都市景観への適応において1.1 mIoU,SynTHIAの都市への適応において0.9 mIoUのマージンで,最先端のUDA-SS法よりも優れる。
論文 参考訳(メタデータ) (2023-03-05T18:16:34Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Beyond Transfer Learning: Co-finetuning for Action Localisation [64.07196901012153]
同時に、複数のアップストリームとダウンストリームのタスクで1つのモデルをトレーニングする。
共ファインタニングは、同じデータ量を使用する場合、従来のトランスファーラーニングよりも優れていることを示す。
さらに、複数のアップストリームデータセットへのアプローチを簡単に拡張して、パフォーマンスをさらに向上する方法も示しています。
論文 参考訳(メタデータ) (2022-07-08T10:25:47Z) - VisDA-2021 Competition Universal Domain Adaptation to Improve
Performance on Out-of-Distribution Data [64.91713686654805]
Visual Domain Adaptation (VisDA) 2021コンペティションは、新しいテストディストリビューションに適応するモデルの能力をテストする。
我々は,新しい視点,背景,モダリティ,品質劣化への適応性を評価する。
厳密なプロトコルを使用してパフォーマンスを計測し、最先端のドメイン適応手法と比較する。
論文 参考訳(メタデータ) (2021-07-23T03:21:51Z) - Towards Adaptive Semantic Segmentation by Progressive Feature Refinement [16.40758125170239]
セグメンテーションネットワークの転送可能性を高めるために,ドメイン逆学習とともに,革新的なプログレッシブな特徴改善フレームワークを提案する。
その結果、ソース・ドメイン・イメージで訓練されたセグメンテーション・モデルは、大幅な性能劣化を伴わずにターゲット・ドメインに転送できる。
論文 参考訳(メタデータ) (2020-09-30T04:17:48Z) - SemI2I: Semantically Consistent Image-to-Image Translation for Domain
Adaptation of Remote Sensing Data [7.577893526158495]
本稿では,新たなデータ拡張手法を提案する。
我々のセマンティックセグメンテーションフレームワークは、まず実際のトレーニングデータからU-netをトレーニングし、次に提案手法によって生成されたテストスタイル化された偽のトレーニングデータに微調整する。
論文 参考訳(メタデータ) (2020-02-14T09:07:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。