論文の概要: On the Challenges of Open World Recognitionunder Shifting Visual Domains
- arxiv url: http://arxiv.org/abs/2107.04461v1
- Date: Fri, 9 Jul 2021 14:25:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-12 13:39:19.450146
- Title: On the Challenges of Open World Recognitionunder Shifting Visual Domains
- Title(参考訳): 視覚領域の変遷に伴うオープンワールド認識の課題について
- Authors: Dario Fontanel, Fabio Cermelli, Massimiliano Mancini, Barbara Caputo
- Abstract要約: 本研究では,Open World Recognition (OWR)アルゴリズムがドメインシフトの下で有効かどうかを検討する。
OWRは、初期トレーニングセットに存在するセマンティック制限を破ることのできるシステムを開発することを目標としている。
解析の結果, この劣化は領域一般化手法とOWRの結合によってわずかに緩和されることがわかった。
- 参考スコア(独自算出の注目度): 23.999211737485812
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robotic visual systems operating in the wild must act in unconstrained
scenarios, under different environmental conditions while facing a variety of
semantic concepts, including unknown ones. To this end, recent works tried to
empower visual object recognition methods with the capability to i) detect
unseen concepts and ii) extended their knowledge over time, as images of new
semantic classes arrive. This setting, called Open World Recognition (OWR), has
the goal to produce systems capable of breaking the semantic limits present in
the initial training set. However, this training set imposes to the system not
only its own semantic limits, but also environmental ones, due to its bias
toward certain acquisition conditions that do not necessarily reflect the high
variability of the real-world. This discrepancy between training and test
distribution is called domain-shift. This work investigates whether OWR
algorithms are effective under domain-shift, presenting the first benchmark
setup for assessing fairly the performances of OWR algorithms, with and without
domain-shift. We then use this benchmark to conduct analyses in various
scenarios, showing how existing OWR algorithms indeed suffer a severe
performance degradation when train and test distributions differ. Our analysis
shows that this degradation is only slightly mitigated by coupling OWR with
domain generalization techniques, indicating that the mere plug-and-play of
existing algorithms is not enough to recognize new and unknown categories in
unseen domains. Our results clearly point toward open issues and future
research directions, that need to be investigated for building robot visual
systems able to function reliably under these challenging yet very real
conditions. Code available at
https://github.com/DarioFontanel/OWR-VisualDomains
- Abstract(参考訳): 野生で動作しているロボット視覚システムは、異なる環境条件下で、未知の環境を含む様々な意味概念に直面しながら、制約のないシナリオで行動しなければならない。
この目的のために、近年の研究では、視覚的オブジェクト認識手法をi)見知らぬ概念を検出し、i)新しいセマンティッククラスの画像が到着するにつれて、その知識を時間とともに拡張しようと試みている。
Open World Recognition (OWR)と呼ばれるこの設定は、初期トレーニングセットに存在するセマンティック制限を破ることのできるシステムを開発することを目的としている。
しかしながら、このトレーニングセットは、実世界の高変動を必ずしも反映しない特定の取得条件に対するバイアスのため、システム自体の意味的限界だけでなく、環境的な制約も課している。
このトレーニングとテスト分布の相違をドメインシフトと呼ぶ。
本研究では、OWRアルゴリズムがドメインシフトの下で有効であるかどうかを調査し、OWRアルゴリズムの性能をドメインシフトなしで正確に評価するための最初のベンチマーク設定を示す。
次に、このベンチマークを用いて様々なシナリオの分析を行い、既存のOWRアルゴリズムが、列車とテストの分布が異なる場合、いかに深刻な性能劣化を経験しているかを示す。
解析の結果,この劣化はOWRと領域一般化手法の結合によってわずかに緩和されることが示され,既存のアルゴリズムのプラグアンドプレイだけでは未知の領域における新しいカテゴリや未知のカテゴリを認識するには不十分であることが示唆された。
本研究は,ロボット視覚システムの構築において,これらの課題に対して,極めて現実的な条件下で確実に機能するために必要なオープンな課題と今後の研究方向性を,明らかに示している。
https://github.com/DarioFontanel/OWR-VisualDomainsで利用可能なコード
関連論文リスト
- Generalize or Detect? Towards Robust Semantic Segmentation Under Multiple Distribution Shifts [56.57141696245328]
斬新なクラスとドメインの両方が存在するようなオープンワールドシナリオでは、理想的なセグメンテーションモデルは安全のために異常なクラスを検出する必要がある。
既存の方法はドメインレベルとセマンティックレベルの分散シフトを区別するのに苦労することが多い。
論文 参考訳(メタデータ) (2024-11-06T11:03:02Z) - GeneralAD: Anomaly Detection Across Domains by Attending to Distorted Features [68.14842693208465]
GeneralADは、意味的、ほぼ分布的、産業的設定で動作するように設計された異常検出フレームワークである。
本稿では,ノイズ付加やシャッフルなどの簡単な操作を施した自己教師付き異常生成モジュールを提案する。
提案手法を10のデータセットに対して広範囲に評価し,6つの実験結果と,残りの6つの実験結果を得た。
論文 参考訳(メタデータ) (2024-07-17T09:27:41Z) - VALUED -- Vision and Logical Understanding Evaluation Dataset [1.8876415010297893]
我々は20,000$+$の注釈付き画像と関連するルールセットからなるVALUEデータセットを提案する。
キュレートされたルールセットは許容可能な予測セットをかなり制約し、キーセマンティック能力を探索するために設計されている。
我々は,この課題におけるアートビジョンモデルの人気と現状を分析し,標準的な測定値の性能は高いが,不整合性のある結果が多数存在することを示す。
論文 参考訳(メタデータ) (2023-11-21T13:52:31Z) - Proposal-Level Unsupervised Domain Adaptation for Open World Unbiased
Detector [35.334125159092025]
教師なしドメイン適応の下でタスクを再定式化することで、偏りのないフォアグラウンド予測器を構築する。
我々は,ドメイン不変のフォアグラウンド機能に基づいて予測器を学習するために,単純で効果的な自己学習手法を採用する。
我々のアプローチのパイプラインは、OWOD評価によって実証的に検証された様々な検出フレームワークやUDA手法に適応することができる。
論文 参考訳(メタデータ) (2023-11-04T07:46:45Z) - Activate and Reject: Towards Safe Domain Generalization under Category
Shift [71.95548187205736]
カテゴリーシフト(DGCS)下における領域一般化の実践的問題について検討する。
未知のクラスサンプルを同時に検出し、ターゲットドメイン内の既知のクラスサンプルを分類することを目的としている。
従来のDGと比較すると,1)ソースクラスのみを用いたトレーニングにおいて,未知の概念を学習する方法,2)ソーストレーニングされたモデルを未知の環境に適応する方法,の2つの新しい課題に直面している。
論文 参考訳(メタデータ) (2023-10-07T07:53:12Z) - UDTIRI: An Online Open-Source Intelligent Road Inspection Benchmark
Suite [21.565438268381467]
このベンチマークスイートで公開された最初のオンラインコンペである道路穴検出タスクを紹介します。
我々のベンチマークは、最先端のオブジェクト検出、セマンティックセグメンテーション、インスタンスセグメンテーションネットワークの体系的かつ徹底的な評価を提供する。
多様な道路条件をより包括的に理解したアルゴリズムを提供することで、未解決の可能性を解き明かそうとしている。
論文 参考訳(メタデータ) (2023-04-18T09:13:52Z) - CoDEPS: Online Continual Learning for Depth Estimation and Panoptic
Segmentation [28.782231314289174]
深層学習に基づく単眼深度推定とパノプティックセグメンテーションのための連続学習をオンラインで導入する。
そこで本研究では,パノプティカルセグメンテーションに適応する擬似ラベルを生成するための新しいドメイン混合手法を提案する。
我々は,固定サイズのリプレイバッファを構築するためのサンプリング戦略を活用することで,ロボットシステムの限られたストレージ容量に明示的に対処する。
論文 参考訳(メタデータ) (2023-03-17T17:31:55Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z) - Anomaly Detection by One Class Latent Regularized Networks [36.67420338535258]
近年,GANに基づく半教師付きジェネレーティブ・アドバイザリアル・ネットワーク(GAN)手法が,異常検出タスクで人気を集めている。
遅延特徴空間でトレーニングデータの基盤となる構造を捕捉する新しい対角デュアルオートエンコーダネットワークを提案する。
実験の結果,MNISTおよびCIFAR10データセットおよびGTSRB停止信号データセットの最先端結果が得られた。
論文 参考訳(メタデータ) (2020-02-05T02:21:52Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。