論文の概要: Boosting Deep Open World Recognition by Clustering
- arxiv url: http://arxiv.org/abs/2004.13849v2
- Date: Mon, 30 Nov 2020 09:35:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-11 19:14:27.309545
- Title: Boosting Deep Open World Recognition by Clustering
- Title(参考訳): クラスタリングによる深いオープンワールド認識の促進
- Authors: Dario Fontanel, Fabio Cermelli, Massimiliano Mancini, Samuel Rota
Bul\`o, Elisa Ricci, Barbara Caputo
- Abstract要約: 我々は、新たな損失定式化により、ディープ・オープンな世界認識アルゴリズムの性能を高める方法を示す。
本研究では,グローバルな1つの閾値を推定するのではなく,クラス固有の拒絶閾値を学習する戦略を提案する。
RGB-D ObjectとCore50の実験は、我々のアプローチの有効性を示している。
- 参考スコア(独自算出の注目度): 37.5993398894786
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While convolutional neural networks have brought significant advances in
robot vision, their ability is often limited to closed world scenarios, where
the number of semantic concepts to be recognized is determined by the available
training set. Since it is practically impossible to capture all possible
semantic concepts present in the real world in a single training set, we need
to break the closed world assumption, equipping our robot with the capability
to act in an open world. To provide such ability, a robot vision system should
be able to (i) identify whether an instance does not belong to the set of known
categories (i.e. open set recognition), and (ii) extend its knowledge to learn
new classes over time (i.e. incremental learning). In this work, we show how we
can boost the performance of deep open world recognition algorithms by means of
a new loss formulation enforcing a global to local clustering of class-specific
features. In particular, a first loss term, i.e. global clustering, forces the
network to map samples closer to the class centroid they belong to while the
second one, local clustering, shapes the representation space in such a way
that samples of the same class get closer in the representation space while
pushing away neighbours belonging to other classes. Moreover, we propose a
strategy to learn class-specific rejection thresholds, instead of heuristically
estimating a single global threshold, as in previous works. Experiments on
RGB-D Object and Core50 datasets show the effectiveness of our approach.
- Abstract(参考訳): 畳み込みニューラルネットワークはロボットビジョンに大きな進歩をもたらしたが、その能力は、認識すべき意味概念の数が利用可能なトレーニングセットによって決定されるクローズドワールドシナリオに限られることが多い。
実世界に存在するすべての意味概念を単一のトレーニングセットで捉えることは事実上不可能であるため、我々のロボットにオープンワールドで行動する能力を持たせることで、クローズドワールドの仮定を破る必要がある。
そのような能力を実現するために、ロボットビジョンシステムは
(i)あるインスタンスが既知のカテゴリ(例えば、オープンセット認識)の集合に属していないかどうかを識別し、
(ii)その知識を時間とともに新しい授業(即興学習)を学ぶために拡張する。
本稿では,クラス固有機能のグローバルからローカルへのクラスタリングを強制する新たな損失定式化によって,深いオープンワールド認識アルゴリズムの性能を向上させる方法を示す。
特に、第1の損失項、すなわちグローバルクラスタリング(英語版)は、ネットワークにそれらの属するクラスセントロイドに近いサンプルをマッピングさせ、第2の損失項である局所クラスタリング(英語版)は、同じクラスのサンプルが他のクラスに属する隣人をプッシュしながら表現空間に近づくように表現空間を形成する。
さらに,先行研究のように,単一のグローバルしきい値をヒューリスティックに推定するのではなく,クラス固有の拒絶しきい値を学ぶ戦略を提案する。
RGB-D ObjectとCore50データセットの実験は、我々のアプローチの有効性を示している。
関連論文リスト
- LoDisc: Learning Global-Local Discriminative Features for
Self-Supervised Fine-Grained Visual Recognition [18.442966979622717]
本稿では,微妙な局所的きめ細かい特徴学習をグローバルな自己教師付きコントラスト学習に取り入れる。
局所的識別(LoDisc)と呼ばれる新しいプリテキストタスクは、局所的な中心領域に対する自己教師付きモデルの焦点を明示的に監督するために提案される。
そこで本稿では, 局所識別課題が重要な地域において, きめ細かな手掛かりを効果的に強化し, 画像のきめ細かな特徴表現をさらに洗練させることを実証する。
論文 参考訳(メタデータ) (2024-03-06T21:36:38Z) - Generalized Label-Efficient 3D Scene Parsing via Hierarchical Feature
Aligned Pre-Training and Region-Aware Fine-tuning [55.517000360348725]
本研究は,ラベル付きシーンが極めて限定された場合の3次元シーン理解のためのフレームワークを提案する。
事前学習された視覚言語モデルから新しいカテゴリーの知識を抽出するために,階層的特徴整合型事前学習と知識蒸留戦略を提案する。
室内と屋外の両方で実験を行ったところ、データ効率のよい学習とオープンワールドの複数ショット学習の両方において、我々のアプローチの有効性が示された。
論文 参考訳(メタデータ) (2023-12-01T15:47:04Z) - Learning to Discover and Detect Objects [43.52208526783969]
新たなクラス発見・検出・ローカライゼーション(NCDL)の課題に取り組む。
この設定では、よく観察されるクラスのオブジェクトのラベル付きソースデータセットを仮定する。
検出ネットワークをエンドツーエンドでトレーニングすることにより、さまざまなクラスに対してすべてのリージョン提案を分類することが可能になる。
論文 参考訳(メタデータ) (2022-10-19T17:59:55Z) - Open Long-Tailed Recognition in a Dynamic World [82.91025831618545]
実世界のデータは、しばしば長い尾を持ち、(目に見えないクラスを持つ)オープンな分布を示す。
現実的な認識システムは、多数派(頭)クラスと少数派(尾)クラスの間でバランスを取り、分布を一般化し、見知らぬクラス(オープンクラス)のインスタンスで新規性を認める必要がある。
我々は,Open Long-Tailed Recognition++を,このような自然分布データからの学習として定義し,バランスの取れたテストセット上での分類精度を最適化する。
論文 参考訳(メタデータ) (2022-08-17T15:22:20Z) - Deep face recognition with clustering based domain adaptation [57.29464116557734]
そこで本研究では,ターゲットドメインとソースがクラスを共有しない顔認識タスクを対象とした,クラスタリングに基づく新しいドメイン適応手法を提案する。
本手法は,特徴領域をグローバルに整列させ,その一方で,対象クラスタを局所的に識別することで,識別対象特徴を効果的に学習する。
論文 参考訳(メタデータ) (2022-05-27T12:29:11Z) - Contrastive Learning for Cross-Domain Open World Recognition [17.660958043781154]
進化する能力は、知識が製造者によって注入されるものに限定されない貴重な自律エージェントにとって基本的なものである。
新しいクラスをインクリメンタルに含めるのに適した機能空間を学習し、様々な視覚領域にまたがる知識を捉えることができることを示す。
本手法は,学習エピソードごとの効果的な停止基準を付与し,新たな自己ペースしきい値設定戦略を活用する。
論文 参考訳(メタデータ) (2022-03-17T11:23:53Z) - Bayesian Embeddings for Few-Shot Open World Recognition [60.39866770427436]
埋め込みベースの数ショット学習アルゴリズムをオープンワールド認識設定に拡張する。
当社のフレームワークは,MiniImageNetとTieredImageNetによる数ショット学習データセットのオープンワールド拡張をベンチマークする。
論文 参考訳(メタデータ) (2021-07-29T00:38:47Z) - CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action
Recognition [52.66360172784038]
各インスタンスを個別に最適化するのではなく,すべてのトレーニングサンプルを同時に考慮したクラスタリングモデルを提案する。
提案手法をCLASTERと呼び,すべての標準データセットの最先端性を常に改善することを確認する。
論文 参考訳(メタデータ) (2021-01-18T12:46:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。