論文の概要: Vocabulary-informed Zero-shot and Open-set Learning
- arxiv url: http://arxiv.org/abs/2301.00998v2
- Date: Wed, 4 Jan 2023 02:09:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 12:54:29.738285
- Title: Vocabulary-informed Zero-shot and Open-set Learning
- Title(参考訳): 語彙インフォームドゼロショットとオープンセット学習
- Authors: Yanwei Fu, Xiaomei Wang, Hanze Dong, Yu-Gang Jiang, Meng Wang,
Xiangyang Xue, Leonid Sigal
- Abstract要約: 本稿では,教師付き,ゼロショット,一般化されたゼロショット,オープンセット認識の問題に対処する語彙インフォームド学習を提案する。
具体的には、(教師なしと教師なしの両方)語彙からの距離制約を取り入れた意味多様体に基づく認識のための重み付けされた最大縁フレームワークを提案する。
得られたモデルは、教師付き、ゼロショット、一般化されたゼロショット、および大きなオープンセット認識の改善を示し、Animal with AttributesとImageNetデータセットで最大310Kの語彙を持つ。
- 参考スコア(独自算出の注目度): 128.83517181045815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite significant progress in object categorization, in recent years, a
number of important challenges remain; mainly, the ability to learn from
limited labeled data and to recognize object classes within large, potentially
open, set of labels. Zero-shot learning is one way of addressing these
challenges, but it has only been shown to work with limited sized class
vocabularies and typically requires separation between supervised and
unsupervised classes, allowing former to inform the latter but not vice versa.
We propose the notion of vocabulary-informed learning to alleviate the above
mentioned challenges and address problems of supervised, zero-shot, generalized
zero-shot and open set recognition using a unified framework. Specifically, we
propose a weighted maximum margin framework for semantic manifold-based
recognition that incorporates distance constraints from (both supervised and
unsupervised) vocabulary atoms. Distance constraints ensure that labeled
samples are projected closer to their correct prototypes, in the embedding
space, than to others. We illustrate that resulting model shows improvements in
supervised, zero-shot, generalized zero-shot, and large open set recognition,
with up to 310K class vocabulary on Animal with Attributes and ImageNet
datasets.
- Abstract(参考訳): オブジェクト分類の大幅な進歩にもかかわらず、近年では、ラベル付きデータから学習し、大きな、潜在的にオープンなラベルセット内でオブジェクトクラスを認識する能力など、多くの重要な課題が残っている。
ゼロショット学習はこれらの課題に対処する方法の1つであるが、限られたサイズのクラス語彙でのみ機能することが示されており、通常は教師なしクラスと教師なしクラスを分離する必要がある。
本稿では,上記の課題を軽減し,教師付き,ゼロショット,一般化されたゼロショット,オープンセット認識の問題を統一フレームワークを用いて解決するための語彙非形式学習の概念を提案する。
具体的には、(教師なしおよび教師なし)語彙原子間の距離制約を組み込んだ、意味多様体に基づく認識のための重み付き最大マージンフレームワークを提案する。
距離制約によりラベル付きサンプルは、埋め込み空間において、他のものよりも正しいプロトタイプに近い位置に投影される。
得られたモデルは、教師付き、ゼロショット、一般化されたゼロショット、および大きなオープンセット認識の改善を示し、Animal with AttributesとImageNetデータセットで最大310Kの語彙を持つ。
関連論文リスト
- Towards Realistic Zero-Shot Classification via Self Structural Semantic
Alignment [53.2701026843921]
大規模事前訓練型視覚言語モデル(VLM)はゼロショット分類に有効であることが証明されている。
本稿では,アノテーションではなく,より広い語彙を前提とした,より難易度の高いゼロショット分類(Realistic Zero-Shot Classification)を提案する。
本稿では,ラベルのないデータから構造意味情報を抽出し,同時に自己学習を行う自己構造意味アライメント(S3A)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-24T17:56:46Z) - Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Simple Linguistic Inferences of Large Language Models (LLMs): Blind Spots and Blinds [59.71218039095155]
我々は,ほとんどの人間が自明に感じる単純な推論タスクにおいて,言語理解能力を評価する。
我々は, (i) 文法的に特定された含意, (ii) 不確実性のある明らかな副詞を持つ前提, (iii) 単調性含意を目標とする。
モデルはこれらの評価セットに対して中程度から低い性能を示す。
論文 参考訳(メタデータ) (2023-05-24T06:41:09Z) - Zero-Shot Learning for Joint Intent and Slot Labeling [11.82805641934772]
共同ゼロショットインテント分類とスロットラベリングを有益に行うことができることを示す。
本稿では,単語と文の埋め込み空間を翻訳するNNアーキテクチャについて述べる。
論文 参考訳(メタデータ) (2022-11-29T01:58:25Z) - Zero-Shot Text Classification with Self-Training [8.68603153534916]
ゼロショット分類器を最も確実な予測で微調整することで、幅広いテキスト分類タスクにおいて大幅な性能向上が期待できることを示す。
自己学習は、手元にあるタスクにゼロショットモデルを適用する。
論文 参考訳(メタデータ) (2022-10-31T17:55:00Z) - Analyzing the Limits of Self-Supervision in Handling Bias in Language [52.26068057260399]
我々は、言語モデルが、認識、識別、抽出、言い換えの4つのタスクのセマンティクスをいかにうまく捉えているかを評価する。
分析の結果,言語モデルでは,ジェンダーや政治的アフィリエイトなど,様々なバイアス次元にまたがって,これらのタスクを広範囲にわたって実行することが可能であることが示唆された。
論文 参考訳(メタデータ) (2021-12-16T05:36:08Z) - CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action
Recognition [52.66360172784038]
各インスタンスを個別に最適化するのではなく,すべてのトレーニングサンプルを同時に考慮したクラスタリングモデルを提案する。
提案手法をCLASTERと呼び,すべての標準データセットの最先端性を常に改善することを確認する。
論文 参考訳(メタデータ) (2021-01-18T12:46:24Z) - Linguistically-Enriched and Context-Aware Zero-shot Slot Filling [6.06746295810681]
スロット充填は、現代のタスク指向ダイアログシステムの最も重要な課題の1つです。
新たなドメイン(すなわち、トレーニングの見当たらない)がデプロイ後に出現する可能性がある。
モデルがシームレスに適応し、見えないドメインと見えないドメインの両方からスロットを埋めることは必須である。
論文 参考訳(メタデータ) (2021-01-16T20:18:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。