論文の概要: Knowledge Guided Metric Learning for Few-Shot Text Classification
- arxiv url: http://arxiv.org/abs/2004.01907v1
- Date: Sat, 4 Apr 2020 10:56:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 22:53:14.957942
- Title: Knowledge Guided Metric Learning for Few-Shot Text Classification
- Title(参考訳): 少量テキスト分類のための知識誘導型メトリクス学習
- Authors: Dianbo Sui, Yubo Chen, Binjie Mao, Delai Qiu, Kang Liu and Jun Zhao
- Abstract要約: 我々は,人間の知識を模倣する素早い学習に外部知識を導入することを提案する。
人間の知性に触発され,人間の知識を模倣する素早い学習に外部知識を導入することを提案する。
提案手法は,最新の数ショットのテキスト分類モデルよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 22.832467388279873
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The training of deep-learning-based text classification models relies heavily
on a huge amount of annotation data, which is difficult to obtain. When the
labeled data is scarce, models tend to struggle to achieve satisfactory
performance. However, human beings can distinguish new categories very
efficiently with few examples. This is mainly due to the fact that human beings
can leverage knowledge obtained from relevant tasks. Inspired by human
intelligence, we propose to introduce external knowledge into few-shot learning
to imitate human knowledge. A novel parameter generator network is investigated
to this end, which is able to use the external knowledge to generate relation
network parameters. Metrics can be transferred among tasks when equipped with
these generated parameters, so that similar tasks use similar metrics while
different tasks use different metrics. Through experiments, we demonstrate that
our method outperforms the state-of-the-art few-shot text classification
models.
- Abstract(参考訳): ディープラーニングに基づくテキスト分類モデルのトレーニングは、大量のアノテーションデータに大きく依存しており、取得が困難である。
ラベル付きデータが少ない場合、モデルは十分なパフォーマンスを達成するのに苦労する傾向がある。
しかし、人間は少ない例で新しい分類を非常に効率的に区別することができる。
これは、人間が関連するタスクから得られる知識を活用できるという事実が主な原因である。
人間の知性に触発され,人間の知識を模倣する素早い学習に外部知識を導入することを提案する。
この目的に対して新しいパラメータ生成ネットワークを探索し、外部知識を用いて関係ネットワークパラメータを生成することができる。
メトリクスは、これらの生成されたパラメータを備えたタスク間で転送できるため、同様のタスクは同様のメトリクスを使用し、異なるタスクは異なるメトリクスを使用する。
実験により,本手法が最先端のテキスト分類モデルよりも優れていることを示す。
関連論文リスト
- In-context Learning in Presence of Spurious Correlations [8.055478206164105]
本研究では,突発的特徴を含む分類課題に対して,文脈内学習者を訓練する可能性について検討する。
従来の文脈内学習者の訓練手法は、刺激的な特徴に影響を受けやすいことが判明した。
与えられた分類タスクに対して,そのような学習者を訓練するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-10-04T04:26:36Z) - CSSL-MHTR: Continual Self-Supervised Learning for Scalable Multi-script Handwritten Text Recognition [16.987008461171065]
我々は,手書き文字認識における破滅的な忘れの問題を軽減するために,連続的な自己指導型学習の可能性を探究する。
提案手法は,各タスクにアダプタと呼ばれる中間層を追加し,現在のタスクを学習しながら,前モデルからの知識を効率的に抽出する。
私たちは英語、イタリア語、ロシア語のスクリプトで最先端のパフォーマンスを達成しましたが、タスクごとにいくつかのパラメータしか追加していません。
論文 参考訳(メタデータ) (2023-03-16T14:27:45Z) - Unsupervised Neural Stylistic Text Generation using Transfer learning
and Adapters [66.17039929803933]
応答生成のためのスタイル特化属性を学習するために,モデルパラメータの0.3%しか更新しない新しい転送学習フレームワークを提案する。
我々はPERSONALITY-CAPTIONSデータセットからスタイル固有の属性を学習する。
論文 参考訳(メタデータ) (2022-10-07T00:09:22Z) - Active Learning of Ordinal Embeddings: A User Study on Football Data [4.856635699699126]
人間は本来、未知の類似性関数を使用してラベル付けされていないデータセットのインスタンス間の距離を計測する。
この研究はディープ・メトリック・ラーニングを使用して、大規模なフットボールの軌跡データセットのアノテーションからユーザ定義の類似性関数を学習する。
論文 参考訳(メタデータ) (2022-07-26T07:55:23Z) - An Empirical Investigation of Commonsense Self-Supervision with
Knowledge Graphs [67.23285413610243]
大規模知識グラフから抽出した情報に基づく自己監督は、言語モデルの一般化を改善することが示されている。
本研究では,言語モデルに適用可能な合成データを生成するための知識サンプリング戦略とサイズの影響について検討する。
論文 参考訳(メタデータ) (2022-05-21T19:49:04Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Self-Supervised Visual Representation Learning Using Lightweight
Architectures [0.0]
自己教師付き学習では、マシンによってアノテーションが生成されるデータセットを使用して、プレテキストタスクを解決するためにモデルが訓練される。
我々は、画像データから特徴を抽出する最も顕著な前文タスクを批判的に検討する。
我々は、他の全てのパラメータを均一に保ちながら、様々な自己監督技術の性能について研究する。
論文 参考訳(メタデータ) (2021-10-21T14:13:10Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Combining Feature and Instance Attribution to Detect Artifacts [62.63504976810927]
トレーニングデータアーティファクトの識別を容易にする手法を提案する。
提案手法は,トレーニングデータのアーティファクトの発見に有効であることを示す。
我々は,これらの手法が実際にNLP研究者にとって有用かどうかを評価するために,小規模なユーザスタディを実施している。
論文 参考訳(メタデータ) (2021-07-01T09:26:13Z) - Knowledge-driven Data Construction for Zero-shot Evaluation in
Commonsense Question Answering [80.60605604261416]
本稿では,共通認識課題にまたがるゼロショット質問応答のための新しいニューラルシンボリック・フレームワークを提案する。
言語モデル、トレーニング体制、知識ソース、データ生成戦略のセットを変えて、タスク間の影響を測定します。
個別の知識グラフは特定のタスクに適しているが、グローバルな知識グラフはさまざまなタスクに対して一貫した利得をもたらす。
論文 参考訳(メタデータ) (2020-11-07T22:52:21Z) - Learning from Few Samples: A Survey [1.4146420810689422]
コンピュータビジョン領域における既存の数ショットメタ学習手法について,その手法と評価指標に基づいて検討する。
我々は、これらの技術のための分類法を提供し、それらをデータ拡張、埋め込み、最適化、セマンティクスに基づく学習に分類する。
論文 参考訳(メタデータ) (2020-07-30T14:28:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。