論文の概要: Few-shot Learning for Slot Tagging with Attentive Relational Network
- arxiv url: http://arxiv.org/abs/2103.02333v1
- Date: Wed, 3 Mar 2021 11:24:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-07 02:43:40.106119
- Title: Few-shot Learning for Slot Tagging with Attentive Relational Network
- Title(参考訳): 注意関係ネットワークを用いたスロットタギングのためのFew-shot Learning
- Authors: Cennet Oguz, Ngoc Thang Vu
- Abstract要約: メトリックベース学習は、特にコンピュータビジョンにおいて、少ないショット学習のためのよく知られた手法である。
メトリクスに基づく新しい学習アーキテクチャであるアテンシブネットワークを提案する。
SNIPSの結果は,提案手法が他の最先端のメトリックベース学習法よりも優れていることを示している。
- 参考スコア(独自算出の注目度): 35.624877181332636
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Metric-based learning is a well-known family of methods for few-shot
learning, especially in computer vision. Recently, they have been used in many
natural language processing applications but not for slot tagging. In this
paper, we explore metric-based learning methods in the slot tagging task and
propose a novel metric-based learning architecture - Attentive Relational
Network. Our proposed method extends relation networks, making them more
suitable for natural language processing applications in general, by leveraging
pretrained contextual embeddings such as ELMO and BERT and by using attention
mechanism. The results on SNIPS data show that our proposed method outperforms
other state-of-the-art metric-based learning methods.
- Abstract(参考訳): メトリックベース学習は、特にコンピュータビジョンにおいて、少ないショット学習のためのよく知られた手法である。
近年、多くの自然言語処理アプリケーションで使われているが、スロットタグ付けには使われていない。
本稿では、スロットタグングタスクにおけるメトリックベースの学習方法を検討し、新しいメトリクスベースの学習アーキテクチャ - Attentive Relational Networkを提案する。
本提案手法は,ELMOやBERTなどの事前学習した文脈埋め込みと,注意メカニズムを用いて,自然言語処理アプリケーション全般に適応する関係ネットワークを拡張したものである。
SNIPSデータを用いた結果,提案手法は,他の最先端のメトリックベース学習法よりも優れていた。
関連論文リスト
- Semantic Meta-Split Learning: A TinyML Scheme for Few-Shot Wireless Image Classification [50.28867343337997]
本研究は,TinyMLを用いた無線画像分類のためのセマンティック・コミュニケーション・フレームワークを提案する。
我々は、プライバシ保護を確保しつつ、エンドユーザーによって実行される計算を制限するために分割学習を利用する。
メタ学習は、データ可用性の懸念を克服し、同様のトレーニングされたタスクを利用することで、トレーニングを高速化する。
論文 参考訳(メタデータ) (2024-09-03T05:56:55Z) - Language-guided Skill Learning with Temporal Variational Inference [38.733622157088035]
専門家によるデモンストレーションからスキル発見のためのアルゴリズムを提案する。
以上の結果から,本手法を応用したエージェントが,学習の促進に役立つスキルを発見できることが示唆された。
論文 参考訳(メタデータ) (2024-02-26T07:19:23Z) - Automating Knowledge Acquisition for Content-Centric Cognitive Agents
Using LLMs [0.0]
本稿では,知的エージェントのセマンティックレキシコンにおける新たなエントリの自動学習を支援するために,大規模言語モデル(LLM)技術を利用するシステムについて述べる。
このプロセスは、既存の非トイ辞書と、意味の形式的、存在論的に接地された表現を自然言語文に変換する自然言語生成装置によってブートストラップされる。
論文 参考訳(メタデータ) (2023-12-27T02:31:51Z) - Learning Symbolic Rules over Abstract Meaning Representations for
Textual Reinforcement Learning [63.148199057487226]
本稿では,汎用的な意味一般化とルール誘導システムを組み合わせて,解釈可能なルールをポリシーとして学習するモジュール型 NEuroSymbolic Textual Agent (NESTA) を提案する。
実験の結果,NESTA法は,未確認テストゲームや少ないトレーニングインタラクションから学習することで,深層強化学習技術よりも優れることがわかった。
論文 参考訳(メタデータ) (2023-07-05T23:21:05Z) - Incremental Embedding Learning via Zero-Shot Translation [65.94349068508863]
現在の最先端のインクリメンタル学習手法は、従来の分類ネットワークにおける破滅的な忘れ方問題に取り組む。
ゼロショット変換クラス増分法(ZSTCI)と呼ばれる新しい組込みネットワークのクラス増分法を提案する。
さらに、ZSTCIを既存の正規化ベースのインクリメンタル学習手法と組み合わせることで、組み込みネットワークの性能をより向上させることができる。
論文 参考訳(メタデータ) (2020-12-31T08:21:37Z) - Systematic Generalization on gSCAN with Language Conditioned Embedding [19.39687991647301]
体系的一般化とは、学習アルゴリズムが学習した振る舞いを目に見えない状況に外挿する能力を指す。
本稿では,入力自然言語を条件とした動的メッセージパッシングによるオブジェクトの文脈的埋め込みを学習する手法を提案する。
論文 参考訳(メタデータ) (2020-09-11T17:35:05Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - MPLP: Learning a Message Passing Learning Protocol [63.948465205530916]
人工ニューラルネットワークの重みを学習する新しい手法として,メッセージパッシング学習プロトコル(MPLP)を提案する。
ANNで発生したすべての操作を独立したエージェントとして抽象化する。
各エージェントは、他のエージェントからやってくる多次元メッセージを取り込み、内部状態を更新し、近隣エージェントに渡される多次元メッセージを生成する責任がある。
論文 参考訳(メタデータ) (2020-07-02T09:03:14Z) - Modeling Document Interactions for Learning to Rank with Regularized
Self-Attention [22.140197412459393]
自己注意に基づくニューラルネットワークと相互作用する文書のモデリングについて検討する。
文書間の相互作用をモデル化するために設計された,単純かつ効果的な正規化用語を提案する。
提案した正規化項による自己注意ネットワークのトレーニングは,既存の学習方法よりも格付けに優れることを示す。
論文 参考訳(メタデータ) (2020-05-08T09:53:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。