論文の概要: Few-Shot NLU with Vector Projection Distance and Abstract Triangular CRF
- arxiv url: http://arxiv.org/abs/2112.04999v1
- Date: Thu, 9 Dec 2021 15:46:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 15:05:22.291093
- Title: Few-Shot NLU with Vector Projection Distance and Abstract Triangular CRF
- Title(参考訳): ベクトル射影距離と抽象三角CRFを持つFew-Shot NLU
- Authors: Su Zhu, Lu Chen, Ruisheng Cao, Zhi Chen, Qingliang Miao, and Kai Yu
- Abstract要約: データ空間問題は自然言語理解(NLU)の鍵となる課題である
そこで本研究では, ベクトル射影距離と矩形条件ランダム場(CRF)を用いて, 少数ショットNLUのプロトタイプネットワークを改善することを提案する。
我々のアプローチは、ターゲットドメインを微調整することなく、中国語と英語の2つの数ショットのNLUベンチマーク(Few-JointとSNIPS)で新しい最先端を実現することができる。
- 参考スコア(独自算出の注目度): 30.982301053976023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data sparsity problem is a key challenge of Natural Language Understanding
(NLU), especially for a new target domain. By training an NLU model in source
domains and applying the model to an arbitrary target domain directly (even
without fine-tuning), few-shot NLU becomes crucial to mitigate the data
scarcity issue. In this paper, we propose to improve prototypical networks with
vector projection distance and abstract triangular Conditional Random Field
(CRF) for the few-shot NLU. The vector projection distance exploits projections
of contextual word embeddings on label vectors as word-label similarities,
which is equivalent to a normalized linear model. The abstract triangular CRF
learns domain-agnostic label transitions for joint intent classification and
slot filling tasks. Extensive experiments demonstrate that our proposed methods
can significantly surpass strong baselines. Specifically, our approach can
achieve a new state-of-the-art on two few-shot NLU benchmarks (Few-Joint and
SNIPS) in Chinese and English without fine-tuning on target domains.
- Abstract(参考訳): データスパーシティ問題は、特に新しいターゲットドメインにおいて、自然言語理解(nlu)の重要な課題である。
ソースドメインでNLUモデルをトレーニングし、(微調整なしでも)任意のターゲットドメインに直接モデルを適用することによって、少数ショットのNLUは、データの不足を緩和するために重要となる。
本稿では,数発のNLUに対して,ベクトル射影距離と抽象三角条件ランダム場(CRF)によるプロトタイプネットワークの改善を提案する。
ベクトル射影距離は、ラベルベクトル上の文脈的単語埋め込みの投影を、正規化線形モデルと等価な単語ラベル類似性として活用する。
抽象三角CRFは、結合意図分類とスロット充填タスクのためのドメインに依存しないラベル遷移を学習する。
大規模な実験により,提案手法が強いベースラインをはるかに超えることを示す。
具体的には,中国語と英語の2つのNLUベンチマーク(Few-JointとSNIPS)に対して,ターゲットドメインを微調整することなく,最先端のNLUベンチマークを実現する。
関連論文リスト
- Exploiting Low-confidence Pseudo-labels for Source-free Object Detection [54.98300313452037]
Source-free Object Detection (SFOD) は、ラベル付きソースデータにアクセスすることなく、未ラベルのターゲットドメインにソーストレーニングされた検出器を適応することを目的としている。
現在のSFOD法は適応相におけるしきい値に基づく擬似ラベル手法を用いる。
疑似ラベルを最大限に活用するために,高信頼度と低信頼度しきい値を導入する手法を提案する。
論文 参考訳(メタデータ) (2023-10-19T12:59:55Z) - Unsupervised Adaptation of Polyp Segmentation Models via Coarse-to-Fine
Self-Supervision [16.027843524655516]
本稿では,アノテートされたソースデータへの依存を解消する,ソースフリードメイン適応(Source-Free Domain Adaptation, SFDA)の実践的問題について検討する。
現在のSFDA法は、ソーストレーニングされたモデルからドメイン知識を抽出することに重点を置いているが、対象ドメインの本質的な構造を無視している。
本稿では,領域レベルと画素レベルの識別表現を粗大な自己超越によって学習する,領域間適応ネットワーク(RPANet)と呼ばれる新しいSFDAフレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-13T02:37:08Z) - Neural Vector Fields: Implicit Representation by Explicit Learning [63.337294707047036]
ニューラルベクトル場 (Neural Vector Fields, NVF) という新しい3次元表現法を提案する。
メッシュを直接操作するための明示的な学習プロセスを採用するだけでなく、符号なし距離関数(UDF)の暗黙的な表現も採用している。
提案手法は,まず表面への変位クエリを予測し,テキスト再構成として形状をモデル化する。
論文 参考訳(メタデータ) (2023-03-08T02:36:09Z) - Robust Target Training for Multi-Source Domain Adaptation [110.77704026569499]
両レベル最適化に基づく新しいMSDAのためのロバスト目標訓練法(BORT$2$)を提案する。
提案手法は,大規模なDomainNetデータセットを含む3つのMSDAベンチマークにおいて,アートパフォーマンスの状態を達成している。
論文 参考訳(メタデータ) (2022-10-04T15:20:01Z) - PC-RGNN: Point Cloud Completion and Graph Neural Network for 3D Object
Detection [57.49788100647103]
LiDARベースの3Dオブジェクト検出は、自動運転にとって重要なタスクです。
現在のアプローチでは、遠方および閉ざされた物体の偏りと部分的な点雲に苦しむ。
本稿では,この課題を2つの解決法で解決する新しい二段階アプローチ,pc-rgnnを提案する。
論文 参考訳(メタデータ) (2020-12-18T18:06:43Z) - Complete & Label: A Domain Adaptation Approach to Semantic Segmentation
of LiDAR Point Clouds [49.47017280475232]
3次元点雲のセマンティックラベリングにおける教師なし領域適応問題について検討する。
セグメンテーションネットワークに渡す前に、基盤となる表面を復元するためにComplete と Label のアプローチを採用する。
回収された3D表面は標準領域として機能し、そこからセマンティックラベルが異なるLiDARセンサー間で転送される。
論文 参考訳(メタデータ) (2020-07-16T17:42:05Z) - Bridging the Theoretical Bound and Deep Algorithms for Open Set Domain
Adaptation [40.95099721257058]
教師なしオープンセットドメイン適応(UOSDA)では、ターゲットドメインはソースドメインで観測されていない未知のクラスを含む。
提案手法は,ソースドメインリスク,$epsilon$-openset difference(Delta_epsilon$),ドメイン間の分布差,定数の4つの条件を含む。
具体的には、ソースドメインリスクと$Delta_epsilon$は勾配降下によって最小化され、分散の相違は、新しいオープンセット条件付き対向訓練戦略によって最小化される。
論文 参考訳(メタデータ) (2020-06-23T14:01:06Z) - L-Vector: Neural Label Embedding for Domain Adaptation [62.112885747045766]
本研究では、未ペアデータを用いたディープニューラルネットワーク(DNN)音響モデルの領域適応のための新しいニューラルラベル埋め込み(NLE)手法を提案する。
NLEは1ホットラベルによる直接再トレーニングよりも14.1%の相対的な単語誤り率の低減を実現している。
論文 参考訳(メタデータ) (2020-04-25T06:40:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。