論文の概要: Zero-Shot Cross-lingual Semantic Parsing
- arxiv url: http://arxiv.org/abs/2104.07554v1
- Date: Thu, 15 Apr 2021 16:08:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 19:32:55.586607
- Title: Zero-Shot Cross-lingual Semantic Parsing
- Title(参考訳): ゼロショット言語間意味解析
- Authors: Tom Sherborne, Mirella Lapata
- Abstract要約: 7つのテスト言語に対する並列データを持たないゼロショット問題として,言語間セマンティックパーシングについて検討した。
英文論理形式ペアデータのみを用いて解析知識を付加言語に転送するマルチタスクエンコーダデコーダモデルを提案する。
このシステムは、ゼロショット解析を潜時空間アライメント問題としてフレーム化し、事前訓練されたモデルを改善し、最小のクロスリンガル転送ペナルティで論理形式を生成することができる。
- 参考スコア(独自算出の注目度): 56.95036511882921
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent work in crosslingual semantic parsing has successfully applied machine
translation to localize accurate parsing to new languages. However, these
advances assume access to high-quality machine translation systems, and tools
such as word aligners, for all test languages. We remove these assumptions and
study cross-lingual semantic parsing as a zero-shot problem without parallel
data for 7 test languages (DE, ZH, FR, ES, PT, HI, TR). We propose a multi-task
encoder-decoder model to transfer parsing knowledge to additional languages
using only English-Logical form paired data and unlabeled, monolingual
utterances in each test language. We train an encoder to generate
language-agnostic representations jointly optimized for generating logical
forms or utterance reconstruction and against language discriminability. Our
system frames zero-shot parsing as a latent-space alignment problem and finds
that pre-trained models can be improved to generate logical forms with minimal
cross-lingual transfer penalty. Experimental results on Overnight and a new
executable version of MultiATIS++ find that our zero-shot approach performs
above back-translation baselines and, in some cases, approaches the supervised
upper bound.
- Abstract(参考訳): 言語間意味解析における最近の研究は、新しい言語への正確な構文解析をローカライズするために機械翻訳をうまく応用した。
しかし、これらの進歩は、全てのテスト言語に対して高品質な機械翻訳システムや単語調整器などのツールへのアクセスを前提としている。
これらの仮定を除去し、7つのテスト言語(DE, ZH, FR, ES, PT, HI, TR)の並列データを持たないゼロショット問題として言語間意味解析を研究する。
本稿では,各テスト言語における英語論理形式対データとラベルなし単言語発話のみを用いて,解析知識を追加言語に転送するマルチタスクエンコーダ・デコーダモデルを提案する。
我々はエンコーダを訓練し、論理形式や発話再構成の生成に最適化された言語に依存しない表現を生成する。
我々のシステムでは、ゼロショット解析を遅延空間アライメント問題として捉え、事前学習されたモデルを改善し、最小の言語間移動ペナルティを持つ論理形式を生成する。
OvernightとMultiATIS++の新たな実行可能なバージョンの実験結果によると、ゼロショットアプローチはバックトランスレーションベースラインよりも上であり、場合によっては監督された上限に近づく。
関連論文リスト
- ChatZero:Zero-shot Cross-Lingual Dialogue Generation via Pseudo-Target Language [53.8622516025736]
そこで本研究では,言語間符号切替方式に基づく,エンドツーエンドのゼロショット対話生成モデルChatZeroを提案する。
多言語DailyDialogとDSTC7-AVSDデータセットの実験は、ChatZeroが元のパフォーマンスの90%以上を達成することを示した。
論文 参考訳(メタデータ) (2024-08-16T13:11:53Z) - Discovering Low-rank Subspaces for Language-agnostic Multilingual
Representations [38.56175462620892]
ML-LM(ML-LM)は,ゼロショット言語間移動の顕著な能力を示す。
多言語埋め込み空間から言語固有の要素を投影する新しい視点を提案する。
本手法を適用すれば,ML-LMよりも一貫した改善が期待できることを示す。
論文 参考訳(メタデータ) (2024-01-11T09:54:11Z) - Soft Language Clustering for Multilingual Model Pre-training [57.18058739931463]
本稿では,インスタンスを条件付きで符号化するためのフレキシブルガイダンスとして,コンテキスト的にプロンプトを検索するXLM-Pを提案する。
我々のXLM-Pは、(1)言語間における言語不変および言語固有知識の軽量なモデリングを可能にし、(2)他の多言語事前学習手法との容易な統合を可能にする。
論文 参考訳(メタデータ) (2023-06-13T08:08:08Z) - Translate & Fill: Improving Zero-Shot Multilingual Semantic Parsing with
Synthetic Data [2.225882303328135]
多言語セマンティックパーシングタスクのための銀のトレーニングデータを生成するための新しいTranslate-and-Fill(TaF)手法を提案する。
3つの多言語意味解析データセットの実験結果は、TaFによるデータ拡張が類似システムと競合する精度に達することを示している。
論文 参考訳(メタデータ) (2021-09-09T14:51:11Z) - FILTER: An Enhanced Fusion Method for Cross-lingual Language
Understanding [85.29270319872597]
我々は,XLMファインタニングの入力として言語間データを利用する拡張融合法を提案する。
推論中は、ターゲット言語で入力されたテキストとソース言語の翻訳に基づいて予測を行う。
この問題に対処するため,対象言語における翻訳テキストのための自動生成ソフト擬似ラベルに基づくモデル学習のためのKL分割自己学習損失を提案する。
論文 参考訳(メタデータ) (2020-09-10T22:42:15Z) - XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning [68.57658225995966]
XCOPA (Cross-lingual Choice of Plausible Alternatives) は11言語における因果コモンセンス推論のための多言語データセットである。
提案手法は,翻訳に基づく転送と比較して,現在の手法の性能が低下していることを明らかにする。
論文 参考訳(メタデータ) (2020-05-01T12:22:33Z) - LAReQA: Language-agnostic answer retrieval from a multilingual pool [29.553907688813347]
LAReQAによる言語間アライメントの「強い」テスト。
機械翻訳による学習データの増強は効果的であることがわかった。
この発見は、言語に依存しない検索は、言語間評価の実質的な新しいタイプである、という我々の主張を裏付けるものである。
論文 参考訳(メタデータ) (2020-04-11T20:51:11Z) - Bootstrapping a Crosslingual Semantic Parser [74.99223099702157]
我々は、英語のような単一の言語で訓練された意味を、最小限のアノテーションで新しい言語や複数のドメインに適用する。
我々は、機械翻訳がトレーニングデータの適切な代用であるかどうかを問うとともに、英語、パラフレーズ、多言語事前学習モデルとの併用トレーニングを用いて、ブートストラップを調査するように拡張する。
論文 参考訳(メタデータ) (2020-04-06T12:05:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。