論文の概要: On the Relation between Syntactic Divergence and Zero-Shot Performance
- arxiv url: http://arxiv.org/abs/2110.04644v1
- Date: Sat, 9 Oct 2021 21:09:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 15:11:33.388257
- Title: On the Relation between Syntactic Divergence and Zero-Shot Performance
- Title(参考訳): シンタクティック・ディバージェンスとゼロショット性能の関係について
- Authors: Ofir Arviv, Dmitry Nikolaev, Taelin Karidi and Omri Abend
- Abstract要約: 我々は、英語から多種多様な言語にパースするUniversal Dependencies (UD) を移譲し、2つの実験を行う。
我々は、英語のソースエッジが翻訳で保存される範囲に基づいてゼロショット性能を解析する。
両実験の結果から,言語間安定性とゼロショット解析性能の強い関係が示唆された。
- 参考スコア(独自算出の注目度): 22.195133438732633
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore the link between the extent to which syntactic relations are
preserved in translation and the ease of correctly constructing a parse tree in
a zero-shot setting. While previous work suggests such a relation, it tends to
focus on the macro level and not on the level of individual edges-a gap we aim
to address. As a test case, we take the transfer of Universal Dependencies (UD)
parsing from English to a diverse set of languages and conduct two sets of
experiments. In one, we analyze zero-shot performance based on the extent to
which English source edges are preserved in translation. In another, we apply
three linguistically motivated transformations to UD, creating more
cross-lingually stable versions of it, and assess their zero-shot parsability.
In order to compare parsing performance across different schemes, we perform
extrinsic evaluation on the downstream task of cross-lingual relation
extraction (RE) using a subset of a popular English RE benchmark translated to
Russian and Korean. In both sets of experiments, our results suggest a strong
relation between cross-lingual stability and zero-shot parsing performance.
- Abstract(参考訳): 本稿では,構文関係が翻訳中に保存される程度と,ゼロショット設定で構文木を正しく構築することの容易さとの関係について検討する。
これまでの作業ではそのような関係を示唆していましたが、個々のエッジのレベルではなく、マクロレベルにフォーカスする傾向があります。
テストケースとして、英語から多種多様な言語にパースするUniversal Dependencies (UD) の転送と、2つの実験を行う。
本研究では,英語のソースエッジが翻訳中に保存される程度に基づいてゼロショット性能を解析する。
別の例として、言語的に動機付けられた3つの変換をUDに適用し、より言語的に安定したバージョンを作成し、そのゼロショットパーサビリティを評価する。
本研究では,ロシア語と韓国語に翻訳された一般的な英語 re ベンチマークのサブセットを用いて,言語間関係抽出(re)の下流課題について,解析性能の比較を行う。
両実験の結果から,言語間安定性とゼロショット解析性能の強い関係が示唆された。
関連論文リスト
- Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Narrowing the Gap between Zero- and Few-shot Machine Translation by
Matching Styles [53.92189950211852]
大規模言語モデルは、文脈内学習を用いたゼロショットと少数ショットの例を用いて、機械翻訳に一般化する能力を示した。
本稿では,このギャップに寄与する要因について検討し,対象コーパスの書字スタイルを一致させることで,このギャップをほとんど(約70%)閉鎖できることを示す。
論文 参考訳(メタデータ) (2023-11-04T03:18:45Z) - Optimal Transport Posterior Alignment for Cross-lingual Semantic Parsing [68.47787275021567]
言語間のセマンティックパーシングは、高いソース言語(例えば英語)から少ないトレーニングデータを持つ低リソース言語へのパーシング能力を伝達する。
そこで本稿では,最適輸送を用いた係り受け変数間の言語間相違を明示的に最小化することで,言語間セマンティック解析のための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-07-09T04:52:31Z) - Improving Zero-shot Multilingual Neural Machine Translation by
Leveraging Cross-lingual Consistency Regularization [46.09132547431629]
多言語ニューラルマシン翻訳(NMT)モデルは、ゼロショット翻訳の有望な能力を有する。
本稿では,異なる言語間の表現ギャップを埋めるために,言語間整合性正規化(CrossConST)を提案する。
論文 参考訳(メタデータ) (2023-05-12T08:32:18Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - Aligned Weight Regularizers for Pruning Pretrained Neural Networks [6.000551438232907]
標準教師付き学習をゼロショット設定と比較した場合, 等級ベースプルーニングにおいて, 明確な性能差があることが示されている。
本稿では,切断ネットワークと未切断ネットワークのユニット間のアライメントを最大化する2つの重み正規化器を提案する。
論文 参考訳(メタデータ) (2022-04-04T11:06:42Z) - On Cross-Lingual Retrieval with Multilingual Text Encoders [51.60862829942932]
言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性について検討する。
教師なしのアドホック文と文書レベルのCLIR実験でそれらの性能をベンチマークする。
我々は、ゼロショット言語とドメイン転送CLIR実験のシリーズにおける英語関連データに基づいて、教師付き方式で微調整された多言語エンコーダの評価を行った。
論文 参考訳(メタデータ) (2021-12-21T08:10:27Z) - Subword Segmentation and a Single Bridge Language Affect Zero-Shot
Neural Machine Translation [36.4055239280145]
WMTデータに基づいて学習した多言語EN$leftrightarrow$FR,CS,DE,FIシステムのゼロショット性能について検討した。
ゼロショット翻訳におけるソースのコピーに対するバイアスを観察し、サブワードセグメンテーションの選択がこのバイアスにどのように影響するかを考察する。
論文 参考訳(メタデータ) (2020-11-03T13:45:54Z) - GATE: Graph Attention Transformer Encoder for Cross-lingual Relation and
Event Extraction [107.8262586956778]
言語に依存しない文表現を学習するために、普遍的な依存解析を伴うグラフ畳み込みネットワーク(GCN)を導入する。
GCNは、長い範囲の依存関係を持つ単語をモデル化するのに苦労する。
そこで本研究では,構文的距離の異なる単語間の依存関係を学習するための自己認識機構を提案する。
論文 参考訳(メタデータ) (2020-10-06T20:30:35Z) - Fine-Grained Analysis of Cross-Linguistic Syntactic Divergences [18.19093600136057]
並列コーパスから任意の言語対の発散パターンを抽出するフレームワークを提案する。
我々のフレームワークは、言語間の相違の詳細な図を提供し、以前のアプローチを一般化し、完全に自動化することを示します。
論文 参考訳(メタデータ) (2020-05-07T13:05:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。