Fugu-MT 論文翻訳(概要): Monolingual and Cross-Lingual Acceptability Judgments with the Italian CoLA corpus

論文の概要: Monolingual and Cross-Lingual Acceptability Judgments with the Italian CoLA corpus

arxiv url: http://arxiv.org/abs/2109.12053v1
Date: Fri, 24 Sep 2021 16:18:53 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-27 18:08:23.854062
Title: Monolingual and Cross-Lingual Acceptability Judgments with the Italian CoLA corpus
Title（参考訳）: イタリア語コーパスを用いた単言語・言語間アクセプタビリティ判断
Authors: Daniela Trotta, Raffaele Guarasci, Elisa Leonardelli, Sara Tonelli
Abstract要約: ItaCoLAコーパスは,受理性判定を伴う約1万文を含む。また、多言語トランスフォーマーに基づくアプローチが、微調整中に2つの言語で文を使うことのメリットを評価できるかを評価することを目的とした、最初の言語間実験も提示する。
参考スコア（独自算出の注目度）: 2.418273287232718
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The development of automated approaches to linguistic acceptability has been greatly fostered by the availability of the English CoLA corpus, which has also been included in the widely used GLUE benchmark. However, this kind of research for languages other than English, as well as the analysis of cross-lingual approaches, has been hindered by the lack of resources with a comparable size in other languages. We have therefore developed the ItaCoLA corpus, containing almost 10,000 sentences with acceptability judgments, which has been created following the same approach and the same steps as the English one. In this paper we describe the corpus creation, we detail its content, and we present the first experiments on this new resource. We compare in-domain and out-of-domain classification, and perform a specific evaluation of nine linguistic phenomena. We also present the first cross-lingual experiments, aimed at assessing whether multilingual transformerbased approaches can benefit from using sentences in two languages during fine-tuning.
Abstract（参考訳）: 言語アクセシビリティに対する自動的なアプローチの開発は、広く使われているGLUEベンチマークに含まれる英語のCoLAコーパスの可用性によって大いに促進されている。しかし、英語以外の言語に対するこの種の研究や、言語横断的アプローチの分析は、他の言語に匹敵する大きさのリソースの欠如によって妨げられている。そこで我々はItaCoLAコーパスを開発し,同じアプローチと英文と同じ手順で作成された受理性判定文を約1万文含んだ。本稿では,コーパス作成について述べるとともに,その内容について詳述し,この新しいリソースに関する最初の実験について述べる。ドメイン内分類とドメイン外分類を比較し、9つの言語現象の特定評価を行う。また,マルチリンガルトランスフォーマティブ・アプローチが,微調整時に2つの言語で文を使用することによるメリットを評価できるかどうかを評価することを目的とした,最初のクロスリンガル実験も行った。

関連論文リスト

Predicate-Argument Structure Divergences in Chinese and English Parallel Sentences and their Impact on Language Transfer [6.834698677197089]
言語間自然言語処理は、低リソース環境で実用的なソリューションを提供する。言語の違いは、特に類型的には遠い言語の間で、言語移動を妨げる。本稿では、中国語と英語の同時文における述語句構造の分析について述べる。
論文参考訳（メタデータ） (2025-11-12T22:55:29Z)
QFrCoLA: a Quebec-French Corpus of Linguistic Acceptability Judgments [0.0]
本稿では,25,153個のドメイン内文と2,675個のドメイン外文からなる規範的二項受容可能性判定データセットであるQFrCoLAを紹介する。我々は、QFrCoLAと他の7つの言語的二項受容可能性判定コーパスを用いて、7つの言語モデルをベンチマークする。平均的に、微調整トランスフォーマーベースのLMは、ほとんどの言語において強力なベースラインであり、ゼロショットバイナリ分類の大言語モデルは、そのタスクでは不十分である。
論文参考訳（メタデータ） (2025-08-23T01:51:45Z)
Predictability and Causality in Spanish and English Natural Language Generation [6.817247544942709]
本稿では,英語とスペイン語の因果関係と非因果関係を比較検討する。この実験によると、スペイン語は非因果関係から英語よりも予測可能である。これらの知見は、双方向トランスフォーマー言語モデルを用いたスペイン語におけるNLGのさらなる研究を支援する。
論文参考訳（メタデータ） (2024-08-26T14:09:28Z)
A Corpus for Sentence-level Subjectivity Detection on English News Articles [49.49218203204942]
我々はこのガイドラインを用いて、議論を呼んだ話題に関する英ニュース記事から抽出した638の目的語と411の主観的な文からなるNewsSD-ENGを収集する。我々のコーパスは、語彙や機械翻訳といった言語固有のツールに頼ることなく、英語で主観的検出を行う方法を舗装している。
論文参考訳（メタデータ） (2023-05-29T11:54:50Z)
Sentiment Classification of Code-Switched Text using Pre-trained Multilingual Embeddings and Segmentation [1.290382979353427]
コード切替型感情分析のための多段階自然言語処理アルゴリズムを提案する。提案アルゴリズムは、人間の専門知識に制限のある複数の言語の感情分析のために拡張することができる。
論文参考訳（メタデータ） (2022-10-29T01:52:25Z)
Models and Datasets for Cross-Lingual Summarisation [78.56238251185214]
対象言語における多文要約に関連付けられたソース言語において,長い文書を含む言語間要約コーパスを提案する。コーパスは、チェコ語、英語、フランス語、ドイツ語の4つの言語について、12の言語対と指示をカバーしている。言語対応のウィキペディアのタイトルから、主節と記事の本体を組み合わせることで、ウィキペディアから言語横断的な文書要約インスタンスを導出する。
論文参考訳（メタデータ） (2022-02-19T11:55:40Z)
A Massively Multilingual Analysis of Cross-linguality in Shared Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文参考訳（メタデータ） (2021-09-13T21:05:37Z)
AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文参考訳（メタデータ） (2021-04-17T20:23:45Z)
Evaluating Language Tools for Fifteen EU-official Under-resourced Languages [0.0]
本稿では、EUの公式なアントラリソース言語15言語を対象に、言語ツールの評価キャンペーンの結果について述べる。この評価は、言語横断的なイベント中心の知識処理を構築することを目的としたMSC ITN CLEOPATRAアクションで実施された。
論文参考訳（メタデータ） (2020-10-23T14:21:03Z)
XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning [68.57658225995966]
XCOPA (Cross-lingual Choice of Plausible Alternatives) は11言語における因果コモンセンス推論のための多言語データセットである。提案手法は,翻訳に基づく転送と比較して,現在の手法の性能が低下していることを明らかにする。
論文参考訳（メタデータ） (2020-05-01T12:22:33Z)
Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文参考訳（メタデータ） (2019-12-28T16:18:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。