論文の概要: Predicate-Argument Structure Divergences in Chinese and English Parallel Sentences and their Impact on Language Transfer
- arxiv url: http://arxiv.org/abs/2511.09796v1
- Date: Fri, 14 Nov 2025 01:10:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.492839
- Title: Predicate-Argument Structure Divergences in Chinese and English Parallel Sentences and their Impact on Language Transfer
- Title(参考訳): 中国語と英語のパラレル文における述語構造分節とその言語伝達への影響
- Authors: Rocco Tripodi, Xiaoyu Liu,
- Abstract要約: 言語間自然言語処理は、低リソース環境で実用的なソリューションを提供する。
言語の違いは、特に類型的には遠い言語の間で、言語移動を妨げる。
本稿では、中国語と英語の同時文における述語句構造の分析について述べる。
- 参考スコア(独自算出の注目度): 6.834698677197089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-lingual Natural Language Processing (NLP) has gained significant traction in recent years, offering practical solutions in low-resource settings by transferring linguistic knowledge from resource-rich to low-resource languages. This field leverages techniques like annotation projection and model transfer for language adaptation, supported by multilingual pre-trained language models. However, linguistic divergences hinder language transfer, especially among typologically distant languages. In this paper, we present an analysis of predicate-argument structures in parallel Chinese and English sentences. We explore the alignment and misalignment of predicate annotations, inspecting similarities and differences and proposing a categorization of structural divergences. The analysis and the categorization are supported by a qualitative and quantitative analysis of the results of an annotation projection experiment, in which, in turn, one of the two languages has been used as source language to project annotations into the corresponding parallel sentences. The results of this analysis show clearly that language transfer is asymmetric. An aspect that requires attention when it comes to selecting the source language in transfer learning applications and that needs to be investigated before any scientific claim about cross-lingual NLP is proposed.
- Abstract(参考訳): 言語間自然言語処理(NLP)は近年,資源豊富な言語から低リソース言語へ言語知識を移譲することで,低リソース環境における実用的なソリューションを提供するなど,大きな注目を集めている。
このフィールドは、多言語事前学習言語モデルによってサポートされている言語適応のためのアノテーション投影やモデル転送のような技術を活用する。
しかし、言語の違いは、特に類型的には遠い言語において、言語移動を妨げる。
本稿では、中国語と英語の並行文における述語-代名詞構造の分析について述べる。
述語アノテーションのアライメントとアライメント、類似点と相違点の検査、構造的相違点の分類を提案する。
この分析と分類は、アノテーション投影実験の結果の質的かつ定量的な分析によって支持され、2つの言語のうちの1つがソース言語として使われ、対応する並列文にアノテーションを投影している。
この分析の結果,言語伝達が非対称であることが明らかとなった。
トランスファーラーニングアプリケーションにおけるソース言語の選択には注意を要する側面があり、言語間NLPに関する科学的主張が提案される前に検討する必要がある。
関連論文リスト
- Social Bias in Multilingual Language Models: A Survey [5.756606441319472]
この体系的なレビューは、バイアス評価と緩和アプローチを多言語および非英語の文脈に拡張する新興研究を分析している。
本稿では,言語多様性,文化意識,評価指標の選択,緩和手法について検討する。
論文 参考訳(メタデータ) (2025-08-27T18:25:32Z) - Cross-Linguistic Transfer in Multilingual NLP: The Role of Language Families and Morphology [0.0]
言語間移動は多言語NLPの重要な側面となっている。
本稿では,言語科と形態学のレンズによる言語間移動について検討する。
論文 参考訳(メタデータ) (2025-05-20T04:19:34Z) - Can Machine Translation Bridge Multilingual Pretraining and Cross-lingual Transfer Learning? [8.630930380973489]
本稿では,機械翻訳を言語表現学習の強化を目的とした継続的な学習目的として活用する可能性について検討する。
この結果から,機械翻訳の継続学習が言語間表現学習の強化に失敗することが明らかとなった。
言語横断シナリオにおける明示的な文レベルのアライメントは、言語間移動事前学習に有害である、と結論付けた。
論文 参考訳(メタデータ) (2024-03-25T13:53:04Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - XCOPA: A Multilingual Dataset for Causal Commonsense Reasoning [68.57658225995966]
XCOPA (Cross-lingual Choice of Plausible Alternatives) は11言語における因果コモンセンス推論のための多言語データセットである。
提案手法は,翻訳に基づく転送と比較して,現在の手法の性能が低下していることを明らかにする。
論文 参考訳(メタデータ) (2020-05-01T12:22:33Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。