論文の概要: Cross-Cultural Similarity Features for Cross-Lingual Transfer Learning
of Pragmatically Motivated Tasks
- arxiv url: http://arxiv.org/abs/2006.09336v2
- Date: Thu, 8 Apr 2021 08:31:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 20:55:21.592143
- Title: Cross-Cultural Similarity Features for Cross-Lingual Transfer Learning
of Pragmatically Motivated Tasks
- Title(参考訳): 実践的動機づけ課題の言語間伝達学習における異文化間類似性
- Authors: Jimin Sun, Hwijeen Ahn, Chan Young Park, Yulia Tsvetkov, David R.
Mortensen
- Abstract要約: 本稿では,言語パターンに現れる異文化の類似性を捉え,言語プラグマティクスの異なる側面を定量化する3つの言語特徴を紹介する。
分析の結果,提案する実用的特徴は異文化間の類似性を捉え,社会言語学や言語人類学における既存の研究とよく一致していることがわかった。
- 参考スコア(独自算出の注目度): 30.580822082075475
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Much work in cross-lingual transfer learning explored how to select better
transfer languages for multilingual tasks, primarily focusing on typological
and genealogical similarities between languages. We hypothesize that these
measures of linguistic proximity are not enough when working with
pragmatically-motivated tasks, such as sentiment analysis. As an alternative,
we introduce three linguistic features that capture cross-cultural similarities
that manifest in linguistic patterns and quantify distinct aspects of language
pragmatics: language context-level, figurative language, and the lexification
of emotion concepts. Our analyses show that the proposed pragmatic features do
capture cross-cultural similarities and align well with existing work in
sociolinguistics and linguistic anthropology. We further corroborate the
effectiveness of pragmatically-driven transfer in the downstream task of
choosing transfer languages for cross-lingual sentiment analysis.
- Abstract(参考訳): 言語間移動学習における多くの研究は、多言語タスクのためのより良い移動言語を選択する方法を探究した。
我々は,これらの言語的近接性の尺度は,感情分析などの実践的動機付けタスクを扱う場合に十分ではないと仮定する。
その代替として,言語パターンに現れる異文化間の類似性を捉え,言語実践の異なる側面を定量化する3つの言語的特徴,すなわち言語文脈レベル,フィギュラティブ言語,感情概念の語彙化を導入する。
分析の結果,提案する実用的特徴は異文化間の類似性を捉え,社会言語学や言語人類学における既存の研究とよく一致していることがわかった。
我々は,言語間感情分析のためのトランスファー言語の選択という下流課題において,実践的なトランスファーの有効性をさらに強調する。
関連論文リスト
- Event Extraction in Basque: Typologically motivated Cross-Lingual Transfer-Learning Analysis [18.25948580496853]
低リソース言語におけるイベント抽出では,言語間移動学習が広く用いられている。
本稿では,ソース言語とターゲット言語との類型的類似性が,言語間移動の性能に与える影響について検討する。
論文 参考訳(メタデータ) (2024-04-09T15:35:41Z) - Can Machine Translation Bridge Multilingual Pretraining and Cross-lingual Transfer Learning? [8.630930380973489]
本稿では,機械翻訳を言語表現学習の強化を目的とした継続的な学習目的として活用する可能性について検討する。
この結果から,機械翻訳の継続学習が言語間表現学習の強化に失敗することが明らかとなった。
言語横断シナリオにおける明示的な文レベルのアライメントは、言語間移動事前学習に有害である、と結論付けた。
論文 参考訳(メタデータ) (2024-03-25T13:53:04Z) - A study of conceptual language similarity: comparison and evaluation [0.3093890460224435]
自然言語処理(NLP)に関する興味深い研究は、言語型学を取り入れ、言語多様性を橋渡しすることを目的としている。
最近の研究は、それらが基本的な概念をどのように表現するかに基づいて、言語類似性を定義する新しいアプローチを導入している。
本研究では,概念的類似性を詳細に研究し,二項分類タスクにおいて広範囲に評価する。
論文 参考訳(メタデータ) (2023-05-22T18:28:02Z) - Cross-Linguistic Syntactic Difference in Multilingual BERT: How Good is
It and How Does It Affect Transfer? [50.48082721476612]
マルチリンガルBERT (mBERT) は, 言語間シンタクティックな機能を示した。
我々は,mBERTから引き起こされる文法的関係の分布を,24言語に類型的に異なる文脈で検討した。
論文 参考訳(メタデータ) (2022-12-21T09:44:08Z) - Cross-lingual Lifelong Learning [53.06904052325966]
本稿では,言語間連続学習(CCL)の評価パラダイムを提案する。
マルチリンガルなシーケンシャルな学習を特に難しいものにするための洞察を提供する。
この分析の意味は、異なる言語間連続学習のデシダータを測り、バランスをとる方法のレシピを含む。
論文 参考訳(メタデータ) (2022-05-23T09:25:43Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Cross-Lingual Ability of Multilingual Masked Language Models: A Study of
Language Structure [54.01613740115601]
本稿では,構成順序,構成,単語共起の3つの言語特性について検討する。
我々の主な結論は、構成順序と単語共起の寄与は限定的である一方、構成は言語間移動の成功にとってより重要であるということである。
論文 参考訳(メタデータ) (2022-03-16T07:09:35Z) - Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。
すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。
言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文 参考訳(メタデータ) (2021-09-01T09:32:06Z) - Rediscovering the Slavic Continuum in Representations Emerging from
Neural Models of Spoken Language Identification [16.369477141866405]
音声信号におけるスラヴ語識別のためのニューラルモデルを提案する。
本稿では,言語関連性の客観的尺度を反映しているかどうかを調査するために,その創発的表現を分析した。
論文 参考訳(メタデータ) (2020-10-22T18:18:19Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。