論文の概要: Capturing the diversity of multilingual societies
- arxiv url: http://arxiv.org/abs/2105.02570v1
- Date: Thu, 6 May 2021 10:27:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 20:08:00.920594
- Title: Capturing the diversity of multilingual societies
- Title(参考訳): 多言語社会の多様性を捉え
- Authors: Thomas Louf, David Sanchez and Jose J. Ramasco
- Abstract要約: 我々は、理論とデータ駆動の観点から、言語シフトにおける作業プロセスについて考察する。
twitterと国勢調査データを用いた多言語社会における言語空間パターンの大規模実証研究は、幅広い多様性をもたらす。
本稿では,他言語の学習が促進され,両言語が絶滅危惧言語の使用を好む場合に,言語共存が達成できるモデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cultural diversity encoded within languages of the world is at risk, as many
languages have become endangered in the last decades in a context of growing
globalization. To preserve this diversity, it is first necessary to understand
what drives language extinction, and which mechanisms might enable coexistence.
Here, we consider the processes at work in language shift through a conjunction
of theoretical and data-driven perspectives. A large-scale empirical study of
spatial patterns of languages in multilingual societies using Twitter and
census data yields a wide diversity. It ranges from an almost complete mixing
of language speakers, including multilinguals, to segregation with a neat
separation of the linguistic domains and with multilinguals mainly at their
boundaries. To understand how these different states can emerge and,
especially, become stable, we propose a model in which coexistence of languages
may be reached when learning the other language is facilitated and when
bilinguals favor the use of the endangered language. Simulations carried out in
a metapopulation framework highlight the importance of spatial interactions
arising from people mobility to explain the stability of a mixed state or the
presence of a boundary between two linguistic regions. Changes in the
parameters regulating the relation between the languages can destabilize a
system, which undergoes global transitions. According to our model, the
evolution of the system once it undergoes a transition is highly
history-dependent. It is easy to change the status quo but going back to a
previous state may not be simple or even possible.
- Abstract(参考訳): 世界の言語にエンコードされる文化の多様性は危険にさらされており、グローバル化が進む中で、過去数十年で多くの言語が危険にさらされている。
この多様性を維持するためには、まず言語絶滅の要因と、どのメカニズムが共存を可能にするかを理解する必要がある。
本稿では,言語変化における作業プロセスについて,理論的およびデータ駆動的視点の結合を通して考察する。
twitterと国勢調査データを用いた多言語社会における言語空間パターンの大規模実証研究は、幅広い多様性をもたらす。
多言語話者を含むほぼ完全な言語話者の混合から、言語領域と主にその境界にある多言語話者とを巧みに分離した分離まで幅広い。
これらの異なる状態がどのように出現し、特に安定しているかを理解するために、他言語を習得し、両言語が絶滅危惧言語の使用を好む場合に言語共存が達成できるモデルを提案する。
メタポピュレーションフレームワークで実施したシミュレーションでは、混合状態の安定性や2つの言語領域の境界の存在を説明するために、人の移動から生じる空間的相互作用の重要性が強調されている。
言語間の関係を規定するパラメータの変化は、グローバルな遷移を行うシステムの不安定化を可能にする。
私たちのモデルによれば、移行を一度行えばシステムの進化は歴史に依存します。
ステータス quo を変更するのは簡単だが、以前の状態に戻るのは簡単でも、可能でもないかもしれない。
関連論文リスト
- A Roadmap for Multilingual, Multimodal Domain Independent Deception Detection [2.1506382989223782]
人間のコミュニケーションの一般的な側面である騙しは、デジタル時代において大きな変化を遂げた。
近年の研究では、英語の領域にまたがる騙しに普遍的な言語的手がかりが存在する可能性が示されている。
低リソース言語における誤検出の実践的課題は、ラベル付きデータがないため、よく研究されている問題ではない。
論文 参考訳(メタデータ) (2024-05-07T00:38:34Z) - Exploring Multilingual Concepts of Human Value in Large Language Models: Is Value Alignment Consistent, Transferable and Controllable across Languages? [34.38469832305664]
異なる多言語性を持つ7種類の人的価値、16の言語、3のLLM系列を探索する。
これらの概念の言語間分析は、言語資源の相違から生じる3つの特徴を明らかにしている。
LLMの事前学習のための多言語データの合成について提案する。
論文 参考訳(メタデータ) (2024-02-28T07:18:39Z) - Towards Bridging the Digital Language Divide [4.234367850767171]
多言語言語処理システムは、しばしばハードワイヤで、通常不随意で、特定の言語に対して隠された表現的嗜好を示す。
偏りのある技術は、しばしば表現される言語の複雑さに不公平な研究・開発手法の結果であることを示す。
我々は,技術設計と方法論の両面から,言語バイアスを減らすことを目的とした新しいイニシアティブを提案する。
論文 参考訳(メタデータ) (2023-07-25T10:53:20Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Cross-lingual Lifelong Learning [53.06904052325966]
本稿では,言語間連続学習(CCL)の評価パラダイムを提案する。
マルチリンガルなシーケンシャルな学習を特に難しいものにするための洞察を提供する。
この分析の意味は、異なる言語間連続学習のデシダータを測り、バランスをとる方法のレシピを含む。
論文 参考訳(メタデータ) (2022-05-23T09:25:43Z) - Cross-Lingual Ability of Multilingual Masked Language Models: A Study of
Language Structure [54.01613740115601]
本稿では,構成順序,構成,単語共起の3つの言語特性について検討する。
我々の主な結論は、構成順序と単語共起の寄与は限定的である一方、構成は言語間移動の成功にとってより重要であるということである。
論文 参考訳(メタデータ) (2022-03-16T07:09:35Z) - When is BERT Multilingual? Isolating Crucial Ingredients for
Cross-lingual Transfer [15.578267998149743]
サブワード重複の欠如は,言語が単語順に異なる場合,ゼロショット転送に大きく影響することを示す。
言語間の伝達性能と単語埋め込みアライメントの間には強い相関関係がある。
その結果、言語間の単語埋め込みアライメントを明示的に改善する多言語モデルに焦点が当てられた。
論文 参考訳(メタデータ) (2021-10-27T21:25:39Z) - Discovering Representation Sprachbund For Multilingual Pre-Training [139.05668687865688]
多言語事前学習モデルから言語表現を生成し、言語分析を行う。
すべての対象言語を複数のグループにクラスタリングし、表現のスプラックバンドとして各グループに名前を付ける。
言語間ベンチマークで実験を行い、強いベースラインと比較して大幅な改善が達成された。
論文 参考訳(メタデータ) (2021-09-01T09:32:06Z) - How individuals change language [1.2437226707039446]
我々は,多種多様な個人レベルの言語行動を含む,非常に一般的な数学的モデルを導入する。
異なる仮定の下で複数の言語における定冠詞と不定冠詞の実証的な変化の可能性を比較した。
幼児期の言語習得の誤りを主眼とする言語変化の説明は、歴史的データによって非常に弱く支持されている。
論文 参考訳(メタデータ) (2021-04-20T19:02:49Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。