論文の概要: The Who in Code-Switching: A Case Study for Predicting Egyptian
Arabic-English Code-Switching Levels based on Character Profiles
- arxiv url: http://arxiv.org/abs/2208.00433v1
- Date: Sun, 31 Jul 2022 13:47:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-02 13:28:10.357479
- Title: The Who in Code-Switching: A Case Study for Predicting Egyptian
Arabic-English Code-Switching Levels based on Character Profiles
- Title(参考訳): コードスイッチング:文字プロファイルに基づくエジプト・アラビア・英語のコードスイッチングレベル予測の事例研究
- Authors: Injy Hamed, Alia El Bolock, Cornelia Herbert, Slim Abdennadher, Ngoc
Thang Vu
- Abstract要約: コードスイッチング(英: Code-switching, CS)とは、多言語個人が1つの会話の中で言語を交互に交互に交互に行う言語現象である。
機械学習(ML)を使用して、ユーザのプロファイルに基づいて、ユーザのCSレベルを予測する。
その結果, CS行動は, 話者, 旅行経験, ニューロティシズム, 外転性性格特性の関連性が示唆された。
- 参考スコア(独自算出の注目度): 20.746558640332953
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code-switching (CS) is a common linguistic phenomenon exhibited by
multilingual individuals, where they tend to alternate between languages within
one single conversation. CS is a complex phenomenon that not only encompasses
linguistic challenges, but also contains a great deal of complexity in terms of
its dynamic behaviour across speakers. Given that the factors giving rise to CS
vary from one country to the other, as well as from one person to the other, CS
is found to be a speaker-dependant behaviour, where the frequency by which the
foreign language is embedded differs across speakers. While several researchers
have looked into predicting CS behaviour from a linguistic point of view,
research is still lacking in the task of predicting user CS behaviour from
sociological and psychological perspectives. We provide an empirical user
study, where we investigate the correlations between users' CS levels and
character traits. We conduct interviews with bilinguals and gather information
on their profiles, including their demographics, personality traits, and
traveling experiences. We then use machine learning (ML) to predict users' CS
levels based on their profiles, where we identify the main influential factors
in the modeling process. We experiment with both classification as well as
regression tasks. Our results show that the CS behaviour is affected by the
relation between speakers, travel experiences as well as Neuroticism and
Extraversion personality traits.
- Abstract(参考訳): コードスイッチング(英: Code-switching, CS)は、多言語個人によって示される共通の言語現象であり、単一の会話の中で言語間で交替する傾向がある。
CSは言語的な課題を包含するだけでなく、話者間の動的振る舞いの観点からも多くの複雑さを含む複雑な現象である。
csを発生させる要因が国によって異なり、またある人によって異なることから、csは話者に依存した行動であり、外国語が埋め込まれる頻度は話者によって異なることが分かる。
数名の研究者が言語学的観点からcs行動の予測について検討しているが、社会学的、心理学的な観点からのcs行動の予測には研究が不足している。
本研究では,ユーザのCSレベルと性格特性の相関関係を実証的ユーザスタディとして検討する。
我々はバイリンガルとのインタビューを行い、その人口統計、性格特性、旅行体験などのプロファイルに関する情報を収集します。
次に、機械学習(ml)を使用して、そのプロファイルに基づいてユーザーのcsレベルを予測する。
我々は分類と回帰タスクの両方を実験する。
以上の結果から,cs行動は,話し手,旅行経験,神経症,転向性パーソナリティ特性の関係に影響されていることが示唆された。
関連論文リスト
- Personality Style Recognition via Machine Learning: Identifying
Anaclitic and Introjective Personality Styles from Patients' Speech [6.3042597209752715]
自然言語処理(NLP)と機械学習ツールを使って分類する。
大うつ病(MDD)と診断された79人の患者を対象に、記録された臨床診断面接(CDI)のデータセットでこれを検証した。
言語由来の特徴(LIWCに基づく)による自動分類は,アンケートに基づく分類モデルよりも有意に優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-07T15:56:19Z) - Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文 参考訳(メタデータ) (2023-10-23T17:42:01Z) - A Survey of Code-switching: Linguistic and Social Perspectives for
Language Technologies [8.202739294785086]
我々は,言語工学における重要な課題を反映して,言語学の文献を網羅するコードスイッチング(C-S)について調査する。
言語学的観点から、ヨーロッパやインドの文脈からの文献に焦点を当てたC-Sの構造的・機能的パターンの概要を述べる。
言語技術の観点から、適切なトレーニングデータがないため、大規模言語モデルが多様なC-S型を表現できないかについて議論する。
論文 参考訳(メタデータ) (2023-01-05T09:08:04Z) - Analyzing the Mono- and Cross-Lingual Pretraining Dynamics of
Multilingual Language Models [73.11488464916668]
本研究では,多言語事前学習プロセスのダイナミクスについて検討する。
我々は,XLM-Rプレトレーニング全体から抽出したチェックポイントを,一連の言語的タスクを用いて探索する。
分析の結果,より複雑なものよりも低レベルな言語スキルが得られ,早期に高い言語性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-05-24T03:35:00Z) - Predicting User Code-Switching Level from Sociological and Psychological
Profiles [24.32063659777203]
ユーザのCS周波数とキャラクタ特性の相関関係を示す。
機械学習(ML)を用いて結果を検証する。
予測モデルは、ユーザのCS周波数を55%以上の精度で予測することができた。
論文 参考訳(メタデータ) (2021-12-13T07:36:02Z) - Perception Point: Identifying Critical Learning Periods in Speech for
Bilingual Networks [58.24134321728942]
ディープニューラルベース視覚唇読解モデルにおける認知的側面を比較し,識別する。
我々は、認知心理学におけるこれらの理論と独自のモデリングの間に強い相関関係を観察する。
論文 参考訳(メタデータ) (2021-10-13T05:30:50Z) - A Massively Multilingual Analysis of Cross-linguality in Shared
Embedding Space [61.18554842370824]
言語間モデルでは、多くの異なる言語に対する表現は同じ空間に存在している。
我々は,bitext検索性能の形式で,言語間アライメントのタスクベース尺度を計算した。
我々はこれらのアライメント指標の潜在的な予測因子として言語的、準言語的、および訓練関連の特徴について検討する。
論文 参考訳(メタデータ) (2021-09-13T21:05:37Z) - Style Variation as a Vantage Point for Code-Switching [54.34370423151014]
Code-Switching (CS) は、複数のバイリンガルコミュニティや多言語コミュニティでよく見られる現象である。
両言語間のスタイルのバリエーションとして,CSの新たな特徴点を提示する。
本稿では,第1段階がCSの競合負例を生成し,第2段階がより現実的なCS文を生成する2段階生成逆トレーニング手法を提案する。
論文 参考訳(メタデータ) (2020-05-01T15:53:16Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。