論文の概要: Studying Politeness across Cultures Using English Twitter and Mandarin
Weibo
- arxiv url: http://arxiv.org/abs/2008.02449v3
- Date: Tue, 25 Aug 2020 01:47:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-07 00:18:49.771553
- Title: Studying Politeness across Cultures Using English Twitter and Mandarin
Weibo
- Title(参考訳): 英語 Twitter と Mandarin Weibo を用いた文化のポリテネスに関する研究
- Authors: Mingyang Li, Louis Hickman, Louis Tay, Lyle Ungar, Sharath Chandra
Guntuku
- Abstract要約: 米国英語および中国語における丁寧さに関連する言語的特徴について検討する。
マンダリン・ワイボでは、今後の議論、グループ関係の特定、感謝は英語のTwitterよりも礼儀正しいと考えられている。
死に関連するタブーの話題、代名詞の選択の欠如、非公式な言語は、英語のTwitterと比べてマンダリン・ワイボの虚偽性が高い。
- 参考スコア(独自算出の注目度): 13.694598466242008
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modeling politeness across cultures helps to improve intercultural
communication by uncovering what is considered appropriate and polite. We study
the linguistic features associated with politeness across US English and
Mandarin Chinese. First, we annotate 5,300 Twitter posts from the US and 5,300
Sina Weibo posts from China for politeness scores. Next, we develop an English
and Chinese politeness feature set, `PoliteLex'. Combining it with validated
psycholinguistic dictionaries, we then study the correlations between
linguistic features and perceived politeness across cultures. We find that on
Mandarin Weibo, future-focusing conversations, identifying with a group
affiliation, and gratitude are considered to be more polite than on English
Twitter. Death-related taboo topics, lack of or poor choice of pronouns, and
informal language are associated with higher impoliteness on Mandarin Weibo
compared to English Twitter. Finally, we build language-based machine learning
models to predict politeness with an F1 score of 0.886 on Mandarin Weibo and a
0.774 on English Twitter.
- Abstract(参考訳): 文化間の礼儀正しいモデリングは、適切で礼儀正しいと考えられるものを明らかにすることによって、文化間コミュニケーションを改善するのに役立つ。
米国英語と中国語の丁寧さに関連する言語的特徴について検討した。
まず、米国から5300件のTwitter投稿と中国から5300件のSina Weibo投稿に礼儀正しいスコアを付けた。
次に、英語と中国語の丁寧な特徴セット「PoliteLex」を開発する。
検証された精神言語辞書と組み合わせて、言語的特徴と文化間の丁寧さの相関について検討する。
マンダリン・ヴァイボー(mandarin weibo)では、将来重視される会話、グループ提携による識別、感謝は英語のtwitterよりも丁寧であると考えられている。
死に関連するタブーの話題、代名詞の選択の欠如、非公式な言語は、英語のTwitterと比べてマンダリン・ワイボの虚偽性が高い。
最後に,mandarin weiboのf1スコア0.886,英語twitterの0.774を用いて,丁寧さを予測するための言語ベースの機械学習モデルを構築した。
関連論文リスト
- How Chinese are Chinese Language Models? The Puzzling Lack of Language Policy in China's LLMs [2.9123921488295768]
18言語で中国語企業によって事前訓練された6つのオープンソース多言語LPMを評価した。
実験の結果,中国における多言語でのLLMのパフォーマンスは国際LLMと区別できないことがわかった。
われわれは、中国のLLM開発において、言語多様性のいずれに対しても、一貫した政策の兆候は見つからない。
論文 参考訳(メタデータ) (2024-07-12T19:21:40Z) - HyperCLOVA X Technical Report [119.94633129762133]
韓国語と文化に合わせた大型言語モデル(LLM)のファミリーであるHyperCLOVA Xを紹介する。
HyperCLOVA Xは韓国語、英語、コードデータのバランスの取れた混合でトレーニングされ、その後、高品質な人間アノテーション付きデータセットによる命令チューニングが行われた。
このモデルは、韓国語と英語の両方で、包括的な推論、知識、常識、事実性、コーディング、数学、チャット、指示追従、無害など、様々なベンチマークで評価されている。
論文 参考訳(メタデータ) (2024-04-02T13:48:49Z) - Shuo Wen Jie Zi: Rethinking Dictionaries and Glyphs for Chinese Language
Pre-training [50.100992353488174]
辞書知識と漢字の構造を持つ中国語PLMの意味理解能力を高める新しい学習パラダイムであるCDBERTを紹介する。
我々はCDBERTの2つの中核モジュールを Shuowen と Jiezi と名付け、そこで Shuowen は中国語辞書から最も適切な意味を取り出す過程を指す。
本パラダイムは,従来の中国語PLMのタスク間における一貫した改善を実証する。
論文 参考訳(メタデータ) (2023-05-30T05:48:36Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Improve Bilingual TTS Using Dynamic Language and Phonology Embedding [10.244215079409797]
本稿では,中国語の単言語話者からより標準の英語音声を取得するために,マンダリン・イングリッシュ・TSシステムを構築した。
言語と音韻の動的強度を捉えるための埋め込み強度変調器を特別に設計する。
論文 参考訳(メタデータ) (2022-12-07T03:46:18Z) - TyDiP: A Dataset for Politeness Classification in Nine Typologically
Diverse Languages [33.540256516320326]
類型的多様言語9言語における丁寧さ現象について検討する。
それぞれの言語で500の例に対して3方向の丁寧なアノテーションを含むデータセットであるTyDiPを作成します。
論文 参考訳(メタデータ) (2022-11-29T18:58:15Z) - Speaking Multiple Languages Affects the Moral Bias of Language Models [70.94372902010232]
事前訓練された多言語言語モデル(PMLM)は、複数の言語からのデータや言語間転送を扱う際に一般的に用いられる。
モデルは英語から道徳的規範を捉え、他の言語に強制するか?
我々の実験は、事実、PMLMが道徳的バイアスを符号化していることを示しているが、これらは必ずしも人間の意見の文化的相違や共通点に対応しているわけではない。
論文 参考訳(メタデータ) (2022-11-14T20:08:54Z) - COLD: A Benchmark for Chinese Offensive Language Detection [54.60909500459201]
COLDatasetは、37kの注釈付き文を持つ中国の攻撃的言語データセットである。
また、人気のある中国語モデルの出力攻撃性を研究するために、textscCOLDetectorを提案する。
我々の資源と分析は、中国のオンラインコミュニティを解毒し、生成言語モデルの安全性を評価することを目的としている。
論文 参考訳(メタデータ) (2022-01-16T11:47:23Z) - Prediction of Political Leanings of Chinese Speaking Twitter Users [0.0]
まず、有名な政治人物とその関連ユーザーのツイートをスクラップしてデータを収集する。
第二に、中国共産党への承認を示すグループと、そうでないグループである。
Twitter上のツイートからユーザの政治的スタンスを理解するために,高精度な分類モデルを生成する。
論文 参考訳(メタデータ) (2021-10-12T03:18:10Z) - I love your chain mail! Making knights smile in a fantasy game world:
Open-domain goal-oriented dialogue agents [69.68400056148336]
我々は、模倣学習したチトチャットモデルに対して強化学習を施した目標指向モデルを訓練する。
両モデルが逆モデルベースラインより優れており,目標を達成するために対話相手と自然に会話できることを示す。
論文 参考訳(メタデータ) (2020-02-07T16:22:36Z) - Evaluating Online Public Sentiments towards China: A Case Study of
English and Chinese Twitter Discourse during the 2019 Chinese National Day [0.8594140167290097]
本研究は,ソーシャルメディアデータを用いたオンライン世論分析のアプローチについて述べる。
9月30日から10月3日までの間に30万以上のツイートが収集され、収集されたツイートの感情を評価するためにSVMと辞書のハイブリッド手法が適用された。
その結果,国民の日を祝う活動の時期と,英語と中国語のつぶやきで表された感情の一致が示唆された。
論文 参考訳(メタデータ) (2020-01-13T02:09:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。