論文の概要: Identifying Distributional Perspective Differences from Colingual Groups
- arxiv url: http://arxiv.org/abs/2004.04938v2
- Date: Mon, 12 Apr 2021 19:11:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-14 20:07:55.121472
- Title: Identifying Distributional Perspective Differences from Colingual Groups
- Title(参考訳): コリンガルグループからの分布的視点の差異の同定
- Authors: Yufei Tian, Tuhin Chakrabarty, Fred Morstatter and Nanyun Peng
- Abstract要約: 特定の価値観や出来事に対する視点に関する異なるグループ間での相互理解の欠如は、インフォームドな決定や偏見のない意見につながる可能性がある。
本研究では,コリンガル群を研究対象とし,言語コーパスをプロキシとして用いて分布的視点を同定する。
本稿では,共通理解を学習するための新しい計算手法を提案し,その手法を英語,中国語,日本語の文化的認識モデルの構築によって評価する。
- 参考スコア(独自算出の注目度): 41.58939666949895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Perspective differences exist among different cultures or languages. A lack
of mutual understanding among different groups about their perspectives on
specific values or events may lead to uninformed decisions or biased opinions.
Automatically understanding the group perspectives can provide essential
background for many downstream applications of natural language processing
techniques. In this paper, we study colingual groups and use language corpora
as a proxy to identify their distributional perspectives. We present a novel
computational approach to learn shared understandings, and benchmark our method
by building culturally-aware models for the English, Chinese, and Japanese
languages. On a held out set of diverse topics including marriage, corruption,
democracy, our model achieves high correlation with human judgements regarding
intra-group values and inter-group differences.
- Abstract(参考訳): 異なる文化や言語にパースペクティブの違いが存在する。
特定の価値観や出来事に対する視点に関する異なるグループ間の相互理解の欠如は、インフォームドな決定や偏見のない意見につながる可能性がある。
グループパースペクティブの自動理解は、自然言語処理技術の多くの下流アプリケーションに不可欠な背景を提供することができる。
本稿では,コリンガルグループを調査し,言語コーパスを指標として分布的視点を同定する。
本稿では,英語,中国語,日本語の文化認識モデルを構築することにより,共通理解を学習するための新しい計算手法を提案する。
婚姻, 腐敗, 民主主義など多様なトピックについて, 集団内価値と集団間差異に関する人間の判断と高い相関関係が得られた。
関連論文リスト
- Toward Cultural Interpretability: A Linguistic Anthropological Framework for Describing and Evaluating Large Language Models (LLMs) [13.71024600466761]
本稿では,言語人類学と機械学習(ML)の新たな統合を提案する。
新たな調査分野、文化的解釈可能性(CI)の理論的実現可能性を示す。
CIは、言語と文化の間の動的関係がコンテキストに敏感でオープンな会話を可能にする方法を強調している。
論文 参考訳(メタデータ) (2024-11-07T22:01:50Z) - Speech Analysis of Language Varieties in Italy [18.464078978885812]
本研究は,イタリアの多様な言語品種から抽出された音声サンプルの地理的領域を自動的に同定することに焦点を当てる。
我々はまた、これらの多様だが密接に関連する品種間の関係に関する新たな洞察を明らかにすることを模索している。
論文 参考訳(メタデータ) (2024-06-22T14:19:51Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Investigating Cultural Alignment of Large Language Models [10.738300803676655]
LLM(Large Language Models)は,異なる文化で採用されている多様な知識を真にカプセル化していることを示す。
社会学的調査をシミュレートし、実際の調査参加者のモデル応答を参考として、文化的アライメントの定量化を行う。
本稿では,人類学的推論を活用し,文化的アライメントを高める新しい手法である人類学的プロンプティングを紹介する。
論文 参考訳(メタデータ) (2024-02-20T18:47:28Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Assessing Multilingual Fairness in Pre-trained Multimodal
Representations [8.730027941735804]
事前学習された視覚・言語表現は言語間で個別に公平であるが、グループフェアネスは保証されない。
我々は、人種、性別、年齢を含む言語と保護されたグループ間の集団格差を探索する実験を行う。
論文 参考訳(メタデータ) (2021-06-12T03:57:05Z) - Deception detection in text and its relation to the cultural dimension
of individualism/collectivism [6.17866386107486]
本研究は,文化における特定の言語的特徴の活用の相違が,個性主義/選択主義の分断に関して,規範に起因しているかどうかを考察する。
我々は、音韻学、形態学、構文に基づく幅広いn-gram特徴を実験することにより、カルチャー/言語対応分類器を作成する。
我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)から11のデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-05-26T13:09:47Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。