Fugu-MT 論文翻訳(概要): An Empirical Study on the Characteristics of Bias upon Context Length Variation for Bangla

論文の概要: An Empirical Study on the Characteristics of Bias upon Context Length Variation for Bangla

arxiv url: http://arxiv.org/abs/2406.17375v1
Date: Tue, 25 Jun 2024 08:49:11 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-26 15:01:42.374431
Title: An Empirical Study on the Characteristics of Bias upon Context Length Variation for Bangla
Title（参考訳）: バングラの文脈長変化に伴うバイアスの特性に関する実証的研究
Authors: Jayanta Sadhu, Ayan Antik Khan, Abhik Bhattacharjee, Rifat Shahriyar,
Abstract要約: バングラで本質的な性別バイアス測定のためのデータセットを作成する。既存のバイアス測定手法をバングラに適用するために必要な適応について論じる。文脈長変動がバイアス測定に及ぼす影響について検討する。
参考スコア（独自算出の注目度）: 4.494043534116323
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Pretrained language models inherently exhibit various social biases, prompting a crucial examination of their social impact across various linguistic contexts due to their widespread usage. Previous studies have provided numerous methods for intrinsic bias measurements, predominantly focused on high-resource languages. In this work, we aim to extend these investigations to Bangla, a low-resource language. Specifically, in this study, we (1) create a dataset for intrinsic gender bias measurement in Bangla, (2) discuss necessary adaptations to apply existing bias measurement methods for Bangla, and (3) examine the impact of context length variation on bias measurement, a factor that has been overlooked in previous studies. Through our experiments, we demonstrate a clear dependency of bias metrics on context length, highlighting the need for nuanced considerations in Bangla bias analysis. We consider our work as a stepping stone for bias measurement in the Bangla Language and make all of our resources publicly available to support future research.
Abstract（参考訳）: 事前訓練された言語モデルは本質的に様々な社会的バイアスを示しており、広く使われているため、様々な言語文脈における社会的影響を決定的に検証するきっかけとなった。従来の研究では、主に高リソース言語に焦点を当てた固有バイアス測定のための多くの方法が提供されてきた。本研究では,これらの調査を低リソース言語であるBanglaに拡張することを目的としている。具体的には,(1)バングラにおける内在性バイアス測定のためのデータセットを作成し,(2)既存のバイアス測定方法を適用するために必要な適応について考察し,(3)従来の研究で見過ごされた要因である,文脈長の変化がバイアス測定に与える影響を検討する。実験を通じて,コンテキスト長に対するバイアス指標の明確な依存性を実証し,バングラのバイアス分析における微妙な考察の必要性を強調した。我々は、バングラ語におけるバイアス測定の足掛かりとして、将来の研究を支援するために、我々のすべてのリソースを一般公開すると考えている。

関連論文リスト

Cross-Lingual Probing and Community-Grounded Analysis of Gender Bias in Low-Resource Bengali [0.058633603884542605]
本研究は,ベンガルにおけるジェンダーバイアスの特徴と大きさを検討することを目的とする。我々は、語彙に基づくマイニング、計算分類モデル、翻訳に基づく比較分析、GPTに基づくバイアス生成など、性別バイアスのある発話を抽出するために、いくつかの手法を用いる。その結果、ベンガル語におけるジェンダーバイアスは、より局所的で文脈に敏感な方法論を必要とする、英語と異なる特徴を示すことが明らかとなった。
論文参考訳（メタデータ） (2026-01-25T09:38:13Z)
Beyond Early-Token Bias: Model-Specific and Language-Specific Position Effects in Multilingual LLMs [50.07451351559251]
我々は,5言語(英語,ロシア語,ドイツ語,ヒンディー語,ベトナム語)にまたがる調査を行った。位置バイアスが即時戦略とどのように相互作用し、出力エントロピーに影響を及ぼすかを検討する。
論文参考訳（メタデータ） (2025-05-22T02:23:00Z)
How far can bias go? -- Tracing bias from pretraining data to alignment [54.51310112013655]
本研究では, 事前学習データにおける性別占有バイアスと, LLMにおける性別占有バイアスの相関について検討した。その結果,事前学習データに存在するバイアスがモデル出力に増幅されることが判明した。
論文参考訳（メタデータ） (2024-11-28T16:20:25Z)
Spoken Stereoset: On Evaluating Social Bias Toward Speaker in Speech Large Language Models [50.40276881893513]
本研究では,音声大言語モデル(SLLM)における社会的バイアスの評価を目的としたデータセットであるSpken Stereosetを紹介する。多様な人口集団の発話に対して異なるモデルがどのように反応するかを調べることで、これらのバイアスを特定することを目指している。これらの結果から,ほとんどのモデルではバイアスが最小であるが,ステレオタイプや反ステレオタイプ傾向がわずかにみられた。
論文参考訳（メタデータ） (2024-08-14T16:55:06Z)
Social Bias in Large Language Models For Bangla: An Empirical Study on Gender and Religious Bias [2.98683507969764]
LLM生成したバングラ語に対する2種類の社会的バイアスについて検討した。これは、バングラのLLMのバイアス評価を私たちの知識の最大限に活用する、この種の研究としては初めてのものです。すべてのコードとリソースは、Bangla NLPにおけるバイアス関連研究の進展のために公開されています。
論文参考訳（メタデータ） (2024-07-03T22:45:36Z)
Semantic Properties of cosine based bias scores for word embeddings [48.0753688775574]
本稿では,バイアスの定量化に有効なバイアススコアの要件を提案する。これらの要件について,コサインに基づくスコアを文献から分析する。これらの結果は、バイアススコアの制限がアプリケーションケースに影響を及ぼすことを示す実験で裏付けられている。
論文参考訳（メタデータ） (2024-01-27T20:31:10Z)
Quantifying the Dialect Gap and its Correlates Across Languages [69.18461982439031]
この研究は、明らかな相違を明らかにし、マインドフルなデータ収集を通じてそれらに対処する可能性のある経路を特定することによって、方言NLPの分野を強化する基盤となる。
論文参考訳（メタデータ） (2023-10-23T17:42:01Z)
This Prompt is Measuring <MASK>: Evaluating Bias Evaluation in Language Models [12.214260053244871]
言語モデルのバイアスを評価するためにプロンプトとテンプレートを使用する作業の本体を分析します。我々は、バイアステストが測定する目的を捉える属性の分類を作成するために、測定モデリングフレームワークを設計する。我々の分析は、フィールドが測定できる可能性のあるバイアスタイプの範囲を照らし、まだ調査されていないタイプを明らかにします。
論文参考訳（メタデータ） (2023-05-22T06:28:48Z)
An Analysis of Social Biases Present in BERT Variants Across Multiple Languages [0.0]
多様な言語からなる単言語BERTモデルにおけるバイアスについて検討する。文の擬似類似度に基づいて,任意のバイアスを測定するテンプレートベースの手法を提案する。偏見探索の現在の手法は言語に依存していると結論付けている。
論文参考訳（メタデータ） (2022-11-25T23:38:08Z)
Challenges in Measuring Bias via Open-Ended Language Generation [1.5552869983952944]
我々は、プロンプトセット、メトリクス、自動ツール、サンプリング戦略の特定の選択がバイアス結果にどのように影響するかを分析する。オープンな言語生成におけるバイアスを報告するためのレコメンデーションを提供する。
論文参考訳（メタデータ） (2022-05-23T19:57:15Z)
Naturalistic Causal Probing for Morpho-Syntax [76.83735391276547]
スペインにおける実世界のデータに対する入力レベルの介入に対する自然主義的戦略を提案する。提案手法を用いて,共同設立者から文章中の形態・症状の特徴を抽出する。本研究では,事前学習したモデルから抽出した文脈化表現に対する性別と数字の因果効果を解析するために,本手法を適用した。
論文参考訳（メタデータ） (2022-05-14T11:47:58Z)
Towards an Enhanced Understanding of Bias in Pre-trained Neural Language Models: A Survey with Special Emphasis on Affective Bias [2.6304695993930594]
本稿では,大規模な事前学習言語モデルにおけるバイアスの理解,それらの発生ステージの分析,およびこれらのバイアスを定量化し緩和する様々な方法を提案する。ビジネス,医療,教育などの実世界のシステムにおいて,テキストによる情緒的コンピューティングに基づく下流作業の幅広い適用性を考慮すると,感情(感情)の文脈における偏見(感情)、すなわち感情的バイアス(Affective Bias)の探究に特に重点を置いている。本稿では,将来の研究を支援する各種バイアス評価コーパスの概要と,事前学習言語モデルにおけるバイアス研究の課題について述べる。
論文参考訳（メタデータ） (2022-04-21T18:51:19Z)
The SAME score: Improved cosine based bias score for word embeddings [49.75878234192369]
埋め込みにおけるセマンティックバイアスのための新しいバイアススコアであるPetを紹介した。本研究は,下水道作業における意味バイアスを測定し,社会的バイアスの潜在的な原因を特定することができることを示す。
論文参考訳（メタデータ） (2022-03-28T09:28:13Z)
Balancing out Bias: Achieving Fairness Through Training Reweighting [58.201275105195485]
自然言語処理におけるバイアスは、性別や人種などの著者の特徴を学習するモデルから生じる。既存のバイアスの緩和と測定方法は、著者の人口統計学と言語変数の相関を直接考慮していない。本稿では,インスタンス再重み付けを用いたバイアス対策法を提案する。
論文参考訳（メタデータ） (2021-09-16T23:40:28Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。