論文の概要: A Perspectival Mirror of the Elephant: Investigating Language Bias on
Google, ChatGPT, Wikipedia, and YouTube
- arxiv url: http://arxiv.org/abs/2303.16281v1
- Date: Tue, 28 Mar 2023 19:49:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-30 16:51:10.410488
- Title: A Perspectival Mirror of the Elephant: Investigating Language Bias on
Google, ChatGPT, Wikipedia, and YouTube
- Title(参考訳): Google, ChatGPT, Wikipedia, YouTubeにおける言語バイアスの調査
- Authors: Queenie Luo, Michael J. Puett, Michael D. Smith
- Abstract要約: Googleとその最も顕著なリターンは、複雑なトピックの検索言語に結びついている文化的なステレオタイプを単純に反映していることに気付きました。
複雑なトピックのグローバルな画像を提示する代わりに、オンライン検索は私たちを擬似盲人に変える。
本稿では,言語バイアスを利用した自動翻訳手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contrary to Google Search's mission of delivering information from "many
angles so you can form your own understanding of the world," we find that
Google and its most prominent returned results -- Wikipedia and YouTube, simply
reflect the narrow set of cultural stereotypes tied to the search language for
complex topics like "Buddhism," "Liberalism," "colonization," "Iran" and
"America." Simply stated, they present, to varying degrees, distinct
information across the same search in different languages (we call it 'language
bias'). Instead of presenting a global picture of a complex topic, our online
searches turn us into the proverbial blind person touching a small portion of
an elephant, ignorant of the existence of other cultural perspectives. The
language we use to search ends up as a cultural filter to promote ethnocentric
views, where a person evaluates other people or ideas based on their own
culture. We also find that language bias is deeply embedded in ChatGPT. As it
is primarily trained on English language data, it presents the Anglo-American
perspective as the normative view, reducing the complexity of a multifaceted
issue to the single Anglo-American standard. In this paper, we present evidence
and analysis of language bias and discuss its larger social implications.
Toward the end of the paper, we propose a potential framework of using
automatic translation to leverage language bias and argue that the task of
piecing together a genuine depiction of the elephant is a challenging and
important endeavor that deserves a new area of research in NLP and requires
collaboration with scholars from the humanities to create ethically sound and
socially responsible technology together.
- Abstract(参考訳): グーグル検索が「世界を理解するために多くの角度」から情報を提供するというミッションとは対照的に、グーグルとその最も顕著な成果は「バッダーリズム」や「リベリズム」、「コロン化」、「イラン」、そして「アメリカ」といった複雑なトピックの検索言語に結びついている文化的なステレオタイプを反映している。
簡単に言えば、彼らは異なる言語で同じ検索をまたいだ異なる情報を提示する(我々はそれを「言語バイアス」と呼んでいる)。
複雑なトピックのグローバルなイメージを提示する代わりに、私たちのオンライン検索は、他の文化的視点の存在に無関係に、象の小さな部分に触れる、実証的な盲人になるのです。
私たちが検索に使用する言語は、個人が自身の文化に基づいて他人やアイデアを評価する、エスノセントリックな見解を促進するための文化フィルターとして使われます。
また、言語バイアスがChatGPTに深く埋め込まれていることもわかりました。
主に英語のデータに基づいて訓練されているため、英米の視点を規範的な視点として示し、多面的な問題の複雑さを単一英米標準に還元する。
本稿では,言語バイアスの証拠と分析を行い,そのより大きな社会的影響について議論する。
論文の最後には,言語バイアスを活用するために自動翻訳を利用する可能性があり,また,象の真の描写をまとめる作業は,NLPの新たな研究分野にふさわしい課題であり,倫理的に健全で社会的に責任のある技術を生み出すためには,人文科学の研究者との協力が必要である,と論じている。
関連論文リスト
- Comparing diversity, negativity, and stereotypes in Chinese-language AI technologies: a case study on Baidu, Ernie and Qwen [1.3354439722832292]
我々は、中国の主要検索エンジンBaiduに埋め込まれた社会的偏見を調査し、中国ベースのツールを調査した。
上記のツールにエンコードされた30万以上のビューを,そのようなグループを記述した候補語に誘導することで収集する。
言語モデルは検索エンジンに比べて多種多様な組込みビューを示すが、BaiduとQwenはErnieよりもネガティブなコンテンツを生成することが多い。
論文 参考訳(メタデータ) (2024-08-28T10:51:18Z) - See It from My Perspective: Diagnosing the Western Cultural Bias of Large Vision-Language Models in Image Understanding [78.88461026069862]
視覚言語モデル(VLM)は、多くの言語における画像に関するクエリに応答することができる。
我々は、画像理解における西洋の偏見を実証し、局所化する新しい研究を提案する。
論文 参考訳(メタデータ) (2024-06-17T15:49:51Z) - A comparison of online search engine autocompletion in Google and Baidu [3.5016560416031886]
本稿では,BaiduとGoogleの2つの言語的・文化的文脈における検索オートコンプリートの特徴について検討する。
2つの検索エンジンの違いは、元のクエリの抑制や修正の仕方にある。
我々の研究は、現在の言語技術においてより洗練され、文化的に敏感なモデレーション戦略の必要性を強調した。
論文 参考訳(メタデータ) (2024-05-03T08:17:04Z) - Global Voices, Local Biases: Socio-Cultural Prejudices across Languages [22.92083941222383]
人間の偏見はユビキタスであるが、一様ではない。言語、文化、社会的境界を越えて格差が存在する。
本研究では,Word Embedding Association Test (WEAT) を24言語に拡張し,より広範な研究を可能にする。
より広く普及している社会的バイアスを包含するために、毒性、能力主義などにわたる新しいバイアス次元について検討する。
論文 参考訳(メタデータ) (2023-10-26T17:07:50Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Annotators with Attitudes: How Annotator Beliefs And Identities Bias
Toxic Language Detection [75.54119209776894]
本研究では,アノテータのアイデンティティ(誰)と信念(なぜ)が有害な言語アノテーションに与える影響について検討する。
我々は、アンチブラック言語、アフリカ系アメリカ人の英語方言、俗語という3つの特徴を持つポストを考察する。
以上の結果から,アノテータのアイデンティティと信念と毒性評価の相関が強く示唆された。
論文 参考訳(メタデータ) (2021-11-15T18:58:20Z) - Deception detection in text and its relation to the cultural dimension
of individualism/collectivism [6.17866386107486]
本研究は,文化における特定の言語的特徴の活用の相違が,個性主義/選択主義の分断に関して,規範に起因しているかどうかを考察する。
我々は、音韻学、形態学、構文に基づく幅広いn-gram特徴を実験することにより、カルチャー/言語対応分類器を作成する。
我々は6カ国(米国、ベルギー、インド、ロシア、メキシコ、ルーマニア)の5言語(英語、オランダ、ロシア、スペイン、ルーマニア)から11のデータセットを用いて実験を行った。
論文 参考訳(メタデータ) (2021-05-26T13:09:47Z) - Multilingual Contextual Affective Analysis of LGBT People Portrayals in
Wikipedia [34.183132688084534]
物語文における特定の語彙選択は、物語の中の人々に対する作家の態度を反映し、聴衆の反応に影響を与える。
言語や文化によって単語の意味がどう異なるかを示し、既存の英語データセットを一般化することの難しさを浮き彫りにしている。
次に、LGBTコミュニティのメンバーのウィキペディアの伝記ページを3つの言語で分析することで、本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-10-21T08:27:36Z) - Visual Grounding in Video for Unsupervised Word Translation [91.47607488740647]
我々は、言語間の教師なし単語マッピングを改善するために、視覚的接地を用いる。
ネイティブ言語でナレーションされた無人の教育ビデオから埋め込みを学習する。
これらの手法を英語からフランス語、韓国語、日本語への翻訳に適用する。
論文 参考訳(メタデータ) (2020-03-11T02:03:37Z) - A Framework for the Computational Linguistic Analysis of Dehumanization [52.735780962665814]
我々は1986年から2015年にかけてニューヨーク・タイムズでLGBTQの人々に関する議論を分析した。
LGBTQの人々の人為的な記述は、時間とともにますます増えています。
大規模に非人間化言語を分析する能力は、メディアバイアスを自動的に検出し、理解するだけでなく、オンラインで乱用する言語にも影響を及ぼす。
論文 参考訳(メタデータ) (2020-03-06T03:02:12Z) - Mi YouTube es Su YouTube? Analyzing the Cultures using YouTube
Thumbnails of Popular Videos [98.87558262467257]
本研究では,YouTubeのトレンド動画のサムネイルを用いて,各国の文化選好について検討した。
実験の結果、類似文化のユーザーはYouTubeで同様のビデオを見ることに興味を持っていることがわかった。
論文 参考訳(メタデータ) (2020-01-27T20:15:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。