論文の概要: A tool to overcome technical barriers for bias assessment in human
language technologies
- arxiv url: http://arxiv.org/abs/2207.06591v1
- Date: Thu, 14 Jul 2022 01:07:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-15 12:35:22.873470
- Title: A tool to overcome technical barriers for bias assessment in human
language technologies
- Title(参考訳): ヒューマン言語技術におけるバイアス評価の技術的障壁を克服するツール
- Authors: Laura Alonso Alemany, Luciana Benotti, Luc\'ia Gonz\'alez, Jorge
S\'anchez, Beatriz Busaniche, Alexia Halvorsen, Mat\'ias Bordone
- Abstract要約: ワード埋め込みは、現代の自然言語処理システムにおいて重要なコンポーネントである。
それらは多くのアプリケーションの性能を高めた単語の表現を提供する。
彼らはステレオタイプと社会的バイアスを蒸留し、最終的な用途に伝達する。
- 参考スコア(独自算出の注目度): 2.6091909702028584
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Automatic processing of language is becoming pervasive in our lives, often
taking central roles in our decision making, like choosing the wording for our
messages and mails, translating our readings, or even having full conversations
with us. Word embeddings are a key component of modern natural language
processing systems. They provide a representation of words that has boosted the
performance of many applications, working as a semblance of meaning. Word
embeddings seem to capture a semblance of the meaning of words from raw text,
but, at the same time, they also distill stereotypes and societal biases which
are subsequently relayed to the final applications. Such biases can be
discriminatory. It is very important to detect and mitigate those biases, to
prevent discriminatory behaviors of automated processes, which can be much more
harmful than in the case of humans because their of their scale. There are
currently many tools and techniques to detect and mitigate biases in word
embeddings, but they present many barriers for the engagement of people without
technical skills. As it happens, most of the experts in bias, either social
scientists or people with deep knowledge of the context where bias is harmful,
do not have such skills, and they cannot engage in the processes of bias
detection because of the technical barriers. We have studied the barriers in
existing tools and have explored their possibilities and limitations with
different kinds of users. With this exploration, we propose to develop a tool
that is specially aimed to lower the technical barriers and provide the
exploration power to address the requirements of experts, scientists and people
in general who are willing to audit these technologies.
- Abstract(参考訳): 言語の自動処理は、私たちの生活で広く普及し、メッセージやメールの単語選択、読みの翻訳、会話の完全化など、意思決定において中心的な役割を担っています。
単語埋め込みは、現代の自然言語処理システムの主要なコンポーネントである。
それらは、多くのアプリケーションのパフォーマンスを高める言葉の表現を提供し、意味の接点として機能する。
単語埋め込みは原文からの単語の意味の類似を捉えているように見えるが、同時にステレオタイプや社会バイアスを蒸留し、最終的に最終的な応用へと伝達する。
このような偏見は差別的である。
これらのバイアスを検出して軽減し、自動化プロセスの差別的行動を防止することが非常に重要である。
現在、単語埋め込みのバイアスを検出し軽減するためのツールやテクニックは数多く存在するが、技術スキルを持たない人々の関与には多くの障壁がある。
バイアスの専門家の多くは、社会科学者でも、バイアスが有害な状況について深い知識を持っている人でも、そのようなスキルを持っておらず、技術的な障壁のためにバイアス検出のプロセスに携わることができない。
私たちは既存のツールの障壁を研究し、さまざまな種類のユーザでその可能性と限界を探求しました。
本研究では,これらの技術の監査を希望する専門家,科学者,一般市民の要求に対処するための,技術的障壁の低減と探索力の提供を目的としたツールの開発を提案する。
関連論文リスト
- Combatting Human Trafficking in the Cyberspace: A Natural Language
Processing-Based Methodology to Analyze the Language in Online Advertisements [55.2480439325792]
このプロジェクトは、高度自然言語処理(NLP)技術により、オンラインC2Cマーケットプレースにおける人身売買の急激な問題に取り組む。
我々は、最小限の監督で擬似ラベル付きデータセットを生成する新しい手法を導入し、最先端のNLPモデルをトレーニングするための豊富なリソースとして機能する。
重要な貢献は、Integrated Gradientsを使った解釈可能性フレームワークの実装であり、法執行にとって重要な説明可能な洞察を提供する。
論文 参考訳(メタデータ) (2023-11-22T02:45:01Z) - Towards Bridging the Digital Language Divide [4.234367850767171]
多言語言語処理システムは、しばしばハードワイヤで、通常不随意で、特定の言語に対して隠された表現的嗜好を示す。
偏りのある技術は、しばしば表現される言語の複雑さに不公平な研究・開発手法の結果であることを示す。
我々は,技術設計と方法論の両面から,言語バイアスを減らすことを目的とした新しいイニシアティブを提案する。
論文 参考訳(メタデータ) (2023-07-25T10:53:20Z) - National Origin Discrimination in Deep-learning-powered Automated Resume
Screening [3.251347385432286]
多くの企業や組織は、採用プロセスを支援するために、ある種のAI対応のオートマットツールを使い始めています。
AIシステムの根底にあるバイアスによって、候補者に対する不公平な扱いが懸念されている。
本研究では,近年の技術革新である深層学習手法について検討し,自動再開検診への応用に焦点をあてた。
論文 参考訳(メタデータ) (2023-07-13T01:35:29Z) - Ecosystem-level Analysis of Deployed Machine Learning Reveals Homogeneous Outcomes [72.13373216644021]
本研究では,機械学習の社会的影響を,特定の文脈に展開されるモデルの集合を考慮し検討する。
デプロイされた機械学習はシステム障害を起こしやすいため、利用可能なすべてのモデルに排他的に誤分類されているユーザもいます。
これらの例は、エコシステムレベルの分析が、機械学習の社会的影響を特徴づける独自の強みを持っていることを示している。
論文 参考訳(メタデータ) (2023-07-12T01:11:52Z) - Language-Driven Representation Learning for Robotics [115.93273609767145]
ロボット工学における視覚表現学習の最近の研究は、日々の作業を行う人間の大規模なビデオデータセットから学ぶことの可能性を実証している。
人間のビデオやキャプションから言語による表現学習を行うためのフレームワークを提案する。
我々は、Voltronの言語駆動学習が、特に高レベル制御を必要とするターゲット問題において、先行技術よりも優れていることを発見した。
論文 参考訳(メタデータ) (2023-02-24T17:29:31Z) - Language technology practitioners as language managers: arbitrating data
bias and predictive bias in ASR [0.0]
我々は、言語政策のレンズを使用して、業界におけるASRシステムのトレーニングとテストの現在の実践が、これらの体系的なエラーの違いをもたらすデータバイアスにどのように結びつくかを分析する。
我々は,言語資源の再フレーミングを,市場だけでなく,言論コミュニティの有意義な協力のもとに設計すべき(公的な)基盤として提案する。
論文 参考訳(メタデータ) (2022-02-25T10:37:52Z) - Capturing Failures of Large Language Models via Human Cognitive Biases [18.397404180932373]
OpenAIのCodex errsは、入力プロンプトのフレーム化、アンカーへの出力の調整、頻繁なトレーニング例を模倣する出力へのバイアスなどに基づいている。
我々の実験は、認知科学が現代の機械学習システムがどのように振る舞うかをよりよく理解するために有用な跳躍点になり得ることを示唆している。
論文 参考訳(メタデータ) (2022-02-24T18:58:52Z) - My Teacher Thinks The World Is Flat! Interpreting Automatic Essay
Scoring Mechanism [71.34160809068996]
最近の研究では、自動スコアリングシステムが常識的な敵対的サンプルになりやすいことが示されています。
近年の解釈能力の進歩を活かし,コヒーレンスやコンテント,関連性といった特徴がスコアリングの自動化にどの程度重要であるかを見出す。
また、モデルが意味的に世界知識や常識に基づかないことから、世界のような虚偽の事実を追加することは、それを減らすよりもむしろスコアを増加させる。
論文 参考訳(メタデータ) (2020-12-27T06:19:20Z) - Curious Case of Language Generation Evaluation Metrics: A Cautionary
Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。
これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。
本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文 参考訳(メタデータ) (2020-10-26T13:57:20Z) - Mechanisms for Handling Nested Dependencies in Neural-Network Language
Models and Humans [75.15855405318855]
我々は,「深層学習」手法で訓練された現代人工ニューラルネットワークが,人間の文処理の中心的な側面を模倣するかどうかを検討した。
ネットワークは、大きなコーパスで次の単語を予測するためにのみ訓練されたが、分析の結果、局所的および長距離の構文合意をうまく処理する特別なユニットが出現した。
我々は,複数の名詞の単数/複数状態における体系的な変化を伴う文中の数一致の違反を人間が検出する行動実験において,モデルの予測を検証した。
論文 参考訳(メタデータ) (2020-06-19T12:00:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。