論文の概要: Automated Identification of Sexual Orientation and Gender Identity
Discriminatory Texts from Issue Comments
- arxiv url: http://arxiv.org/abs/2311.08485v1
- Date: Tue, 14 Nov 2023 19:24:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 18:44:14.535054
- Title: Automated Identification of Sexual Orientation and Gender Identity
Discriminatory Texts from Issue Comments
- Title(参考訳): 問題コメントからの性指向と性同一性識別テキストの自動識別
- Authors: Sayma Sultana and Jaydeb Sarker and Farzana Israt and Rajshakhar Paul
and Amiangshu Bosu
- Abstract要約: 本研究の目的は、ソフトウェア開発者のコミュニケーションから性指向と性同一性識別(SGID)テキストを識別する自動メカニズムを開発することである。
SGID4SEには6つの前処理ステップと10の最先端アルゴリズムが組み込まれている。
- 参考スコア(独自算出の注目度): 3.3623754851294265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In an industry dominated by straight men, many developers representing other
gender identities and sexual orientations often encounter hateful or
discriminatory messages. Such communications pose barriers to participation for
women and LGBTQ+ persons. Due to sheer volume, manual inspection of all
communications for discriminatory communication is infeasible for a large-scale
Free Open-Source Software (FLOSS) community. To address this challenge, this
study aims to develop an automated mechanism to identify Sexual orientation and
Gender identity Discriminatory (SGID) texts from software developers'
communications. On this goal, we trained and evaluated SGID4SE ( Sexual
orientation and Gender Identity Discriminatory text identification for (4)
Software Engineering texts) as a supervised learning-based SGID detection tool.
SGID4SE incorporates six preprocessing steps and ten state-of-the-art
algorithms. SGID4SE implements six different strategies to improve the
performance of the minority class. We empirically evaluated each strategy and
identified an optimum configuration for each algorithm. In our ten-fold
cross-validation-based evaluations, a BERT-based model boosts the best
performance with 85.9% precision, 80.0% recall, and 82.9% F1-Score for the SGID
class. This model achieves 95.7% accuracy and 80.4% Matthews Correlation
Coefficient. Our dataset and tool establish a foundation for further research
in this direction.
- Abstract(参考訳): ストレートな男性に支配される業界では、他の性別のアイデンティティや性的指向を表す多くの開発者は、しばしば憎しみや差別的なメッセージに遭遇する。
このようなコミュニケーションは、女性やLGBTQ+の人々への参加に障壁をもたらす。
大規模フリーオープンソースソフトウェア(FLOSS)コミュニティにおいて,識別コミュニケーションのためのすべてのコミュニケーションを手動で検査することは不可能である。
本研究の目的は、ソフトウェア開発者のコミュニケーションから性指向と性同一性識別(SGID)テキストを識別する自動メカニズムを開発することである。
本研究の目的は,SGID4SE (Sexual orientation and Gender Identity Discriminatory text Identification for (4) Software Engineering texts) を教師付き学習ベースSGID検出ツールとして訓練し,評価することである。
SGID4SEには6つの前処理ステップと10の最先端アルゴリズムが組み込まれている。
SGID4SEは、マイノリティクラスのパフォーマンスを改善するために、6つの異なる戦略を実装している。
我々は各戦略を実験的に評価し,各アルゴリズムの最適構成を同定した。
10倍のクロスバリデーションに基づく評価では、BERTベースのモデルが85.9%の精度、80.0%のリコール、82.9%のF1スコアで最高のパフォーマンスを向上する。
このモデルは95.7%の精度と80.4%のマシューズ相関係数を達成する。
我々のデータセットとツールは、この方向にさらなる研究の基盤を確立する。
関連論文リスト
- GenderCARE: A Comprehensive Framework for Assessing and Reducing Gender Bias in Large Language Models [73.23743278545321]
大規模言語モデル(LLM)は、自然言語生成において顕著な能力を示してきたが、社会的バイアスを増大させることも観察されている。
GenderCAREは、革新的な基準、バイアス評価、リダクションテクニック、評価メトリクスを含む包括的なフレームワークである。
論文 参考訳(メタデータ) (2024-08-22T15:35:46Z) - IdentiFace : A VGG Based Multimodal Facial Biometric System [0.0]
アイデンティフェイス(IdentiFace)は、顔認識のコアと、性別、顔の形、感情など、最も重要な生体認証特性を結合した多モード顔バイオメトリックシステムである。
認識問題として、ferETデータベースから収集したデータを用いて、クラス内変動の高い5つのクラスに対して99.2%の精度で検定を行った。
また、有名人の顔形状データセットを用いて、顔形状問題において88.03%の精度を達成できた。
論文 参考訳(メタデータ) (2024-01-02T14:36:28Z) - Whole-body Detection, Recognition and Identification at Altitude and
Range [57.445372305202405]
多様なデータセットに基づいて評価したエンドツーエンドシステムを提案する。
我々のアプローチでは、一般的な画像データセットで検出器を事前トレーニングし、BRIARの複雑なビデオや画像でそれを微調整する。
屋内・屋外・航空シナリオにおける様々な範囲や角度の異なる条件下で徹底的な評価を行う。
論文 参考訳(メタデータ) (2023-11-09T20:20:23Z) - GaitFormer: Learning Gait Representations with Noisy Multi-Task Learning [4.831663144935878]
本稿では,217Kの匿名トラックレットを含む歩行分析システムのための最大データセットであるDenseGaitを提案する。
また、CASIA-Bで92.5%、FVGで85.33%の精度を実現するトランスフォーマーベースのモデルであるGaitFormerを提案する。
論文 参考訳(メタデータ) (2023-10-30T10:28:44Z) - One-Shot Learning for Periocular Recognition: Exploring the Effect of
Domain Adaptation and Data Bias on Deep Representations [59.17685450892182]
広範に使用されているCNNモデルにおける深部表現の挙動をワンショット近視認識のための極端データ不足下で検討する。
我々は、バイオメトリックデータセットで訓練されたネットワークを数百万の画像で活用し、最先端の結果を改善した。
SIFTのような従来のアルゴリズムは、限られたデータでCNNより優れている。
論文 参考訳(メタデータ) (2023-07-11T09:10:16Z) - Improving CNN-based Person Re-identification using score Normalization [2.462953128215087]
本稿では,CNNに基づく特徴抽出手法とXQDA(Cross-view Quadratic Discriminant Analysis)を組み合わせたPRe-IDを提案する。
提案手法は、VIPeR、GRID、CUHK01、VIPeR、PRID450Sの4つの挑戦的データセットで検証される。
論文 参考訳(メタデータ) (2023-07-01T18:12:27Z) - Human-Centric Multimodal Machine Learning: Recent Advances and Testbed
on AI-based Recruitment [66.91538273487379]
人間中心のアプローチでAIアプリケーションを開発する必要性には、ある程度のコンセンサスがある。
i)ユーティリティと社会的善、(ii)プライバシとデータ所有、(iii)透明性と説明責任、(iv)AIによる意思決定プロセスの公正性。
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
論文 参考訳(メタデータ) (2023-02-13T16:44:44Z) - Deep learning for identification and face, gender, expression
recognition under constraints [1.2647816797166165]
深層畳み込みニューラルネットワーク(Deep Convolutional Neural Network, CNN)は、ベール付き顔画像から特徴を抽出するために用いられる。
本研究の目的は, 深層学習に基づく自動計算機システムを用いて, 人物だけでなく, 性別, 年齢, 表情の認識や, 笑顔などの表情の認識を行う能力をテストすることである。
論文 参考訳(メタデータ) (2021-11-02T22:45:09Z) - Gender Stereotype Reinforcement: Measuring the Gender Bias Conveyed by
Ranking Algorithms [68.85295025020942]
本稿では,性別ステレオタイプをサポートする検索エンジンの傾向を定量化するジェンダーステレオタイプ強化(GSR)尺度を提案する。
GSRは、表現上の害を定量化できる情報検索のための、最初の特別に調整された尺度である。
論文 参考訳(メタデータ) (2020-09-02T20:45:04Z) - Bias in Multimodal AI: Testbed for Fair Automatic Recruitment [73.85525896663371]
異種情報ソースに基づく現在のマルチモーダルアルゴリズムは、データ中の機密要素や内部バイアスによってどのように影響を受けるかを検討する。
我々は、性別や人種の偏りを意識的に評価したマルチモーダルな合成プロファイルを用いて、自動求人アルゴリズムを訓練する。
我々の方法論と結果は、一般により公平なAIベースのツール、特により公平な自動採用システムを生成する方法を示している。
論文 参考訳(メタデータ) (2020-04-15T15:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。