論文の概要: Gendec: A Machine Learning-based Framework for Gender Detection from
Japanese Names
- arxiv url: http://arxiv.org/abs/2311.11001v1
- Date: Sat, 18 Nov 2023 07:46:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 12:53:19.614966
- Title: Gendec: A Machine Learning-based Framework for Gender Detection from
Japanese Names
- Title(参考訳): Gendec: 日本語名からのジェンダー検出のための機械学習ベースのフレームワーク
- Authors: Duong Tien Pham and Luan Thanh Nguyen
- Abstract要約: 本研究は,ロマジ,ヒラガナ,漢字の64,139名のフルネームと,その生物学的性別を併用した日本語名の性別検出のための新しいデータセットを提示する。
我々は,従来の機械学習技術や最先端の移動学習モデルなど,多様なアプローチを利用する日本語名から性別検出を行うフレームワークであるGendecを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Every human has their own name, a fundamental aspect of their identity and
cultural heritage. The name often conveys a wealth of information, including
details about an individual's background, ethnicity, and, especially, their
gender. By detecting gender through the analysis of names, researchers can
unlock valuable insights into linguistic patterns and cultural norms, which can
be applied to practical applications. Hence, this work presents a novel dataset
for Japanese name gender detection comprising 64,139 full names in romaji,
hiragana, and kanji forms, along with their biological genders. Moreover, we
propose Gendec, a framework for gender detection from Japanese names that
leverages diverse approaches, including traditional machine learning techniques
or cutting-edge transfer learning models, to predict the gender associated with
Japanese names accurately. Through a thorough investigation, the proposed
framework is expected to be effective and serve potential applications in
various domains.
- Abstract(参考訳): すべての人間は独自の名前を持ち、アイデンティティと文化遺産の基本的な側面を持っている。
この名前はしばしば、個人の背景、民族、特に性別に関する詳細を含む豊富な情報を伝える。
名前の分析を通じて性別を検出することで、研究者は言語パターンや文化規範に関する貴重な洞察を解放することができる。
そこで本研究では,ロマジ,ヒラガナ,漢字の64,139名のフルネームと,その生物学的性別とからなる,日本人の性別検出のための新しいデータセットを提示する。
また,従来の機械学習手法や最先端移動学習モデルなど,多様なアプローチを取り入れた日本語名からの性別検出フレームワークであるGendecを提案し,日本語名に関連する性別を正確に予測する。
徹底的な調査を通じて、提案フレームワークは有効であり、様々な分野の潜在的な応用に役立つことが期待されている。
関連論文リスト
- On the Influence of Gender and Race in Romantic Relationship Prediction from Large Language Models [21.178861746240507]
本研究では,大規模な言語モデルにおける人種間恋愛関係に対するヘテロノルミティブな偏見と偏見の存在について検討する。
モデルでは,(a)同性字対と(b)異性字対,および(b)アジア名を含む人種内・人種内文字対のロマンチックな関係をブラック,ヒスパニック,ホワイト名と比較すると予測しにくいことを示す。
論文 参考訳(メタデータ) (2024-10-05T01:41:55Z) - What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - For the Misgendered Chinese in Gender Bias Research: Multi-Task Learning with Knowledge Distillation for Pinyin Name-Gender Prediction [8.287754685560815]
我々は、Pinyinの名前と性別の推測問題を定式化し、知識蒸留によるマルチタスク学習ネットワークを設計する。
当社のオープンソース手法は,9.70%から20.08%の精度で商品名と性別の推測ツールを上回り,最先端のアルゴリズムを上回ります。
論文 参考訳(メタデータ) (2024-05-10T03:16:07Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - For the Underrepresented in Gender Bias Research: Chinese Name Gender
Prediction with Heterogeneous Graph Attention Network [1.13608321568471]
コンポーネント関係における不均一性を捉え,文字の発音を組み込むために,中国異種グラフ注意(CHGAT)モデルを設計する。
我々のモデルは現在のツールをはるかに上回り、最先端のアルゴリズムよりも優れています。
私たちは、よりバランスのとれた複数文字のデータセットを、公式のソースから、私たちのコードとともにオープンソース化しました。
論文 参考訳(メタデータ) (2023-02-01T13:08:50Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Quantifying Gender Bias Towards Politicians in Cross-Lingual Language
Models [104.41668491794974]
代名詞として政治家の名前を取り巻く言語モデルによって生成される形容詞と動詞の用法を定量化する。
死者や指定された言葉が男女の政治家と関連しているのに対し、美人や離婚といった特定の言葉が主に女性政治家に関係していることが判明した。
論文 参考訳(メタデータ) (2021-04-15T15:03:26Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - Gender Prediction Based on Vietnamese Names with Machine Learning
Techniques [2.7528170226206443]
ベトナム語名に基づくジェンダー予測のための新しいデータセットを提案する。
このデータセットは、性別で注釈付けされた26,000以上のフルネームで構成されている。
本稿では、6つの機械学習アルゴリズムと、ベトナム語の性別予測のための高速テキスト単語埋め込みを用いた深層学習モデル(LSTM)について述べる。
論文 参考訳(メタデータ) (2020-10-21T09:25:48Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。